Discussion catégorie:Article utilisant l'infobox Biographie2

Le contenu de la page n’est pas pris en charge dans d’autres langues.
Une page de Wikipédia, l'encyclopédie libre.
Autres discussions [liste]
  • Admissibilité
  • Neutralité
  • Droit d'auteur
  • Article de qualité
  • Bon article
  • Lumière sur
  • À faire
  • Archives
  • Commons
Date Avec l'Infobox Total Pourcentage
83 998 375 946 22,34 %
87 371 378 963 23,06 %
100 000 ? ?
112 069 491 224 22,81 %
124 089 496 346 25 %
150 000 514 760 29,14 %
155 384 518 033 30 %
190 826 545 210 35 %
200 000 553 340 36,14 %
230 303 586 793 39,25 %
300 000 644 700 46,53 %
Actuellement 342 143 713 333 47,96 %

Au moment du chargement de la page, 342 143 des 713 333 articles biographiques de Wikipédia en français utilisaient {{Infobox Biographie2}}, soit 47,96 % du total. Le , ce taux était de 22,34 % : sur les 375 946 biographies alors recensées, 83 998 comportaient cette Infobox. Thierry Caro (discuter) 1 décembre 2015 à 15:22 (CET)[répondre]

Le , ce taux était de 23,06 % : sur les 378 963 biographies alors recensées, 87 371 comportaient cette Infobox. Thierry Caro (discuter) 1 janvier 2016 à 12:15 (CET)[répondre]
Pour mémoire, le seuil des 100 000 articles est atteint le . Thierry Caro (discuter) 29 mars 2016 à 12:05 (CEST)[répondre]
Ce qui est vraiment dommage vu qu'un sondage en cours demandait l'arrêt provisoire ! Pas y'en aura toujours qui ne singulariseront et qui continueront à nous imposer des infobox incohérentes --Lomita (discuter) 29 mars 2016 à 12:46 (CEST)[répondre]
Le , la catégorie regroupe 112 069 pages, contre 491 224 dans Catégorie:Wikipédia:Article biographique. Soit 22,81 % des biographies recensées. Thierry Caro (discuter) 1 janvier 2017 à 15:12 (CET)[répondre]
Le , le taux de biographies portant l'Infobox atteint 25%, principalement, mais pas seulement bien sûr, grâce au travail de Simon Villeneuve (d · c · b). Il y a, au moment où je publie ceci, 124 089 des 496 346 articles qui ont l'Infobox en Lua appelant Wikidata. Thierry Caro (discuter) 27 février 2017 à 22:29 (CET)[répondre]

Divergences entre Wikidata et Wikipédia en français[modifier le code]

Le modèle met parfois en évidence des divergences entre Wikipédia en français et Wikidata. Cela a été souligné dans certaines discussions (voir ici et ).
Selon la personne qui s'exprime, ces divergences sont perçues plus ou moins positivement ou négativement. Selon moi, ces divergences sont un aspect positif. Elles permettent de prendre conscience que les différentes versions linguistiques de Wikipédia (la plupart des entrées de Wikidata proviennent des Wikipédia) divergent sur, notamment, les dates de naissance ou de mort de certaines personnalités. Àmha, cela débouche, au bout du compte, sur une plus grande fiabilité de notre projet.
Maintenant, tous les contributeurs ne partagent pas ce PoV. Pour faciliter le travail de ceux qui ne supportent pas ces divergences, j'expose ici une certaine démarche permettant de recenser et harmoniser ces dernières. Les points sont par ordre croissant de difficulté et d'intolérance aux divergences. Perso, je peux effectuer la tâche 1 pour quelques lettres et effectuer la tâche 2 pour les articles recensés en 1.
1- Recenser les articles dont le contenu et l'infobox présentent des divergences (voir la section #Divergences entre le RI et l'infobox suite à la pose de celle-ci).
2- Lorsque l'infobox et l'article présentent des données différentes (une date ou un lieu de naissance ou de mort différents), à défaut d'être capable de les départager, il faut ajouter l'information de l'article de fr à Wikidata, préférablement en ajoutant la référence « importé de Wikipédia en français » (exemple date, exemple lieu de naissance).

Capture d'écran des carreaux permettant de donner un « rang » à une valeur sur Wikidata. Le carreau du haut donne un rang privilégié, celui du bas un rang obsolète.

3- Si vous êtes capables de départager la « bonne » donnée de la « mauvaise », il faut surclasser en « privilégié » la bonne valeur (voir image ci-contre). NE SUPPRIMEZ PAS SUR WIKIDATA LA VALEUR QUE VOUS JUGEZ FAUSSE.
Voici des liens vers les pages présentant des valeurs multiples. Si vous en avez le temps, il serait intéressant que vous notiez quel projet était en faute :

Plus d'une date de naissance (1 751 éléments le 19 mars 2016)
Plus d'une date de mort (1 506 éléments le 19 mars 2016)
Plus d'un lieu de naissance (287 éléments le 19 mars 2016)
Plus d'un lieu de mort (119 éléments le 19 mars 2016)

4- L'infobox possède plus de 70 champs. La plupart de ces derniers sont incomplets pour l'ensemble des personnalités. Parfois, certaines informations sont présentes dans l'article mais pas dans l'infobox, et vice-versa. Vous pouvez ajouter des informations de l'article vers Wikidata ou de Wikidata vers l'article.
Voilà. Si vous avez d'autres idées sur la structuration de ce travail, n'hésitez pas ! - Simon Villeneuve 19 mars 2016 à 19:13 (CET)[répondre]

Pourquoi ne pas supprimer une date manifestement fausse ? Pour ma part, quand je décèle une incohérence, je cherche à comprendre son origine, je cherche des sources, je trouve une date sourcée et je supprime les trucs faux sans sources. Je n'arrive pas à saisir l'intérêt de garder un truc manifestement faux. Ludo 19 mars 2016 à 23:56 (CET)[répondre]
Typiquement, dans ta requête avec les entrées Wikidata indiquant deux lieux de naissance pour la même entité. Au second essai, je tombe sur Niklaus Riggenbach. Deux lieux de naissances, oui et non. L'un est inclus dans l'autre. Wikidata propose deux lieux de naissances Guebwiller et Alsace. Guebwiller est une commune française d'Alsace (département du Haut-Rhin]]. Il n'y a pas lieu de hiérarchiser une info plus probable que l'autre. On supprime Alsace. Et c'est tout. Ludo 20 mars 2016 à 00:07 (CET)[répondre]

Divergences entre le RI et l'infobox suite à la pose de celle-ci[modifier le code]

(copié-collé de User:Lomita/Wikidata#Incohérence entre le RI et l'infobox suite à la pose de celle-ci)



Deuxième série de 1000 articles pour confirmer le pourcentage de 10 % d'infobox à problème

Bon j'arrête là pour ce soir - Je reprendrai plus tard

Toutes les divergences des articles ci-haut ont été intégrées à Wikidata. - Simon Villeneuve 19 mars 2016 à 21:14 (CET)[répondre]

Nouvelle série le 21 mars 2016

Divergences intégrées de Cataldo Agostinelli jusqu'à Conrad Aiken. 15 articles présentant des divergences. - Simon Villeneuve 21 mars 2016 à 11:40 (CET)[répondre]

Remarques[modifier le code]

Sur les divergences
  • Plusieurs divergences proviennent de Wikipédia en russe. Certaines d'entre-elles (mais pas toutes) s'expliquent par l'utilisation du calendrier julien sur ce projet. Cette spécificité ne semble pas avoir toujours été tenue en compte lors de l'intégration des données sur Wikidata. De plus, l'infobox Biographie2 ne précise pas si la date est julienne ou grégorienne. J'ai demandé à Zolo s'il était possible de corriger cela, mais ce dernier n'a pas le temps/ne juge pas cela nécessaire.
  • Certaines divergences proviennent de l'inversion, par les anglophones, du jour et du mois dans la notation raccourcie. C'est peut-être ce qui explique les divergences sur Jangy Addy, toutes deux sourcées, ou sur Mohammed Ahmed. Ainsi, par exemple, le 3 février 1985 se note, en anglais, 2/3/1985, ce qui peut être confondu avec le 2 mars. - Simon Villeneuve 19 mars 2016 à 22:00 (CET)[répondre]
  • Parfois, les dates de décès ne sont séparées que d'une journée (ou un peu plus). J'imagine que cela a rapport avec une confusion entre la date de décès et la date d'annonce de décès. En ce qui concerne les dates de naissance, parfois, cela a rapport avec une confusion entre la date de naissance et la date du baptême. - Simon Villeneuve 21 mars 2016 à 03:10 (CET) mise à jour : 30 août 2016 à 12:20 (CEST)[répondre]
  • Comme souligné par Ludo ci-bas, les multiples lieux de mort sont souvent « complémentaires » (l'un est inclus dans l'autre). - Simon Villeneuve 21 mars 2016 à 14:35 (CET)[répondre]
Plus généralement, je me rends compte rétrospectivement que c'était une sorte d'hérésie de laisser les différentes versions de Wikipédia tourner chacune dans son coin sans autre interaction que l'établissement de liens entre les pages. Il faut maintenant reprendre article par article douze années de divergence insouciante. Thierry Caro (discuter) 19 mars 2016 à 22:10 (CET)[répondre]
Sur la manière de les traiter

Le traitement idéal des divergences est de trouver une ou plusieurs sources fiables pour une valeur et de dévaloriser les autres, voire de carrément les supprimer de Wikidata et des Wikipédia qui les utilisent afin d'éviter qu'un utilisateur imprudent ou un bot ne les remettent en place. Cependant, cela demande du temps et il est difficilement imaginable que cette approche permettra de traiter les quelque 10 % d'articles présentant des divergences dans un laps de temps raisonnable, surtout si l'on ne se limite pas aux seuls articles biographiques de l'infâme infobox Biographie2.
Voici quelques réflexions sur la manière de traiter les divergences :
1- Recenser l'ensemble des divergences avant de les traiter : Apposer une infobox transcluant Wikidata sur l'ensemble des articles biographiques qui n'en ont pas et y recenser les divergences, puis lancer un genre de wikiconcours pour régler ces dernières. Je crois qu'il faut recenser les divergences sur une majorité d'articles avant de les traiter, sinon c'est une tâche à recommencer constamment. D'après le « climat » actuel, je ne pense pas que cette idée sera retenue, mais je la soumet malgré tout.
2- Demander l'aide des lecteurs : Intégrer un genre de bandeau à l'infobox, à la fin de cette dernière, au même endroit que les onglets « modifier », « modifier le code », « modifier Wikidata », avec un message du genre « Cette infobox utilise des données de Wikidata qui peuvent diverger des données de l'article. Si vous jugez que cette infobox présente des divergences, cliquez ici. ». Le lien « ici » pourrait catégoriser automatiquement l'article dans une catégorie de maintenance, avec un message précisant quelle est cette dernière. L'ajout d'un champ, du genre validée=oui, pourrait permettre de retirer ce bandeau de l'infobox.
3- Faire tourner un bot sur Wikidata : Faire un appel sur Wikidata pour qu'un bot parcourt l'ensemble des articles de la catégorie et y intègre les divergences, en soulignant que ces dernières proviennent de Wikipédia en français. Cela permettrait de régler les dates contradictoires (elles seraient toutes ajoutées automatiquement à l'infobox) et remplirait automatiquement les liens données dans la tâche 3 ci-haut. - Simon Villeneuve 21 mars 2016 à 14:35 (CET)[répondre]

« Le traitement idéal des divergences est de trouver une ou plusieurs sources fiables pour une valeur et de dévaloriser les autres, voire de carrément les supprimer de Wikidata et des Wikipédia qui les utilisent afin d'éviter qu'un utilisateur imprudent ou un bot ne les remettent en place. Cependant, cela demande du temps et il est difficilement imaginable que cette approche permettra de traiter les quelque 10 % d'articles présentant des divergences dans un laps de temps raisonnable » Tu as raison de A à Z, il n'y a pas un mot à retirer. Plusieurs contributeurs corrigent déjà ces 10% et on râle après toi pour te demander de ralentir le rythme ou d'apporter toi même les corrections quand tu poses l'infobox. Parce qu'on a pas le temps de tout corriger. Tu vas trop vite. Ludo 21 mars 2016 à 14:39 (CET)[répondre]
Il y a deux pistes très intéressantes, dont une rejoint un peu la proposition 3, à creuser peut être :
  • Wikipédia:Bot/Requêtes/2016/03#Infobox incohérentes par Notification Sisyph :
  • l'idée de Notification NicoV : mise en place d'un bandeau (article ou page de discussion) et suppression de l'infobox, ce qui permettrait d'avoir une catégorisation d'articles avec problème sur l'infobox, sans laisser les incohérences sur l'article - Ensuite, cette catégorie pourrait faire partie du projet maintenance
Cela ne réglerait pas la totalité des infobox, mais je pense que cela pourrait en régler pas mal.
-- Lomita (discuter) 21 mars 2016 à 16:14 (CET)[répondre]

Exemples[modifier le code]

Hans Albert Einstein

Au moment où j'écris, l'article Hans Albert Einstein a l'infobox Biographie2 et il y a plusieurs choses à corriger :

  • l'article présente comme unique lieu de naissance Berne alors que l'infobox arrive avec les villes de Berne et de Zurich. Zurich a été mis sur Wikidata au milieu d'un flot d'autres informations. Ca ne présente aucune source. Le dictionnaire historique de la Suisse (ce sont des historiens, c'est mandaté par la Confédération, bref c'est très sérieux comme source) donne Berne. Je n'ai pas trouvé de sources indiquant une naissance à Zurich. Pas de source pour étayer Zurich, on supprime,
  • nationalité : outre une catégorie en bas d'article, l'article ne présente aucune nationalité. Wikidata en présente deux (CH et US). La même source que précédemment ne donne que la nationalité américaine. La nationalité suisse a aussi été rajoutée a la va-vite sur Wikidata, sans aucune source. (La Suisse fait partie de ses nombreux pays ne pratiquant pas le droit du sol, on peut y être né et y vivre depuis 30 ans sans pour autant en avoir la nationalité, se référer au seuil lieu de naissance est donc une erreur). Donc pas de source pour la nationalité suisse, on supprime aussi.

Je ne vois aucune raison sérieuse de garder sur Wikidata des données dont il est complètement légitime d'en remettre en cause la véracité. Il faut accepter le fait que des choses ont été faites vites (parfois trop) sur Wikidata et qu'il y a des erreurs. Les erreurs on les supprime, on ne les garde pas. Ludo 20 mars 2016 à 00:43 (CET)[répondre]

J'ai restauré la nationalité, ta suppression part sur une hypothèse assez improbable et wp:en date ses différentes nationalités a l'année près... --Nouill 20 mars 2016 à 04:42 (CET)[répondre]
J'ai reverté. 1/ Pas de sources 2/ Ton ajout pars d'une « hypothèse assez improbable » d'un octroi de nationalité suisse par le fait d'y être né. Ludo 20 mars 2016 à 08:29 (CET)[répondre]
Notification Nouill :, Notification Simon Villeneuve :. Sauf erreur de ma part, sur WD comme sur WP, sourcer par WP c'est comme ne pas sourcer du tout. Vu l'influence que vont prendre les infos de WD, il est indispensable de donner de vraies sources, surtout en cas de litige. Sur la nationalité de fils d'Albert, une discussion intéressante sur WPen montre qu'ils s'appuient sur WPde pour la nationalité suisse (non sourcée) et sur http://www.hls-dhs-dss.ch/textes/f/F31334.php pour la nationalité américaine, tout en reconnaissant que les bios , en général, n'évoquent pas sa nationalité. Je suggère que ces points soient évoquées en page de discussion de l'article.HB (discuter) 20 mars 2016 à 09:18 (CET)[répondre]
Mieux vaut dire que l'information provient d'une Wikipédia donnée que de ne rien dire du tout. Ça permet de tracer la provenance de l'information. Mon approche, sur WP comme sur WD, est « rien du tout < donnée non sourcée < donnée sourcée par une Wikipédia < donnée sourcée par une autre source < donnée multisourcée ». - Simon Villeneuve 20 mars 2016 à 12:40 (CET)[répondre]
Ce commentaire est une approche générale. Je n'ai pas analysé le cas particulier souligné. - Simon Villeneuve 21 mars 2016 à 01:33 (CET)[répondre]
(conflit d'edit) Donc 1°) Si on en a un doute sur le fait qu'une donnée serait potentiellement fausse, mais reprise par quelques sources, même tertiaire ou de mauvaise qualité, sur wikidata, on ne supprime pas les trucs, mais on utilise les rangs ! (Et vous le savez) 2°) Il y a des sources qui reprennent wikipedia, il y a d'autres plus nombreuses comme worldcat qui affirme qu'il est suisse-américain. 3°) S'appuyez sur un texte de 10 demi-ligne en sous entendant que cette source est la meilleur source possible en terme de complétude sur le sujet est un peu nawak. 4°) Affirmer qu'une personne née en Suisse d'un père suisse au moment de sa naissance (et qui aurait aussi un enfant suisse, avec une mère allemande), est une "hypothèse assez improbable" est vraiment vraiment n'importe quoi. 5°) Donc cela fait deux fois en très peu de temps que je dois reprendre tes corrections mais non seulement je dois te reprendre mais surtout je dois supporter les remarques excessivement désagréable, voir les reverts. Donc moi je vais arrêter de repasser derrière toi et je vais donc maintenant considérer que tes corrections sont de mauvaises qualité. --Nouill 20 mars 2016 à 13:04 (CET)[répondre]
« (Et vous le savez) » Non.
Je sais que quand une donnée est litigieuse, non triviale et qu'elle ne présente pas de source, on supprime.
Pour ma part, je vais donc maintenant considérer tes contributions comme du vandalisme. Ludo 20 mars 2016 à 21:02 (CET)[répondre]
Béatrice de Camondo

Autre exemple : Béatrice de Camondo De part Wikidata, on a deux lieux de décès dans l'infobox. Et un troisième dans l'article. Ici ce n'est pas une question de sources ou de différences de point de vue. Les trois lieux annoncés sont (enfin, étaient parce que je vais corriger) :

Les trois disent la même chose, sauf que c'est très mal géré dans Wikidata. Auschwitz est un camp d'extermination nazi situé près de Oświęcim (qui s'écrit Auschwitz en allemand). Il n'est donc pas question de différence de point de vues selon les Wikipédia, c'est juste des informations à mettre en forme sur Wikidata. Mais pour cela, il faut relire quand on pose des infoboxs. Ludo 20 mars 2016 à 01:09 (CET)[répondre]

Alcide Beauregard

L'infobox présente deux lieux de décès en disant Fort de Côte-Lorette ou Saint-Genis-Laval. Là encore, pas une question de différence de point de vue. Le Fort de Côte-Lorette est situé sur la commune de Saint-Genis-Laval. Donc le ou de l'infobox est faux. Alcide Beauregard est mort dans ce fort pdt la guerre. On supprime la commune, le RI de l'article explique déjà que le fort est dans la commune. Ludo 20 mars 2016 à 01:18 (CET)[répondre]

Bref, il y a un gros besoin de relectures et de corrections. Ludo 20 mars 2016 à 01:18 (CET)[répondre]

Je vous en rajoute quelques-un, je corrigerai demain :

Voilà, j'ai même pas regardé la totalité des 119 articles de la requête sur les doubles lieux de décès que j'arrive à plus de 10% d'erreurs (les fameux 10% de Notification Olivier Tanguy :). Ces erreurs ne sont pas des différences de points de vues. Il s'agit essentiellement d'inclusion (décédé à A ou B alors que A inclut B). S'il y avait eu relecture lors de la pose, il n'y aurait surement pas eu autant d'erreurs.

Laissez moi cette requête sur les doubles lieux de décès, je vais corriger tout. Mais, s'il vous plait arrêtez... Ludo 20 mars 2016 à 01:42 (CET)[répondre]

Notification Ludo29 : le problème quand tu supprimes une donnée moins précise plutôt que d'utiliser les rangs privilégiés ou obsolètes, c'est qu'en cas d'ajout ultérieur plus ou moins automatisé (par exemple à partir d'une catégorie ou d'une infobox de telle ou telle wikipédia), tu risques de voir réapparaître la donnée que tu avais effacé. alors que si tu mets la donnée la plus précise/certaine comme privilégiée, la donnée alternative ne risque pas d'être réimportée, et ton infobox sera donc plus stable. — H4stings d 20 mars 2016 à 12:03 (CET)[répondre]
Notification H4stings :. Je ne sais pas faire. Tu as un exemple pour que je vois ? Ludo 20 mars 2016 à 20:56 (CET)[répondre]
C'est tout bon, j'ai trouvé. Ludo 20 mars 2016 à 21:35 (CET)[répondre]
Bonjour Notification Ludo29, Nouill, Simon Villeneuve, HB et H4stings :
Cette discussion ayant elle-même fait l’objet d'une discussion sur le bistro de Wikidata je me permets d'apporter une précision sur l'utilisation des rangs sur Wikidata.
Déjà, en règle générale, il ne faut laisser le rang normal (c'est évident mais je préfère le rappeler) et n'utiliser le rang privilégié et obsolète avec parcimonie.
Ensuite, non, si une information est visiblement fausse *et* non sourcée, le mieux est simplement de supprimer l’information et non de la mettre en rang obsolète (si on partait par là, on pourrait mettre une infinité de valeurs au rang obsolète).
Quand on a deux (ou plus) informations sourcées *et* partiellement redondantes *et* toutes les deux vraies, il ne faut surtout pas utiliser le rang obsolète sur la valeur la plus générale (l'information n'est pas obsolète ; Lille-normal et Nord-obsolète sur Wikidata cela voudrait signifier que Lille ne se trouve pas dans le Nord) mais à l’inverse utiliser le rang privilégié pour la valeur la plus précise.
Pour paraphraser Ludo dans son premier message : « Les erreurs on les supprime, on ne les garde pas. » et j'ajouterais « seulement quand une erreur est dûment sourcée, elle peut être ajouter dans Wikimédia avec le rang obsolète » et j'insisterais lourdement sur le « dûment » (dans l'idéal il faut une source qui indique explicitement que cette information est obsolète et pas juste le déduire de la contradiction des sources).
Si ce n’est pas clair, il ne faut pas hésiter à demander des explications.
Cdlt, Vigneron * discut. 22 mars 2016 à 17:38 (CET)[répondre]
Mais le problème c'est que c'est pas une erreur. --Nouill 22 mars 2016 à 18:59 (CET)[répondre]
Notification Nouill : mon message était à visée générale. De quel erreur (ou non) en particulier parles-tu et quelles sont tes sources ? (j'imagine que tu as des sources car sans source, comment savoir si une information est erronée ou non ?) Cdlt, Vigneron * discut. 23 mars 2016 à 08:48 (CET)[répondre]
Voir plus haut. Il faudrait quand même comprendre qu'une info non sourcé n'est pas forcément sauf (sachant la majorité ou au moins une grosse partie des info sur wp:fr ne sont toujours pas sourcé, grosso modo, je le rappelle) --Nouill 23 mars 2016 à 17:35 (CET)[répondre]
Ah mais complètement. Que la France soit baignée par l'Océan Atlantique n'est probablement pas sourcée, alors que l'information est exacte. Elle n'est pas sourcée parce que c'est trivial. Ludo 23 mars 2016 à 17:54 (CET)[répondre]

Articles avec des Infobox vides[modifier le code]

On les trouvera ici régulièrement. Thierry Caro (discuter) 22 mars 2016 à 00:11 (CET)[répondre]

Lien mis-à-jour : petscan:16317773. - Simon Villeneuve 27 mai 2020 à 05:40 (CEST)[répondre]