User:Simon Villeneuve/PoV

D̄

“

Va vite et casse des choses. Si tu ne casses rien, c'est que tu ne vas pas assez vite^{[trad 1]}.

”

— Ghuron, citant probablement Mark Zuckerberg (Q36215)

septembre 2018 - Le vendredi 7 septembre 2018, je franchis la barre des 500 000 contributions sur Wikidata. Nous sommes 77 contributeurs dans cette situation. Je profite de l'occasion pour faire un bilan :

Débuts : Je commence à contribuer à Wikidata en février 2013. Jusqu'en juin 2015, j'y contribue peu, y faisant environ 3 000 contributions qui concernent surtout des modifications de libellés, alias, descriptions et liens interwikis des éléments.
En mai 2015, j'adapte fr:Modèle:Wikidata list (WL) pour frwiki.
Infobox : À partir de fin juin 2015, c'est l'histoire des infobox Wikidata qui commence pour moi (voir fr:Utilisateur:Simon Villeneuve/PoV#LuaBot). Je fais quelques milliers d'interventions manuelles par mois jusqu'en mars 2016. D'abord presque exclusivement sur des éléments dédiés à des êtres humains (human (Q5)) ou liés à des êtres humains, notamment à la traduction de plusieurs labels d'éléments affichés dans des articles de la fr:catégorie:Page utilisant des données de Wikidata à traduire, puis un peu sur des éléments liés à des mines à partir de septembre lorsqu'on m'a demandé de retoucher des aspects de fr:Modèle:Infobox Mine. Le sujet semble me passionner car je crée plusieurs listes de mines avec WL. D'ailleurs, avant que je la subdivise, la fr:listes de mines devient momentanément en novembre le plus gros article de frwiki, frôlant le million d'octets.
Novembre est mon plus « gros » mois contributif de l'année. J'ajoute, notamment, plusieurs labels en français concernant des objets astronomiques. J'ai l'impression que j'ai utilisé un outil automatique ou semi-automatique pour ce faire, mais rien dans l'historique de mes contributions ne l'indique.
En janvier 2016, je continue à traiter des sujets géologiques et fais des contributions sur des éléments liés aux séismes. On dirait que j'utilise à l'époque un ancêtre de Wikidata Query, Wikidata Query Service, dont le difficile apprentissage de la syntaxe ne servira pas longtemps puisque celle-ci sera remplacée par le SPARQL (Q54871). En février, je fais quelque contributions à l'aide de Kasparbot, mais ça ne semble pas concluant (j'en garde aucun souvenir). J'ajoute également des légendes d'images wikifiées avant de comprendre que ce n'est pas adéquat sur Wikidata. Enfin, à la fin du mois, je crée fr:Modèle:Infobox Localité dans la foulée du MOI d'un contributeur.

Break : Au printemps, je frappe des murs sur frwiki (retrait de WL de l'espace encyclopédique, pressions constantes en RA / BA concernant fr:Modèle:Infobox Biographie2) et je prends des vacances, d'abord de force.

À la fin de l'été, le bannissement de Meodudlye me convainc de reprendre le collier. Je fais des expérimentations dans un cours et crée fr:Modèle:Infobox Volcan2, rapidement éteint par un contributeur du projet:Montagne.

Automatisation : En décembre, après la fin des cours, je (re?)découvre QuickStatements (QS). Je commence donc l'automatisation de mon parcours contributif wikidatien et je ne ferai jamais en-dessous de 3 000 contributions par mois par la suite.
J'utilise d'abord QS pour ajouter des populations sur des éléments liés à des localités du Mexique, puis, en janvier 2017, je fais quelques autres expérimentations, notamment sur des fonctions politiques, puis sur des occupations de sportifs et joueurs d'échecs.

Au milieu du mois, après y avoir pensé quelque mois à la suite d'une suggestion de Cantons-de-l'Est (encore lui !), j'arrive à trouver une méthode pour ajouter le label en plusieurs langues pour les quelque 2 000 satellites russo-soviétiques Cosmos. J'ajoute par la suite le pays de nationalité de plusieurs personnalités canadiennes, puis, en fouillant les contributions de Fralambert, je (re?)découvre mix'n'match.

Avec enthousiasme, je crée environ 1 400 éléments sur des joueuses d'échecs et complète ces derniers, ainsi que certains concernant des joueurs masculins, avec QS. J'ai momentanément peur six mois plus tard quand on met en doute l'admissibilité des joueuses, mais le tri a bien été fait sur mix'n'match et je suis à ce moment plus habile avec les outils automatiques. Je peux donc compléter adéquatement les créations.
Je fais 63 000 contributions en janvier. Ce sera mon plus gros mois avant que, un an et demi plus tard, en fouillant les contributions de Thierry Caro, je (re)découvre Harvest Templates (HT).

L'ami Fralambert et moi prenons un mastodon au cours de l'année et il me montre comment contribuer à l'aide de PetScan:. Une toute nouvelle dimension s'ouvre à moi pour cet outil^{[note 1]}.

5 Wikipédien-ne-s à Alma
À la fin de l'automne, à la suite de la visite de la caravane wiki dans ma région, je me lance éperdu dans l'association d'éléments avec des entrées web d'encyclopédies classiques avec mix'n'match (voir fr:Utilisateur:Simon Villeneuve/PoV#Quantifier les centrismes de Britannica et Universalis). J'arrive désormais vers la fin de mes capacités à ce niveau, après avoir associé à 93 % Universalis et 20 % Britannica. Je suis passé à l'encyclopédie Canadienne (voir fr:Utilisateur:Simon Villeneuve/PoV#Quantifier les centrismes de l'EC et du DBC).
Vitesse supérieure : J'ai fait plus de la moitié de mes contributions sur Wikidata au cours du dernier mois. Le harvest porte bien son nom. Il s'agit de bien identifier la propriété concernée, le champ d'infobox qui y correspond et bingo. Ne reste qu'à faire rouler l'ordi toute la nuit. J'ai ajouté ainsi des séquences d'albums musicaux et labels discographiques associés, des scénaristes et réalisateurs de films, des dates de découvertes par découvreur, des ...

En route vers M : Au rythme actuel, je devrais atteindre le million de modifications d'ici la fin de l'année avec HT. Par la suite, qu'arrivera-t-il ? Je ne sais pas. J'aimerais mieux lier les différents projets wiki entre-eux (je crois que c'est pour ça que j'aime autant contribuer à Wikidata) et je regrette, notamment, de ne pas connaître le Python (Q28865). Cela aurait pu me permettre d'explorer Pywikibot. Mais bon, peut-être dans une autre vie.
Ma philosophie contributive wikidatienne est toujours guidée par fr:WP:NHP. Bien que cette attitude ne semble plus vraiment possible sur frwiki, pour l'instant, elle l'est encore sur Wikidata. D'ailleurs, la citation des RAW 200 disant que
Wikipédia est un labyrinthe sans murs
cristallise l'idée qu'il faut faire son chemin, son parcours contributif pour mieux y voir. C'est en marchant le chemin qu'on arrive à comprendre de mieux en mieux les choses et que les influences sur sa manière de contribuer se font sentir. De plus, puisque le site est aisément modifiable, il est facile de corriger le tir si l'initiative est malheureuse.
Cette citation me fait également penser à la Prime Directive (Q891149), qui dit de ne pas partager des connaissances avec quelqu'un qui n'est pas prêt à les gérer, autrement il pourrait se retrouver dans une position d'apprenti sorcier. Cela me fait réfléchir sur le contenu du manuel Savoir libre en éducation.

Vivement une image sous licence libre de la vraie, évidemment sous 🄯.

I

octobre 2018 - Je franchis le cap du million de contributions le mardi 9 octobre 2018. D'après le message de félicitation automatique que j'ai reçu, ma millionième contribution a été faite sur Gay Life (Q5528603) (!).
Nous sommes actuellement 49 millionnaires humains^{[note 2]} sur Wikidata. Quoi de neuf un mois plus tard ?

Cette image est très utilisée dans en:template:Infobox cricketer. À la suite d'une erreur de manipulation, je l'ai importée sur plusieurs dizaines d'éléments. Ça a fait en sorte que j'ai été bloqué quelques heures sur Wikidata.

Comme prévu, c'est l'utilisation de HT qui m'a permis de faire 90 % des 500 000 nouvelles contributions. J'ai ainsi écrémé plusieurs modèles d'infobox de enwiki, à commencer par les infobox biographiques. J'ai été notamment surpris par le nombre d'images non-importées sur Wikidata (image (P18)). J'aurais cru que d'autres utilisateurs auraient importé depuis longtemps ces dernières sur la base de données libre.
Bien que je ne pense pas que cela soit un facteur déterminant, il faut cependant souligner que certaines images des infobox sont indésirables. Ainsi, par exemple, les images soulignant l'absence d'image et invitant les internautes à téléverser une image sous licence libre (voir ci-contre). Cependant, j'ai appris qu'il est possible de restreindre les valeurs importées automatiquement pour certaines propriétés. J'ai ainsi pu faire plusieurs ajustements afin d'éviter la plupart des mauvaises importations automatiques pour P18. Cependant, cet apprentissage ne s'est pas fait sans heurts et j'ai perdu ma virginité de blocage sur Wikidata à la suite d'une erreur de manip et d'une absence de réponse trop longue de ma part sur ma page de discussion utilisateur.

L'importation sur Wikidata de cette carte de localisation a directement mené à son importation sur l'article fr:Vașcău.
Sinon, dans les autres types de données importées, notons l'ajout de plusieurs cartes de localisation (locator map image (P242)), de superficies (area (P2046)), d'images du blason (coat of arms image (P94)) ou de drapeaux (flag image (P41)). J'ai créé des tableaux de statistiques sur plusieurs pages de discussion des catégories de frwiki recensant les pages utilisant des données de Wikidata. Je m'y suis malheureusement pris trop tard pour P18, mais je me suis repris pour, notamment, P242. J'ai ainsi pu constater que l'importation de plusieurs dizaines de milliers d'images de localisation sur Wikidata a résulté en l'ajout d'environ 1 500 images de cartes de localisation sur des articles de frwiki utilisant l'infobox Localité.

Je suis particulièrement fier de l'ajout d'une dizaine de millier de types d'établissements humains (instance of (P31)) qui me demandaient de revérifier la validité de l'élément parmi une liste de plusieurs dizaines d'éléments types.
Numéros d'éléments liés à des types communs de localités.
En entrapercevant la feuille du coin de l’œil, une collègue s'est demandée si je n'étais pas en train de péter les plombs à la John Nash.

Notons le peu d'ajouts de dates de décès (date of death (P570)) en raison de l'utilisation de modèles imbriqués dans les infobox sur ces dernières afin, notamment, d'afficher l'âge au décès. D'autres difficultés ont également émergées, comme par exemple l'ajout de date de fondation (inception (P571)) de localités. Cela s'explique par la nature même de la propriété (une localité peut changer à plusieurs reprises de classification au cours de son histoire).
Dans le 10 % restant, notons que j'ai finalement réussi, un an après avoir posé la question sur le Bistro de Wikidata, à importer automatiquement la langue des sites officiels^{[note 3]} de dix à vingt mille éléments à l'aide de QS2^{[note 4]}. Pour ce faire, j'ai d'abord recensé et ajouté le qualificatif aux localités des États-Unis. Par la suite, j'ai fait la même chose avec les éléments qui n'ont que l'anglais pour language of work or name (P407). Pour ce faire, j'ai bénéficié de l'aide d'autres Wikidatistes^{[note 5]} pour finir par forger la requête suivante :
```
SELECT ?item ?itemLabel
WHERE
{
{
  SELECT ?item (COUNT(DISTINCT ?lang) AS ?count) WHERE
{ 
  ?item wdt:P407 wd:Q1860 .
  ?item wdt:P407 ?lang .
  ?item p:P856 ?statement .
  ?statement ps:P856 ?url .
  MINUS {?statement pq:P407 wd:Q1860 . }
}
  GROUP BY ?item
}
FILTER ( ?count = 1 )
SERVICE wikibase:label { bd:serviceParam wikibase:language "en" . }
}
ORDER BY DESC(?count) ?itemL
```
Try it!
Ma maîtrise du SPARQL continue de progresser, mais, bien honnêtement, elle demeure rudimentaire.

Voilà. Quelle est l'étape suivante ? Je crois que je vais me contenter de terminer mes imports actuels et prendre une petite pause pour digérer le tout. Le travail et la vraie vie sont prenants ces temps-ci et je ne peux malheureusement pas me permettre de continuer mes explorations wikidatiennes pour le moment.

MM

“

Le premier million est le plus difficile.

”

décembre 2018 - Je franchis le cap du 2 millions de contributions le 24 décembre 2018. Cette fois, pas de message de félicitation automatique. Ma deux millionième contribution est un ajout de label « cours d'eau aux États-Unis » sur l'un des nombreux cours d'eau aux États-Unis n'ayant pas de label en français.
Nous sommes actuellement 19 utilisateurs non-bot bi-millionnaires. Quoi de neuf depuis le cap du million ?

octobre 2018 J'ajoute encore environ 150 000 contributions à l'aide de HT. Je délaisse par la suite cet outil pour revenir au trio query - PS - QS.
Je déniche tout d'abord tous les éléments ayant un URL officiel et comme pays les États-Unis. Je leur ajoute comme qualificatif English (Q1860) avec language of work or name (P407). Cela touche environ 100 000 éléments. Je fais quelques requêtes supplémentaires pour ajouter des P407 sur quelques milliers d'autres URL.

connecteurs logiques Par la suite, en novembre, je m'intéresse aux logical connective (Q211790) entre les propriétés pour repérer des éléments qui possèdent des semantic triple (Q3539534) qui ne vont pas que dans un seul sens. Ce faisant, je me rappelle que vers 2015, j'avais voulu insérer des noms de compagnies sur des éléments d'êtres humains à l'aide de la propriété founded by (P112) et qu'on m'avait rapidement signalé que cette propriété n'allait que dans un sens (compagnie $\rightarrow$ $\rightarrow$ P112 $\rightarrow$ $\rightarrow$ fondateur). J'ai mis un certain temps à comprendre/accepter le sens unique des triplets^{[note 6]}.
Donc, première chose, je constate que puisque la propriété sibling (P3373) est égalitaire ( $\leftrightarrow$ $\leftrightarrow$ ), c'est-à-dire que élément1 $\rightarrow$ P3373 $\rightarrow$ élément2 $\Rightarrow$ élément2 $\rightarrow$ P3373 $\rightarrow$ élément1, on peut ajouter automatiquement l'élément1 en P3373 de tous les éléments2 qui n'ont pas de valeur pour P3373.
J'ai été étonné de la simplicité de la requête SPARQL permettant de dénicher ces éléments :
```
SELECT DISTINCT ?fratrie ?item WHERE
{
  ?item wdt:P3373 ?fratrie
  MINUS {?fratrie wdt:P3373 ?pasfratrie}
}
```
Try it!
Cela m'a donné environ 4 500 résultats.
Il a été facile d'adapter la chose pour les relations profs/élèves (il manquait 2 directeurs de thèse, 10 000 étudiants de thèse^{[note 7]}, 8 700 élèves et 4 900 élèves de) ainsi que les relations entre père/mère et enfants (~1 000 résultats), enfant $\rightarrow$ $\rightarrow$ mère (~1 600 résultats) et enfant $\rightarrow$ $\rightarrow$ père (~4 000 résultats). On remarque ainsi, notamment, qu'il y a 2,5 fois plus d'éléments Wikidata sans père que sans mère lorsque la propriété child (P40) est renseignée chez ces derniers. En croisant cela avec le contenu des catégories des pages utilisant P22 et P25 (21,180 vs. 8,431), on peut conclure qu'il semble que les mamans sont beaucoup mieux liées à leurs enfants que les papas.
The Mamas & the Papas (Q211277), dans cet ordre.

Une autre requête simple permet de trouver les éléments qui n'ont pas de country (P17) mais qui ont une located in the administrative territorial entity (P131) liée à un pays :
```
SELECT DISTINCT ?item WHERE {?item wdt:P131* wd:PAYS . MINUS {?item wdt:P17 [] .} }
```
Try it!
. J'ai donc ainsi ajouté Spain (Q29) sur environ 11 200 éléments (!?^{[note 8]}), France (Q142) sur environ 3 600 éléments, United Kingdom (Q145) sur environ 2 000 éléments, United States of America (Q30) sur environ 1 500 éléments, etc..

La découverte de inverse property (P1696) m'aide à mieux établir les connexions, ce qui me permet d'ajouter des conjoints (environ 5,000^{[note 9]}), des capitales (environ 19,000 capital of (P1376) et 600 capital (P36)), des different from (P1889) (~7 000 éléments).
J'ai également tenté de lier des owner of (P1830) (~154 000 éléments !) et des derivative work (P4969), ce qui m'a amené à battre le record de l'élément avec le plus grand nombre de déclaration^{[note 10]}, mais plusieurs contributeurs ont pété les plombs et retiré mes ajouts à ce niveau. Ils m'auraient même momentanément bloqué si je n'avais pas réagit promptement à leur doléances. J'ai tenté une discussion sur le Bistro anglophone de Wikidata sur le sujet, soulignant que la symétrie de ces propriétés impose que le contenu de l'une soit entièrement reflété dans le contenu de l'autre et que soit on le fait, soit on supprime la propriété inverse. Malheureusement, personne n'a répondu. La communauté n'est manifestement pas prête/mûre sur ce sujet.

Click [expand] to view the content

Le même mois, je trouve enfin une page listant les principaux modèles d'infobox utilisés sur enwiki. J'en profite donc pour importer une bonne partie du contenu des principaux modèles que je n'avais pas encore explorés avec HT. J'utilise également PS pour lister les éléments qui n'ont pas de P31 et dont les articles de enwiki utilisent un modèle d'infobox particulier. J'ajoute ensuite ce P31 en fonction de l'infobox concernée. Ainsi, par exemple, il y avait environ 4 000 éléments sans P31 et dont l'article en anglais utilise en:Template:Infobox school (petscan:6618629). Je leur ai donc ajouté school (Q3914).
Après avoir écumé les principaux modèles d'infobox utilisés, je suis passé à d'autres modèles très utilisés recensés sur en:Wikipedia:WikiProject Accessibility/Most widely used templates/Top 200 et son équivalent en français.

Je continue de *mix'n'matcher* des éléments, au rythme de quelque milliers par mois. Ici, j'ai créé Amédée Robitaille (Q59781531) à la suite de l'association de tous les NAQ elected person ID (P3055).

Descriptions : À la mi-décembre, en observant l'ami VIGNERON ajouter des descriptions en Breton (Q12107) sur des lacs du Canada, je fais de même en y ajoutant des descriptions en anglais. J'ajoute également des descriptions en anglais et en français pour des lacs et cours d'eau des États-Unis, de la Russie, de la Chine et de l'Inde. Cela amène rapidement environ 200 000 contributions m'amenant à dépasser les deux millions de modifications. La requête SPARQL concernée m'a longtemps échappée, alors qu'elle est relativement simple :

#Tous les lacs du Canada qui n'ont pas de description en français
SELECT DISTINCT ?item
WHERE
{
	?item wdt:P31 wd:Q23397 .
	?item wdt:P17 wd:Q16 .
	MINUS { ?item schema:description ?itemDescription filter(lang(?itemDescription)="fr") .}
}

Langue	Nombre d'éléments	%
English (Q1860)	3 430 477	89,3 %
Chinese (Q7850)	395 573	10,3 %
Polish (Q809)	11 471	0,3 %
French (Q150)	4 234	0,1 %
Spanish (Q1321)	512	0,01 %
German (Q188)	287	< 0,01 %
Italian (Q652)	215	< 0,01 %
Finnish (Q1412)	204	< 0,01 %
Russian (Q7737)	55	< 0,01 %
Danish (Q9035)	55	< 0,01 %
Bulgarian (Q7918)	44	< 0,01 %
Japanese (Q5287)	18	< 0,001 %
Portuguese (Q5146)	15	< 0,001 %
Dutch (Q7411)	11	< 0,001 %
Latin (Q397)	11	< 0,001 %
Total	3 843 182	100 %

Langue	Nombre d'éléments	%
anglais	?	?
langues chinoises	784 490	?
japonais	53 155	?
allemand	48 156	?
français	38 925	?
polonais	21 104	?
espagnol	18 608	?
Total	?	?

Langue	Nombre d'éléments	%
anglais	15 252	86 %
français	814	4,6 %
espagnol	591	3,3 %
allemand	543	3,1 %
langues chinoises	155	0,9 %
portugais	134	0,8 %
italien	131	0,7 %
russe	111	0,6 %
total	17 731^{[note 15]}	100 %

User:Simon Villeneuve/PoV

D̄

I

MM

3 minions et plus

X

X 1 / 2 {\displaystyle 1/2}

Notes et références

Navigation menu

Search

X $1/2$