Ceci est un guide pas à pas pour verser de nouveaux fichiers sur OpenRefine. Il vise à guider les premières personnes souhaitant tester les nouvelles fonctionnalités de téléversement. Ces instructions seront plus faciles à suivre si vous avez déjà utilisé OpenRefine, ou si vous l’avez vu en fonctionnement.
Nous avons conscience que ce processus est encore peu grossier et basique, et nous espérons simplifier un peu le processus avant fin octobre 2022 (date de fin de notre bourse auprès de la Fondation Wikimedia) en ajoutant des fonctionnalités et des textes d’aide dans l’interface.
Est-ce que certaines instructions de ce document vous paraissent peu claires ? Il vous manque une étape ? Merci de l'ajouter comme commentaire dans le document en anglais, et de pinger sandra.fauconnier@gmail.com pour une réponse rapide.
Si vous découvrez des bugs sur OpenRefine en versant des fichiers, merci, merci, merci de faire un rapport sur GitHub (après avoir vérifié que le bug n’a pas déjà été mentionné). Vous pouvez aussi pinger Sandra si c’est utile de rapporter ce bug, ou si vous n’en êtes pas sûr·e.
💎 Amusez-vous bien!!
⚠️ Attention!
|
Pour verser des fichiers sur Wikimedia Commons, il vous faut OpenRefine 3.7 ou une version plus récente.
OpenRefine 3.7 est encore en développement, vous aurez donc besoin de télécharger ce qui s’appelle une ‘snapshot release’ (instantané quotidien du code le plus “à jour”). YVous pourez trouver une snapshot release pour votre système d’exploitation sur https://github.com/OpenRefine/OpenRefine#snapshot-releases.
Si vous êtes sous Windows, alors choisissez la version Windows avec le JRE (Java Runtime Environment) embarqué[a], il fonctionnera mieux dans votre système.
Comme vous serez en train d’utiliser du code tout frais non encore testé, il est utile de sauvegarder votre directoire de projets OpenRefine[b] si vous avez des projets passés importants que vous voulez éviter de perdre.
Vous trouverez davantage d’instructions pour le téléchargement et l’installation dans la documentation d’OpenRefine: https://docs.openrefine.org/manual/installing et https://docs.openrefine.org/manual/running
💡 Conseil: Vous pouvez commencer à téléverser des fichiers sur OpenRefine à partir d’une feuille de calcul[c][d][e], un fichier de données, ou une API qui contient beaucoup de données sur/de vos fichiers.[f] Mais vous pouvez aussi commencer à partir d’une liste de fichiers et ajouter les données en cours de route. |
Il n’y a pas (encore) de bouton sur OpenRefine avec lequel ouvrir et sélectionner une liste de fichiers depuis votre ordinateur avec lequel ouvrir et sélectionner une liste de fichiers dans votre ordinateur, vous devrez donc remplir manuellement cette liste sur OpenRefine, Voici comment procéder :
Vous aurez besoin de localiser les fichiers dans votre Finder / navigateur de fichiers sur votre ordinateur local, et copier leur chemin d’accès absolu.
Dans ce cas, vous devrez commencer par vérifier que l’URL du domaine est sur la liste d’autorisations de Wikimedia Commons. Vous pouvez vérifier si un domaine est déjà listé sur cette page, et trouver les instructions sur comment ajouter un domaine qui n’y figure pas encore ici :
https://commons.wikimedia.org/wiki/Commons:Upload_tools/wgCopyUploadsDomains
Assurez-vous d’avoir la liste des URLs des fichiers que vous souhaitez verser. Il faut que vous ayez les URLs des fichiers eux-mêmes, et non des URLs de page web contenant les images à verser.
Vous pouvez maintenant utiliser votre liste de fichiers pour commencer un projet OpenRefine. N’importe laquelle des manières suivantes fonctionne : coller la liste depuis le presse-papier, l’importer depuis un fichier csv, une feuille de calcul,[m] ou (si vous aimez l’aventure) depuis un fichier XML ou une API.
Voir la documentation d’OpenRefine pour plus d’instructions : https://docs.openrefine.org/manual/starting
Exemple: coller une liste de chemins de fichiers depuis le presse–papier
Bien sûr, il faudra aussi ajouter d’autres (méta)données à ces fichiers. Vous pouvez ajouter ces métadonnées dans des colonnes additionnelles sur votre feuille de calcul[n]/projet OpenRefine. Peut-être avez-vous déjà une feuille de calcul[o] avec une partie de ces données dessus - ça fonctionne également !
Quelles données avez-vous besoin d’inclure dans le projet ? Les explications sont dans le point 3.
💡 Un conseil technique : utilisez les EXIF des fichiers ! Parfois, vous n’avez que peu de métadonnées sur un jeu de fichiers, mais des informations importantes (par ex. le nom de l’aut-eur-rice, la date de création, une description, …) se trouvent dans les données EXIF de chaque fichier. Vous pouvez utiliser Exiftool pour créer un fichier csv avec toutes les données EXIF d’une liste de fichiers, que vous pouvez ensuite charger sur OpenRefine. Cette vidéo YouTube (en anglais) explique bien le processus. La commande utilisée est une variante de exiftool -csv *.jpg > exifdata.csv |
Quelles colonnes ai-je besoin de créer ou d’avoir dans mon projet OpenRefine?
Vous avez au minimum besoin des colonnes suivantes (le nom/titre de la colonne n’a aucune importance, mais vous aurez besoin d’avoir les colonnes contenant les informations suivantes):
💡 Conseil: Allez voir d’autres fichiers sur Wikimedia Commons (notamment le wikitexte et données structurées leur correspondant) pour inspiration. |
💡 Conseil: si certaines de ces données sont les mêmes pour tous vos fichiers, vous n'avez pas besoin de l’inclure dans votre jeu de données/feuille de calcul/projet OpenRefine : vous pouvez l’ajouter manuellement au schéma.[q] |
Vous pouvez inclure tout wikitexte souhaité directement dans OpenRefine. Assurez-vous d’inclure au moins un modèle d’infobox, de conditions d’utilisation, et il est recommandé de donner à chaque fichier au moins une catégorie.
Il devient de plus en plus fréquent que les modèles d’infobox sur Wikimedia Commons deviennent (partiellement ou entièrement) soutenus par du code Lua, ce qui signifie que vous pouvez vous contenter d’un wikitexte très simple : le contenu des modèles sera automatiquement rempli à partir des données structurées et lié aux éléments Wikidata correspondants. C’est le cas pour des modèles fréquemment utilisés, tels que {{Information}}, {{Artwork}}, {{Art photo}}, et {{Book}}. Ce n’est pas encore le cas pour {{Photograph}}, {{Specimen}}, {{Map}}, entre autres. Allez chercher des exemples pour vous servir d’inspiration !
Il est toujours sage de faire un petit versement test (ex. un fichier étoilé de votre lot à verser[r]) pour adapter et prévisualiser à quoi ressemblera le fichier versé sur Commons.
Voici quelques exemples de wikitexte simple et utile que vous pouvez ajuster et réutiliser. Plus loin, la section de construction de schéma contient des conseils et des liens pour la modélisation des données structurées.[s]
Wikitexte pour une photo simple (ex. d’une personne ou d’un bâtiment) (exemple) Ce modèle se remplira automatiquement avec des données structurées si vous avez au moins fourni :
| Wikitexte pour un scan/photo 2D d’une oeuvre d’art (exemple) Ce modèle se remplira automatiquement avec des données structurées si vous avez au moins fourni :
|
=={{int:filedesc}}== {{Information}} =={{int:license-header}}== {{self|CC-BY-SA-4.0}} <!-- assurez-vous d’inclure le bon modèle de conditions d’utilisation, même si vous fournissez plus bas le copyright et les informations de licences dans les données structurées–-> [[Category:Votre catégorie 1]] [[Category:Votre catégorie 2]] | == {{int:filedesc}} == {{Artwork}} =={{int:license-header}}== {{PD-Art|PD-old-auto-expired|deathyear=1884}} <!-- assurez-vous d’inclure le bon modèle de conditions d’utilisation, même si vous fournissez plus bas le copyright et les informations de licences dans les données structurées–-> [[Category:Votre catégorie 1]] [[Category:Votre catégorie 2]] |
Wikitexte pour photographie d’une oeuvre d’art en 3D, par ex. une sculpture (exemple) Ce modèle se remplira automatiquement avec des données structurées si vous avez au moins fourni :
| Wikitexte pour un scan de livre (exemple) This template will be auto-filled with structured data if you have at least provided:
|
== {{int:filedesc}} == {{Art photo}} == {{int:license-header}} == {{PD-self}} <!-- assurez-vous d’inclure le bon modèle de conditions d’utilisation, même si vous fournissez plus bas le copyright et les informations de licences dans les données structurées–-> [[Category:Votre catégorie 1]] [[Category:Votre catégorie 2]] | =={{int:filedesc}}== {{Book}} =={{int:license-header}}== {{Licensed-PD-Art|PD-old-auto-expired|cc-by-4.0|deathyear=1933}} <!-- make sure to adjust to the correct license template, even if you also provide copyright and license info in the structured data–-> [[Category:Votre catégorie 1]] [[Category:Votre catégorie 2]] |
Les données structurées sur Commons décrivent des dossiers sur Commons en utilisant des éléments et propriétés Wikidata (propriétés comme éléments sont multilingues).
Peut-être que certaines de vos colonnes correspondent à des éléments Wikidata. Il vous faudra les réconcilier avec les éléments en question, pour aider OpenRefine à comprendre qu’il faut lier des contenus de colonnes aux éléments Wikidata correspondants. Les contenus peuvent correspondre à des colonnes telles que
Vous allez réconcilier ces colonnes avec le service de réconciliation de Wikidata, en anglais, ou dans toute autre langue pertinente (en général, cela fonctionne bien en anglais). Sur OpenRefline, le service de réconciliation avec Wikidata en anglais est installé par défaut. Vous trouverez plus d’informations sur comment réconcilier l’information ici : https://docs.openrefine.org/manual/wikibase/reconciling et ici : https://www.wikidata.org/wiki/Wikidata:Tools/OpenRefine/Editing/Tutorials/Basic_editing
Vous trouverez le menu de réconciliation sous menu > Reconcile > Start reconciling…
Choisissez le service de réconciliation Wikidata reconci.link (en), ou consultez la documentation pour utiliser le service dans une autre langue.
Dans l’exemple ci-dessous, les fichiers vidéos versés sont des vieux films d’animation (dans le domaine public). La colonne “film” est réconciliée avec Wikidata (chaque film a son propre élément Wikidata).
Cela permet de réconcilier les titres de films. Lorsque votre souris passe au-dessus dess liens en bleu, un pop-up avec des éléments issus de Wikidata apparaît (attention: ça bugue parfois).
⚠️ Cet étape paraît étrange et contraire à la raison, mais elle est nécessaire pour dire à OpenRefine de verser les nouveaux documents (en versant vos fichiers)[t] sur Wikimedia Commons.
Lorsque vous avez créé une colonne avec des noms de fichiers (tels que vous souhaitez qu’ils apparaissent sur Wikimedia Commons), procédez de la sorte :
Commencez le processus de réconciliation en sélectionnant Reconcile > Start reconciling… dans le menu de la colonne ‘filename’.
Si vous n’avez pas encore installé le service de réconciliation avec OpenRefine, cliquez sur le bouton ‘Add standard service…’ et collez le lien https://commonsreconcile.toolforge.org/en/api dans la barre. Vous trouverez plus d’infos et de documentation sur le service de réconciliation de Comons sur ce lien : https://commonsreconcile.toolforge.org/
Cliquez ensuite ‘Start reconciling…’ (vous pouvez ignorer tous les messages de cette fenêtre, il faut juste cliquer)
La réconciliation fera apparaître des noms de fichiers non-reconnus (car les fichiers n’existent pas encore sur Wikimedia Commons). C’est ce qui est attendu ! Ensuite, dans le menu de votre colonne filename, sélectionnez :
Reconcile > Actions > Create a new item for each cell.
Vos résultats devraient ressembler à ce que l’on voit sur la capture d’écran ci-dessus. La colonne ‘filename’ a été réconciliée avec Wikimedia Commons. Nous avons indiqué qu’OpenRefine doit créer un nouvel élément pour chaque nom de fichier (chaque entrée de la colonne ‘filename’). Vous pouvez voir que cela a fonctionné parce qu’il y a une ligne verte plus claire sous le nom de la colonne, et chaque cellule de la colonne a une couleur verte claire, ce qui correspond à un nouveau libellé.
C’est parfait !
Afin de pouvoir éditer Wikimedia Commons avec OpenRefine, vous aurez besoin d’ajouter le le Wikimedia Commons Wikibase manifest (pour résumer : une forme de fichier de paramètres avec des informations clés sur Wikimedia Commons qui informe OpenRefine comment éditer et ajouter des données sur Commons). Voici comment procéder :
En haut à droite de la fenêtre de projet OpenRefine, dans le menu de l’extension Wikidata/Wikibase, sélectionnez l’option ‘Selectionnez une instance de Wikibase…’.
Si vous n’avez pas déjà travaillé sur d’autres Wikibases, vous verrez apparaître une fenêtre de dialogue qui ne propose que Wikidata. Si vous ne trouvez pas Wikimedia Commons dans cette fenêtre, sélectionnez le bouton en bas à gauche ‘Ajoutez une Wikibase’.
Collez https://raw.githubusercontent.com/OpenRefine/wikibase-manifests/master/wikimedia-commons-manifest.json dans la barre d’URL, puis cliquez ‘Ajoutez une Wikibase’.
Vous pouvez ensuite cliquer sur Wikimedia Commons, la ligne deviendra bleue et sera positionnée en haut de la liste, ce qui signifie que vous avez sélectionné Wikimedia Commons comme Wikibase qu’OpenRefine éditera. Vous pouvez maintenant fermer cette fenêtre de dialogue en cliquant sur le bouton ‘Close’.
Il s’agit maintenant de préparer vos modifications / téléversements sur Wikimedia Commons. Dans cette étape, vous allez construire un schéma qui structure les données à téléverser sur Wikimedia Commons. Cette capture d’écran donne un exemple :
Etape par étape :
Cliquez sur l’onglet ‘Schéma’ dans la barre bleue au-dessus de votre jeu de données, ou allez sur le menu de l’extension Wikidata/Wikibase et sélectionnez ‘Edit Wikibase schema’. Vous aurez d’abord une fenêtre de schéma vide.
Cliquez sur le lien à droite ‘+ add media’. Plusieurs champs vont apparaître :
Vous pouvez maintenant taper à la main et/ou tirer jusque dans les boîtes toutes les informations que vous souhaitez avoir dans les fichiers.[v]
Dans le menu de l’extension Wikibase, sélectionnez ‘Upload edits to Wikibase…’ et connectez-vous à Wikimedia Commons avec votre nom d’utilisat-eur-rice. OpenRefine vous incitera à utiliser un bot de mots de passe, mais ce n’est pas nécessaire, et vous pouvez ignorer cette invitation. Donnez un résumé de modifications descriptif. Pas besoin de changer la valeur maxlag. Cliquez sur ‘Upload edits’ et votre versement va commencer.
Plus d’informations : https://docs.openrefine.org/manual/wikibase/uploading
Les fichiers que vous avez versé devraient apparaître dans la catégorie https://commons.wikimedia.org/wiki/Category:Uploaded_with_OpenRefine et sur votre historique de contributions/imports sur Wikimedia Commons.
[a]the Windows with embedded JRE (Java Runtime Environment) version
[b]back up your OpenRefine project directory
[c]un document excel ???
[d]oui, Excel ou logiciel tableur équivalent (Calc, etc.)
[e]Oui, je vois ce que c'est, mais je mets quoi comme mot pour que les gen-te-s comprennent? "document tableur"? "feuille excel"? "feuille tableur"?
[f]that already has a lot of data about your files
[g]Get a list of files to upload. What should these look like?
[h]‘Copy nnn as pathname(s)’ (vérifier en faisant)
[i]cette option n'apparaît pas sur mon Mac. Après sélection des fichiers je passe par le menu Edition>Afficher le presse-papier
[j]je pars du principe qu'OpenRefine s'exprime en anglais
[k]au démarrage, il est possible de changer la langue de l'interface. Elle est traduite à 100 % en français
[l]français correct.
[m]un fichier excel???
[n]fichier excel ???
[o]un fichier excel ???
[p]copyrighted
[q]💡 Tip: if some of this data is the same for all your files, then you don’t need to have it in your dataset/spreadsheet/OpenRefine project; you can also manually add it to the schema.
What schema ? J'ai pas compris c'est quoi "the schema" (et je me suis permis de répercuter ma question sur le doc d'origine). Si c'est évident, let me know - je retirerai aussi ma remarque de la VO.
[r]one starred file from your batch
[s]J'ai ici traduit sans comprendre la phrase suivante : "The section on schema building below contains some tips and links for the structured data modeling"
[t]j'ai un peu adapté l'anglais : est-ce que j'ai gardé le sens ?
[u]Pas traduit : je sais pas s'il existe un terme équivalent en français
[v]You can now type, and/or drag and drop all the info you want in the files
[w]and for artworks also main subject and digital representation