URFIST
rennes
Comment publier un data paper ?
Stage Urfist / 22 mai 2023
Unité Régionale de Formation à l’Information Scientifique et Technique - Bretagne et Pays de la Loire
Florence THIAULT, Urfist de Rennes
1. Contexte de l’Open Science�2. Définition et enjeux du data paper
3. Où et comment publier un data paper ?
4. Comment rédiger un data paper ?
5. Analyse de data papers
6. Ressources
URFIST
rennes
Plan
URFIST
rennes
Contexte de l’open science
Directive PSI
Réutilisation des documents publics
2003
Open data
Science ouverte
1er Plan national pour la Science Ouverte
Libre accès aux publications et vers l’ouverture des données (FR)
2018
2012 ?
Obligation OA pour projets européens
2019
Obligation ANR (PGD)
6
(Facilitate Open Science Training For European Research)
La science ouverte selon FOSTER
PNSO 1 et 2
URFIST
rennes
I- 2018-2021
II- 2021-2024 : Généraliser la science ouverte en France
8
AXE 2 : STRUCTURER ET OUVRIR LES DONNÉES DE LA RECHERCHE
Dans le cadre du soutien public aux revues, la France recommandera l’adoption d’une politique de données ouvertes associées aux articles et le développement des data papers. (PNSO 1, 2018)
AXE 1 : GENERALISER L’ACCES OUVERT AUX PUBLICATIONS
Construire la bibliodiversité
→ Développer et soutenir des innovations éditoriales : prépublications, évaluation ouverte par les pairs, articles exécutables (Jupyter notebooks), articles de données (data papers), overlay journals, etc. (PNSO 2, 2021)
Data paper et science ouverte
Définition d’un data paper
9
« Un data paper est un article dans une revue à comité de lecture, décrivant les données d’un projet de recherche.
Ce type d’article décrit des données liées à une publication (underlying research data) ou indépendantes d’une publication. » Reymonet, 2017
Définition d’un data paper
Data journal
Journal (toujours en libre accès) qui publie des articles de données (data papers). Il fournit habituellement des modèles de description des données et guide les chercheurs sur les lieux de dépôt et sur la façon de décrire et de présenter leurs données.
Data paper
Produit de publication de données, pouvant apparaître dans un data journal ou dans une revue académique classique. Contrairement aux articles de recherche classiques, les data papers ont pour but de rendre les données accessibles, interprétables et réutilisables, plutôt que de tester des hypothèses ou présenter de nouvelles analyses.
Définition d’un data paper
Data paper :
Publication scientifique
Qui décrit des jeux de données grâce à des informations précises ou métadonnées
Métadonnées :
Pourquoi, par qui et comment ces données ont été collectées ?
Qui en est propriétaire ?
Sous quel format elles sont stockées ?
Les jeux de données sont : Attachés au data paper
Déposés dans un entrepôt
Identifiés grâce à un identifiant permanent (Digital Object Identifier)
Informations descriptives sur les jeux de données
Les méthodes et protocoles utilisés pour les créer et traiter ;
Leur structure et leur format ;
Leur potentiel de réutilisation.
Intérêt d’un data paper
12
EXPOSER les données dans un data paper permet de :
> Quelques réponses :
Condition nécessaire = capacité à reproduire les résultats publiés.
Une nouvelle forme de publication scientifique au service de la reproductibilité.
Pourquoi publier sur les données ?
Les avantages d’un data paper
14
Intérêt d’un data paper
15
Source : D. L’Hostis et al., 2016 (hal-02801638)
Intérêt d’un data paper
16
Source : D. L’Hostis et al., 2016 (hal-02801638)
17
Réutilisation
Citation
+ de visibilité
Objectifs d’un data paper
3 objectifs principaux
"Studies that provide access to underlying data are cited 25% more often than those that don’t« (Colavizza, Giovanni et al. “The citation advantage of linking publications to research data.” PloS one vol. 15,4 e0230416. 22 Apr. 2020, doi:10.1371/journal.pone.0230416)
18
Joachim Schöpfel, et al. (2019), Data papers as a new form of knowledge organization in the field of research data. halshs-02284548
Objectifs d’un data paper
Une nouvelle forme de publication scientifique au service de la reproductibilité.
URFIST
rennes
Où et comment publier un data paper ?
20
Où publier un data paper ?
Choisir sa revue
Quels usages dans ma discipline ?
Quelle visibilité de la revue ?
Quel processus d’évaluation ?
Où sont stockées les données ?
Quelles pérennité et fiabilité des données ?
Où publier un data paper ?
Data in Brief (Elsevier)
GigaScience (BMC)
PLoS One (PLoS)
Scientific Data (NPG)
F1000Research (F1000)
Multidisciplinaires
eLife (eLife Sciences Publications)
Nature Biotechnology (NPG)
Plant & Cell Physiology (Oxford)
Frontiers in Plant Science (Frontiers)
J. Open Health Data (Ubiquity Press)
Biologie
Agronomie
Environnement
Ecology (ESA)
Biodiversity Data Journal (Pensoft)
MycoKeys, PhytoKeys, ZooKeys (Pensoft)
Nature Conservation (Pensoft)
Ecological Research (Springer)
J. Environmental Quality (ASA)
Earth System Science Data (Copernicus)
Geoscience Data Journal (Wiley)
SHS
Research Data J. for Humanities and Social Sciences (Brill)
Journal of Open Humanities Data (Ubiquity press)
Journal of Open Psychology Data (Ubiquity Press)
Physique-chimie
J. Chemical & Engineering Data (ACS Publications)
J. Physical & Chemical Reference Data (AIP Publishing)
22
Choisir sa revue (critères)
Localisation des données
Coûts et archivage pérenne
In data paper
Entrepôt
licences
Accès (sur demande ou embargo)
Texte libre
Structurées (standard)
Diffusion des données
Présentation des données et
métadonnées
D’après : Dedieu, L. (2017). http://www.laas.fr/vod/public/wowza/L.Dedieu.html
Notoriété, langue,
fonctionnement, visibilité
Où publier un data paper ?
23
La minute vidéo - Doranum & IST Inra�
Publier un data paper
24
D’après Austin, C.C., Bloom, T., Dallmeier-Tiessen, S. et al. Int J Digit Libr (2016). Doi: 10.1007/s00799-016-0178-2
Eléments pour la publication de données
25
Austin et al, 2015, https://zenodo.org/record/34542
Publier un data paper
26
Source : Wu, J. (2011). https://doi.org/10.1007/s10980-011-9674-3
Modèle IMRAD d’un papier de recherche
27
Sections d’un data paper
Source : Schöpfel et al., 2019
28
Publier un data paper
Open Science : gestion et partage des données de la recherche / Esther Dzale & Dominique l'Hostis , ⟨hal-02800107⟩
Source : M. LE BECHEC (URFIST de Lyon)
29
Structure d’un data paper (en fonction des revues)
Titre
Données
Accessibles
dans
l’article
ou dans
un
entrepôt
via un DOI
Description des données
Conseils pour la réutilisation
Méta-données
Validation technique
Valeur des données
abstract
mots-clés
introduction
méthodes
résultats
discussion
remerciements
références
Sources de financement
Publier un data paper
Publier un data paper
Laurence Dedieu, éditrice scientifique, Cirad - Dist
Entrepôt de données
Jeu de données
Mettre à disposition
d’une
communauté
scientifique
Informer la
communauté
scientifique
Décrire un jeu de données
Data paper
Rédiger un data paper
33
Titre Auteur (1) Affiliation Data’s citation : cf. entrepôt
1. Data présentation
1.1.General information
Petite introduction d'une ou deux phrases présentant de façon très simple, de quels types de données il s’agit (images, cartes, sons, données de capteurs, algorithmes etc.) et sur quoi portent les données.
1.2. Data files
Explication plus approfondie des fichiers de données, une description de l’arborescence des fichiers, des formats
1.3.Structure of data
Informations relatives aux données (structure des données dans chaque fichier, les mesures et leurs unités) etc.
1.4.Value of the data
Indiquer dans cette partie à quoi servent les données, quelle est leur originalité
2. Method
2.1. Project
Pour chaque type de données, expliquer pourquoi vous avez eu besoin de ces données, l’objectif visé dans le projet.
2.2. Expérimentation
Pour chaque type de données, expliquer les méthodes qui ont permis de les obtenir
2.3. Materials
Pour chaque type de données, expliquer le matériel utilisé, le calibrage de ces outils etc.
Rédiger un data paper : modèle IFFSTAR
Source : M. LE BECHEC, URFIST de Lyon
34
Description synthétique du jeu de données
Rédiger un data paper
Source : M. LE BECHEC, URFIST de Lyon
35
À consulter : https://topfactor.org/
bioRxiv preprint first posted online Apr. 4, 2017; doi: http://dx.doi.org/10.1101/122929
Data Policy
Politique des données
Source : M. LE BECHEC, URFIST de LYON
36
La vérification de la qualité et de l’exhaustivité des données
Qui ? Auteurs - Editeurs - relecteurs ?
Enquête qualitative dans des revues académiques d'écologie auprès des rédacteurs en chefs et parties prenantes
Politique des données
Enforcing public data archiving policies in academic publishing: A study of ecology journals
Dan Sholler, Karthik Ram, Carl Boettiger, Daniel S. Katz (2018)
(Kim J., 2020, https://doi.org/10.6087/kcse.185)
Hétérogénéïté dans la structure des modèles et des directives (lacunes)
37
Evaluation de data paper
38
Dataset d’un data paper
Où déposer les données ?
A partir du choix de la revue de publication, vérifier les recommandations,
les instructions aux auteurs préconisent souvent des entrepôts reconnus en fonction de la nature des données.
Certaines revues disposent de leur propre entrepôt de données
Certaines revues autorisent dans certaines conditions l’intégration des données au sein du Data Paper (ex : Data In Brief, Biodiversity Data Journal)
A défaut, le choix revient aux producteurs des données et rédacteurs du Data Paper
39
Fonctionnalités d’un entrepôt
40
Valoriser la gestion des données
Données partagées et publiées
Quelle différence entre les déposer sur Zenodo et écrire un data paper ?
Quelles normes de relecture ?
Données publiées = accessibles de façon pérenne (entrepôt), citables, documentées, évaluées.
41
// avec le Data Management Plan (DMP)
Valoriser la gestion des données
42
Citation et citer
Modèle proposé par DataCite https://www.datacite.org/cite-your-data.html
• Un modèle minimal :
Créateur (Année de publication). Titre. Editeur. Identifiant.
• Un modèle où la version et le type de ressources peuvent être précisés :
Créateur (Année de publication) : Titre. Version. Editeur. Type de ressource. Identifiant.
Exemple : Wilkinson, M., Dumontier, M., Aalbersberg, I. et al. The FAIR Guiding Principles for scientific data management and stewardship. Sci Data 3, 160018 (2016). https://www.nature.com/articles/sdata201618
Data et identifiants
Pierce H.H. et al. (2019) Credit data generators for data reuse
Nature 570, 30-32
doi: https://doi.org/10.1038/d41586-019-01715-4
43
URFIST
rennes
Analyse de data papers
45
Critères d’évaluation d’un data paper
48
Exemple de data journal
https://brill.com/view/journals/rdj/4/1/article-p55_55.xml
(Social and Behavioural Sciences)
https://gigascience.biomedcentral.com/articles/10.1186/2047-217X-3-3 (Biomedcentral)
https://doi.org/10.1038/sdata.2018.217 (geospatial)
https://openarchaeologydata.metajnl.com/articles/10.5334/4f3bcb3f7f21d/ (archeologie)
https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0004803 (datavisualisation)
https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0115641 (cross-cultural studies)
�
49
Découverte de data papers
Pour chacun de ces Data Papers, quel est le plan et le lieu de stockage des données ?
�
50
Exercice d’évaluation de data papers
Référence bibliographique du data paper (DOI) | Référence bibliographique de la publication associée | Nom de l’entrepôt et adresse URL des jeux de données associés | Les jeux de données sont librement téléchargeables |
| | | |
Accompagnement à la gestion des données sur le site rennais : ARDoISE
Réseau d'appui qui accompagne les équipes de recherche de toutes disciplines des établissements du site rennais dans la structuration, la gestion et le partage de leurs données, dans une logique FAIR et tout au long du cycle de vie de la donnée.
L’atelier de la donnée ARDoISE est membre de l’écosystème Recherche data gouv et a été reconnu comme « atelier en trajectoire de labellisation » en décembre 2022.
Ouverture prochaine d’un espace institutionnel sur l’entrepôt Recherche Data Gouv
Guichet unique : guichet-ardoise@groupes.renater.fr
URFIST
rennes
Ressources à consulter
Béchec (Mariannig Le), Le data paper, un nouvel outil de communication scientifique ?, Territoires numériques de marques, url: https://ternumeric.hypotheses.org/374 (visited on 10/02/2023)
Dillaerts (Hans), Les data Papers : quels périmètres, quelles définitions ? Entretien avec Joachim Schöpfel, DLIS, url: https://dlis.hypotheses.org/4840 (visited on 10/02/2023)
DoRANum, Comment publier des données de recherche ?, url: https://doranum.fr/data-paper-data-journal/comment-publier-donnees-recherche/ (visited on 10/02/2023)
DoRANum, Le contenu d'un data paper, url: https://doranum.fr/data-paper-data-journal/contenu-data-paper/ (visited on 10/02/2023)
DoRANum, Les critères d'évaluation des data papers, url: https://doranum.fr/data-paper-data-journal/criteres-evaluation-data-papers/ (visited on 10/02/2023)
Gouzi (Françoise), Qu'est-ce qu'un data paper ?, Toul'AO, url: https://openarchiv.hypotheses.org/4126 (visited on 10/02/2023)
INRAE, Datapartage - Séminaire Data Papers, url: https://www6.inrae.fr/datapartage/Partager-Publier/Publier-un-Data-Paper/Seminaire-Data-Papers#datapaper (visited on 10/02/2023)
L'Hostis (Dominique), Hamelin (Marjolaine), Lelievre (Virginie), and Aventurier (Pascal), Publier un Data Paper pour valoriser ses données, 2016, doi: 10.15454/1.478247389988942E12
Merci beaucoup pour votre attention
Répondre au questionnaire d’évaluation