1 of 53

URFIST

rennes

Comment publier un data paper ?

Stage Urfist / 22 mai 2023

Unité Régionale de Formation à l’Information Scientifique et Technique - Bretagne et Pays de la Loire

Florence THIAULT, Urfist de Rennes

2 of 53

1. Contexte de l’Open Science�2. Définition et enjeux du data paper

3. Où et comment publier un data paper ?

4. Comment rédiger un data paper ?

5. Analyse de data papers

6. Ressources

URFIST

rennes

Plan

3 of 53

URFIST

rennes

Contexte de l’open science

4 of 53

5 of 53

Loi Cada

Accès aux documents administratifs

1978

Révision directive PSI

Charte du G8

Pour l’ouverture des données publiques

2013

Directive PSI

Réutilisation des documents publics

2003

2003

Déclaration de Berlin

Libre accès à la connaissance

2007

Déclaration de l’OCDE

Accès aux données de la recherche financée par des fonds publics

2e Plan national pour la Science Ouverte

Elargissement (code source, pratiques, financement)

2021

Open data

Science ouverte

1er Plan national pour la Science Ouverte

Libre accès aux publications et vers l’ouverture des données (FR)

2018

2012 ?

Obligation OA pour projets européens

2019

Obligation ANR (PGD)

6 of 53

6

(Facilitate Open Science Training For European Research)

Source : https://www.fosteropenscience.eu/taxonomy/term/7

La science ouverte selon FOSTER

7 of 53

PNSO 1 et 2

URFIST

rennes

I- 2018-2021

    • Généraliser l’accès ouvert aux publications
    • Structurer et ouvrir les données de recherche
    • S’inscrire dans une dynamique durable, européenne et internationale

II- 2021-2024 : Généraliser la science ouverte en France

    • Généraliser l’accès ouvert aux publications
    • Structurer, ouvrir et partager les données de recherche
    • Ouvrir et promouvoir les codes sources produits par la recherche
    • Transformer les pratiques pour faire de la science ouverte le principe par défaut

8 of 53

8

AXE 2 : STRUCTURER ET OUVRIR LES DONNÉES DE LA RECHERCHE

Dans le cadre du soutien public aux revues, la France recommandera l’adoption d’une politique de données ouvertes associées aux articles et le développement des data papers. (PNSO 1, 2018)

AXE 1 : GENERALISER L’ACCES OUVERT AUX PUBLICATIONS

Construire la bibliodiversité

→ Développer et soutenir des innovations éditoriales : prépublications, évaluation ouverte par les pairs, articles exécutables (Jupyter notebooks), articles de données (data papers), overlay journals, etc. (PNSO 2, 2021)

Data paper et science ouverte

9 of 53

Définition d’un data paper

9

« Un data paper est un article dans une revue à comité de lecture, décrivant les données d’un projet de recherche.

Ce type d’article décrit des données liées à une publication (underlying research data) ou indépendantes d’une publication. » Reymonet, 2017

10 of 53

Définition d’un data paper

Data journal

Journal (toujours en libre accès) qui publie des articles de données (data papers). Il fournit habituellement des modèles de description des données et guide les chercheurs sur les lieux de dépôt et sur la façon de décrire et de présenter leurs données.

Traduit de Research Data Alliance

Data paper

Produit de publication de données, pouvant apparaître dans un data journal ou dans une revue académique classique. Contrairement aux articles de recherche classiques, les data papers ont pour but de rendre les données accessibles, interprétables et réutilisables, plutôt que de tester des hypothèses ou présenter de nouvelles analyses.

11 of 53

Définition d’un data paper

Data paper :

Publication scientifique

Qui décrit des jeux de données grâce à des informations précises ou métadonnées

Métadonnées :

Pourquoi, par qui et comment ces données ont été collectées ?

Qui en est propriétaire ?

Sous quel format elles sont stockées ?

Les jeux de données sont : Attachés au data paper

Déposés dans un entrepôt

Identifiés grâce à un identifiant permanent (Digital Object Identifier)

Informations descriptives sur les jeux de données

Les méthodes et protocoles utilisés pour les créer et traiter ;

Leur structure et leur format ;

Leur potentiel de réutilisation.

12 of 53

Intérêt d’un data paper

12

EXPOSER les données dans un data paper permet de :

  • répondre aux exigences des financeurs de la recherche (visibilité et accessibilité résultats scientifiques) ;
  • répondre aux recommandations de la communauté scientifique internationale sur les données ;
  • présenter un accès aux données avec un lien vers l’entrepôt choisi, et les rendre intelligibles en les décrivant ;
  • fournir une référence citable, car publié dans une revue scientifique (peer-rewieved journal) ;
  • générer des citations (ex. Data Citation Index) ;
  • reconnaître le travail de l’équipe de recherche qui a produit les données décrites en matérialisant ces données par un article publié.

(Reymonet, 2017)

13 of 53

  • Tournant quantitatif en SHS depuis 10 ans
  • Crise de la reproductibilité (cf Ioannidis 2005)

> Quelques réponses :

    • Plans de gestion de données.
    • Plans de pre-analyse.
    • Meta-analyses.

Condition nécessaire = capacité à reproduire les résultats publiés.

  • Obligations des agences de financement et de certains éditeurs
  • Valorisation des producteurs de données
  • Favoriser la réutilisation des données

Une nouvelle forme de publication scientifique au service de la reproductibilité.

Pourquoi publier sur les données ?

14 of 53

Les avantages d’un data paper

14

15 of 53

Intérêt d’un data paper

15

Source : D. L’Hostis et al., 2016 (hal-02801638)

16 of 53

Intérêt d’un data paper

16

Source : D. L’Hostis et al., 2016 (hal-02801638)

17 of 53

17

Réutilisation

Citation

+ de visibilité

Objectifs d’un data paper

3 objectifs principaux

"Studies that provide access to underlying data are cited 25% more often than those that don’t«  (Colavizza, Giovanni et al. “The citation advantage of linking publications to research data.” PloS one vol. 15,4 e0230416. 22 Apr. 2020, doi:10.1371/journal.pone.0230416)

18 of 53

18

Joachim Schöpfel, et al. (2019), Data papers as a new form of knowledge organization in the field of research data. halshs-02284548

Objectifs d’un data paper

Une nouvelle forme de publication scientifique au service de la reproductibilité.

19 of 53

URFIST

rennes

Où et comment publier un data paper ?

20 of 53

20

Où publier un data paper ?

Choisir sa revue

Quels usages dans ma discipline ?

Quelle visibilité de la revue ?

Quel processus d’évaluation ?

Où sont stockées les données ?

Quelles pérennité et fiabilité des données ?

21 of 53

Où publier un data paper ?

Multidisciplinaires

eLife (eLife Sciences Publications)

Nature Biotechnology (NPG)

Plant & Cell Physiology (Oxford)

Frontiers in Plant Science (Frontiers)

J. Open Health Data (Ubiquity Press)

Biologie

Agronomie

Annals of Forest Science (Springer)

Applied Vegetation Science (Wiley)

J. Vegetation Science (Wiley)

Environnement

Ecology (ESA)

Biodiversity Data Journal (Pensoft)

MycoKeys, PhytoKeys, ZooKeys (Pensoft)

Nature Conservation (Pensoft)

Ecological Research (Springer)

J. Environmental Quality (ASA)

Earth System Science Data (Copernicus)

Geoscience Data Journal (Wiley)

SHS

Physique-chimie

J. Chemical & Engineering Data (ACS Publications)

J. Physical & Chemical Reference Data (AIP Publishing)

22 of 53

22

Choisir sa revue (critères)

Localisation des données

Coûts et archivage pérenne

In data paper

Entrepôt

licences

Accès (sur demande ou embargo)

Texte libre

Structurées (standard)

Diffusion des données

Présentation des données et

métadonnées

Notoriété, langue,

fonctionnement, visibilité

Où publier un data paper ?

23 of 53

23

La minute vidéo - Doranum & IST Inra�

Publier un data paper

24 of 53

24

D’après Austin, C.C., Bloom, T., Dallmeier-Tiessen, S. et al. Int J Digit Libr (2016). Doi: 10.1007/s00799-016-0178-2

Eléments pour la publication de données

25 of 53

25

Publier un data paper

26 of 53

26

Modèle IMRAD d’un papier de recherche

27 of 53

27

Sections d’un data paper

Source : Schöpfel et al., 2019

28 of 53

28

Publier un data paper

Open Science : gestion et partage des données de la recherche / Esther Dzale & Dominique l'Hostis , ⟨hal-02800107⟩

29 of 53

Source : M. LE BECHEC (URFIST de Lyon)

29

Structure d’un data paper (en fonction des revues)

Titre

Données

Accessibles

dans

l’article

ou dans

un

entrepôt

via un DOI

Description des données

Conseils pour la réutilisation

Méta-données

Validation technique

Valeur des données

abstract

mots-clés

introduction

méthodes

résultats

discussion

remerciements

références

Sources de financement

Publier un data paper

30 of 53

Publier un data paper

Laurence Dedieu, éditrice scientifique, Cirad - Dist

Entrepôt de données

Jeu de données

Mettre à disposition

d’une

communauté

scientifique

Informer la

communauté

scientifique

  • Décrit un jeu de données
  • Montre son potentiel
  • Donne accès aux données

Décrire un jeu de données

Data paper

31 of 53

Rédiger un data paper

32 of 53

33 of 53

33

Titre Auteur (1)  Affiliation Data’s citation : cf. entrepôt

1. Data présentation

1.1.General information

Petite introduction d'une ou deux phrases présentant de façon très simple, de quels types de données il s’agit (images, cartes, sons, données de capteurs, algorithmes etc.) et sur quoi portent les données.

1.2. Data files

Explication plus approfondie des fichiers de données, une description de l’arborescence des fichiers, des formats

1.3.Structure of data

Informations relatives aux données (structure des données dans chaque fichier, les mesures et leurs unités) etc.

1.4.Value of the data

Indiquer dans cette partie à quoi servent les données, quelle est leur originalité

2. Method

2.1. Project

Pour chaque type de données, expliquer pourquoi vous avez eu besoin de ces données, l’objectif visé dans le projet.

2.2. Expérimentation

Pour chaque type de données, expliquer les méthodes qui ont permis de les obtenir

2.3. Materials

Pour chaque type de données, expliquer le matériel utilisé, le calibrage de ces outils etc.

Rédiger un data paper : modèle IFFSTAR

34 of 53

Source : M. LE BECHEC, URFIST de Lyon

34

Description synthétique du jeu de données

  • Sous l’abstract
    • Discipline : informatique, Economie, sociologie, etc.
    • Thématique : catégorie disciplinaire
    • Type de données : tableaux, images, textes, etc.
    • Méthode d’acquisition des données : enquête, observation instrumentales, etc.
    • Format des données : cf. Cines, Raw, XML, etc.
    • Pré-traitement : bref description (ex. création de sous-ensemble)
    • Lieu d’acquisition des données : pays, région, ville, etc
    • Type d’accès aux données : licences, entrepôt, citation, etc.

Rédiger un data paper

35 of 53

Source : M. LE BECHEC, URFIST de Lyon

35

À consulter : https://topfactor.org/

bioRxiv preprint first posted online Apr. 4, 2017; doi: http://dx.doi.org/10.1101/122929

Data Policy 

Politique des données

36 of 53

Source : M. LE BECHEC, URFIST de LYON

36

La vérification de la qualité et de l’exhaustivité des données

Qui ? Auteurs - Editeurs - relecteurs ?

Enquête qualitative dans des revues académiques d'écologie auprès des rédacteurs en chefs et parties prenantes

Politique des données

Enforcing public data archiving policies in academic publishing: A study of ecology journals

Dan Sholler, Karthik Ram, Carl Boettiger, Daniel S. Katz (2018)

37 of 53

(Kim J., 2020, https://doi.org/10.6087/kcse.185)

Hétérogénéïté dans la structure des modèles et des directives (lacunes)

  • Analyse de 15 templates et guidelines utilisés dans 24 data journals indexés dans le WoS
  • Présence : Informations demandées sur les formats ; le nommage des fichiers, le projet de recherche et DOI ou autres identifiants
  • Absence : réputation des dépôts et pratiques de conservation
  • Données : conseil de réutilisation et conditions mais manque d’informations contextuelles pour la réutilisation des données

37

Evaluation de data paper

38 of 53

D'après : Candela, L., Castelli, D., Manghi, P., & Tani, A. (2014)

38

Dataset d’un data paper

39 of 53

Où déposer les données ?

A partir du choix de la revue de publication, vérifier les recommandations,

les instructions aux auteurs préconisent souvent des entrepôts reconnus en fonction de la nature des données.

Certaines revues disposent de leur propre entrepôt de données

Certaines revues autorisent dans certaines conditions l’intégration des données au sein du Data Paper (ex : Data In Brief, Biodiversity Data Journal)

A défaut, le choix revient aux producteurs des données et rédacteurs du Data Paper

39

40 of 53

Fonctionnalités d’un entrepôt

  1. Dépôt et conservation des données
  2. contrôle des droits d’accès aux données, conditions d’utilisation et licence
  3. recherche, affichage, export des (méta)données
  4. exploration et visualisation des données

40

41 of 53

Valoriser la gestion des données

Données partagées et publiées

Quelle différence entre les déposer sur Zenodo et écrire un data paper ?

Quelles normes de relecture ?

Données publiées = accessibles de façon pérenne (entrepôt), citables, documentées, évaluées.

41

// avec le Data Management Plan (DMP)

42 of 53

Valoriser la gestion des données

42

Citation et citer

Modèle proposé par DataCite https://www.datacite.org/cite-your-data.html

Un modèle minimal :

Créateur (Année de publication). Titre. Editeur. Identifiant.

Un modèle où la version et le type de ressources peuvent être précisés :

Créateur (Année de publication) : Titre. Version. Editeur. Type de ressource. Identifiant.

Exemple : Wilkinson, M., Dumontier, M., Aalbersberg, I. et al. The FAIR Guiding Principles for scientific data management and stewardship. Sci Data 3, 160018 (2016). https://www.nature.com/articles/sdata201618

43 of 53

Data et identifiants

Pierce H.H. et al. (2019) Credit data generators for data reuse

Nature 570, 30-32

doi: https://doi.org/10.1038/d41586-019-01715-4

43

44 of 53

URFIST

rennes

Analyse de data papers

45 of 53

45

Critères d’évaluation d’un data paper

46 of 53

Ex. de rubriques data paper

46

47 of 53

47

48 of 53

48

Exemple de data journal

49 of 53

49

Découverte de data papers

Pour chacun de ces Data Papers, quel est le plan et le lieu de stockage des données ?

50 of 53

50

Exercice d’évaluation de data papers

Référence bibliographique du data paper (DOI)

Référence bibliographique de la publication associée

Nom de l’entrepôt et adresse URL des jeux de données associés

Les jeux de données sont librement téléchargeables

51 of 53

Accompagnement à la gestion des données sur le site rennais : ARDoISE

Réseau d'appui qui accompagne les équipes de recherche de toutes disciplines des établissements du site rennais dans la structuration, la gestion et le partage de leurs données, dans une logique FAIR et tout au long du cycle de vie de la donnée.

L’atelier de la donnée ARDoISE est membre de l’écosystème Recherche data gouv et a été reconnu comme « atelier en trajectoire de labellisation » en décembre 2022.

Ouverture prochaine d’un espace institutionnel sur l’entrepôt Recherche Data Gouv

Guichet unique : guichet-ardoise@groupes.renater.fr

52 of 53

URFIST

rennes

Ressources à consulter

Béchec (Mariannig Le), Le data paper, un nouvel outil de communication scientifique ?, Territoires numériques de marques, url: https://ternumeric.hypotheses.org/374 (visited on 10/02/2023)

Dillaerts (Hans), Les data Papers : quels périmètres, quelles définitions ? Entretien avec Joachim Schöpfel, DLIS, url: https://dlis.hypotheses.org/4840 (visited on 10/02/2023)

DoRANum, Comment publier des données de recherche ?, url: https://doranum.fr/data-paper-data-journal/comment-publier-donnees-recherche/ (visited on 10/02/2023)

DoRANum, Le contenu d'un data paper, url: https://doranum.fr/data-paper-data-journal/contenu-data-paper/ (visited on 10/02/2023)

DoRANum, Les critères d'évaluation des data papers, url: https://doranum.fr/data-paper-data-journal/criteres-evaluation-data-papers/ (visited on 10/02/2023)

Gouzi (Françoise), Qu'est-ce qu'un data paper ?, Toul'AO, url: https://openarchiv.hypotheses.org/4126 (visited on 10/02/2023)

INRAE, Datapartage - Séminaire Data Papers, url: https://www6.inrae.fr/datapartage/Partager-Publier/Publier-un-Data-Paper/Seminaire-Data-Papers#datapaper (visited on 10/02/2023)

L'Hostis (Dominique), Hamelin (Marjolaine), Lelievre (Virginie), and Aventurier (Pascal), Publier un Data Paper pour valoriser ses données, 2016, doi: 10.15454/1.478247389988942E12

53 of 53

Merci beaucoup pour votre attention