1 of 57

Les API ouvertes de la BNF

Webinaire du 1er juin 2021

2 of 57

Pour que le webinaire se passe bien

interagir

poser une question

🎥

sondage

Etalab

3 of 57

Les missions de l’équipe API de la DINUM

Ecourager �l’exposition d’API par les administrations

Réaliser des cas d’usages avec de l’impact grâce aux API

4 of 57

5 of 57

Présentation de l’offre de la BnF

Cartographie �de l’offre

Quelles données ?

Pour quels usages ?

Quelles modalités�d’accès ?

6 of 57

Présentation de l’offre de la BnF

Les données

documents numérisés

données dérivées

métadonnées

jeux de �données

données sur les usages

documents �nés numériques

7 of 57

Présentation de l’offre de la BnF

Les usages

Echanger des informations : protocoles OAI-PMH

Chercher de l’information : SRU Catalogue, SRU Gallica, SPARQL data.bnf

Réutiliser des données et contenus : API Gallica, IIIF, dumps

Industries culturelles, recherche, grand public

Interroger, aligner, réutiliser, transformer, agréger...

8 of 57

Présentation de l’offre de la BnF

Les modalités

API, services web

Jeux de données �(prédéfinis, à la �demande)

SPARQL

OAI-PMH

9 of 57

Focus sur data.bnf.fr

10 ans du projet

  • Porte d’entrée vers les données /métadonnées de la BnF
  • Les données de la BnF dans une interface conçue pour le Web
  • Un projet en constante évolution
  • Les données de la BnF en RDF
  • Dumps des données disponibles sur api.bnf.fr
  • Sparql-Endpoint permettant de récupérer les données de la BnF

10 of 57

Focus sur data.bnf.fr

11 of 57

Focus sur les API Gallica

L’offre

Interroger le moteur d’indexation Gallica : API SRU, Facettes, Occurrences

Accéder aux métadonnées Gallica : protocole OAI-PMH

Accéder aux contenus : API Pagination, Calendrier, Texte, Vignettes

Accéder aux images : API IIIF Presentation et Image

Usages

Extraction de données et contenus, interrogation synchrone des entrepôts

https://gallica.bnf.fr�Gallica, la bibliothèque numérique de la BnF et de ses partenaires

12 of 57

Focus sur IIIF

IIIF : un protocole interopérable d’échange de contenus image

Bibliothèques, archives, musées

API Presentation, Image, Search, Authentification

API v3 : audio, vidéo (2021-2022)

IIIF, c’est aussi un écosystème : communauté, contenus, services, outils

13 of 57

Cas d’usage : recherche

Projet JADIS Paris,�Rémi Petitpierre, master 2,�École polytechnique �fédérale de Lausanne �(EPFL)�Alignement de cartes �anciennes (BnF, BHVP) �sur des données carto-�graphiques contemporaines

OAI-PMH�API IIIF Image

http://gallicastudio.bnf.fr�Boîte à outils

14 of 57

Cas d’usage : interopérabilité des contenus

Deux exemplaires d’un imprimé �conservés dans différentes�Institutions consultés�dans le visualiseur IIIF Mirador

BnF

Stanford

15 of 57

Cas d’usage : interopérabilité des contenus

Portail France-Angleterre : �800 manuscrits médiévaux �enluminés

BnF

British Library

https://manuscrits-france-angleterre.org/

https://www.bl.uk/fr-FR/medieval-english-french-manuscripts

MB Gallica + Mirador

16 of 57

Cas d’usage : médiation

Médiation numérique, �diffusion, participation �des publics

ressources

outils : Storiiies, Exhibit, Leaflet-IIIF, TIFY...

Storiiies 

Leaflet-IIIF 

Collections IIIF 

https://gallica.bnf.fr/blog

https://www.bnf.fr/fr/itineraires-de-decouverte-dans-le-schema-numerique�

17 of 57

En savoir plus

api.bnf.fr

Documentation

Tutoriels, exemples

Jeux de données

18 of 57

En savoir plus

api.bnf.fr

Console Swagger �de test des API�

19 of 57

Le projet MODOAP

Julien Schuh, maître de conférence à l’université Paris Nanterre, projet MODOAP : �utilisation des API Gallica dans le contexte d’un projet de recherche �en humanités numériques

20 of 57

https://modoap.huma-num.fr/

21 of 57

Schéma du protocole de traitement

22 of 57

Projet Manuels

Utilisation des outils destinés aux images et au texte sur un corpus de manuels scolaires et de guides de voyage historiques:

  • Segmentation des images dans les documents
  • Classification sémantique des illustrations et du texte
  • Traitements textométriques et plongements lexicaux sur le contenu des documents
  • Etude de la structure des documents (relation entre contenu et mise en page)

23 of 57

Projet Kagan

Utilisation des outils destinés aux images sur un corpus de photographies d’Elie Kagan :

  • Repérage d’éléments dans les photographies
  • Classification sémantique des photographies
  • Recherche des photographies identiques dans des corpus extérieurs (publications de périodiques)

24 of 57

Extraction de corpus

25 of 57

Production de fichiers dans un format pivot (json)

26 of 57

Extraction automatique d’illustrations

27 of 57

Entraînement de modèles de segmentation

28 of 57

Utilisation de l’OLR pour l’entraînement de modèles

29 of 57

Sparnatural

Thomas Francart, consultant senior sur le web de données et la mise en place �de graphes de connaissances, société Sparna (http://blog.sparna.fr)

Sparnatural : Interface de recherche / exploration intuitive du graphe sémantique des données de la BnF data.bnf.fr avec le langage SPARQL

30 of 57

data.bnf.fr/sparql

Diffusion des données de la BNF dans un graphe de connaissances riche.

Permet de traverser le graphe suivant de nombreux axes.

31 of 57

Un aperçu de la structure du graphe que l’on peut parcourir dans data.bnf.fr.

Une des valeurs ajoutées fortes dans ce mode d’exposition des données : le regroupement des notices d’édition de la même oeuvre (modèle FRBR).

32 of 57

SPARQL pour moi ou SPARQL pour vous ?

SPARQL pour moi (développeur informatique) : http://data.bnf.fr/sparql

SPARQL pour tout le monde : http://sparnatural.eu/demos/demo-bnf

33 of 57

Sparnatural est un composant Javascript permettant d’explorer un graphe de connaissances en créant des requêtes SPARQL de façon intuitive.

Sparnatural est configurable pour s’adapter à toutes les structures de graphes.

Autres démos disponibles : DBPedia, Journal Officiel du Luxembourg

Voir également le projet OpenArchaeo : http://openarchaeo.huma-num.fr/

34 of 57

Vidéo de démo YouTube : Sparnatural - demo data.bnf.fr

Screencast :

  • Screencast 1
  • Screencast 2

35 of 57

Les oeuvres de Baudelaire

Les oeuvres auxquelles Baudelaire a contribué (comme traducteur d’Edgard Allan Poe par exemple)

36 of 57

… en anglais

Les éditions d’une oeuvre de Baudelaire ...

37 of 57

… ou en basque, en occitan ou breton ?

38 of 57

… de 1857

Les spectacles adaptés d’une oeuvre de Baudelaire...

39 of 57

Voir le SPARQL

40 of 57

L’enjeu

Vous avez construit un graphe de connaissances… et maintenant ?

Comment valoriser ce graphe de connaissances dans une expérience utilisateur en tant que graphe ?

Et non pas en tant que : champ de recherche (à la Google), listes de résultats, filtrage à facettes (à la Amazon), fiches d’entités (à la Wikipedia)..

Une nouvelle modalité d’accès à l’information : l’exploration de graphe

41 of 57

Masques

Léane Beauquis et Kélit Raynaud, étudiants de l’Ecole Estienne et d’INA SUP, workshop interécole DSAA DCN (Ecole Estienne) et INA SUP : utilisation de l’API IIIF de Gallica pour l’accès aux images de la collection de masques numérisés du département �des Arts du spectacle de la BnF

https://www.jpo-2021.ecole-estienne.paris/dsaa-design-cr%C3%A9ation-num%C3%A9rique

https://www.linkedin.com/in/kelitraynaud/�https://www.linkedin.com/in/léane-beauquis-1a9b921b1/

42 of 57

43 of 57

44 of 57

45 of 57

46 of 57

47 of 57

48 of 57

49 of 57

50 of 57

51 of 57

52 of 57

53 of 57

54 of 57

55 of 57

56 of 57

57 of 57

Temps de questions / réponses

Contact :

  • gallica@bnf.fr
  • coordination-bibliographique@bnf.fr