La qualité des données : 2h30 pour démarrer
@CharlesNepote, @La_Fing
Licence Creative Commons CC-BY
Programme
Échauffement collectif : le jeu des 20 erreurs
10 minutes pour trouver un maximum d’erreurs sur les 20 présentes.
Qu’en retenez-vous ?
Le jeu et ses solutions :�http://infolabs.io/qdd-jeu-des-20-erreurs
La qualité des données : pourquoi faire ?
Le sujet le plus sexy du domaine de la data !
Non ?
Ok, non…
TEST
Quand vous êtes-vous dit pour la dernière fois : “ooooh mais elle est super propre cette donnée”?
Qualité des données, quel est le problème ?
Qualité des données,
l’approche par les usages
Qualité des données,
l’approche par les coûts
Qualité des données,
les nouvelles opportunités
Les mains dans le cambouis : le sprint qualité
Le sprint qualité : la méthodo�que le monde nous envie
Le sprint qualité :
exemple de point de contrôle
ID32�“Le nom ou titre du jeu de données est vague, ambigu ou trop complexe”
Le sprint qualité :
exemple de point de contrôle
ID32�“Le nom ou titre du jeu de données est vague, ambigu ou trop complexe”
Le sprint qualité :
8 grands domaines
Le sprint qualité :
le rapport qualité
Le sprint qualité “allégé” : 10 points incontournables
Le sprint qualité “allégé” : 10 points incontournables
Les mains dans le cambouis (30’)
La qualité des données : règles d’or, outils et méthodes
Les 7 règles d’or de la qualité des données
Datablitz : collecte collaborative intensive
Data Storytelling
Données “métier”
Tous types de données
Mise en oeuvre plus difficile
Mise en oeuvre simple
Expédition de données
Datacamps, barcamps, camps...
Méthodo : liste des données idéales
Outils de dataviz
Sprint Qualité
en italique les projets/outils “live” ou prêts à l’emploi
Cartopartie : carto collaborative
Osmose
Le jeu des 20 erreurs
Système d’information géographique (SIG)
Mapillary
Validata
CVDTC (données de transport)
Qualité des données : petit guide collaboratif de survie
Produire un CSV de qualité
Qualité des données : panorama des outils et méthodes
Conformité au Socle commun des données locales (SCDL)
Règle 1 : producteurs et utilisateurs tu associeras
Règle 2 : le jeu de données tu documenteras
Règle 3 : des données facilement réutilisables, tu produiras
Règle 4 :�les standards, tu adopteras
Règle 5 :�la qualité, tu contrôleras
Règle 6 :�la correction, tu organiseras
Règle 7 :�trop de qualité, tu éviteras
Qualité des données :
petit guide collaboratif de survie
Aller plus loin
Validata
Validata ?
Validata�Usage en pratique
Passons à la pratique avec vos données !
Validata�Vos retours