BP 3 - Standardiser les jeux de données

Priorité :

Mise en œuvre :

Exemple de pilote : Délégué ou référent aux données ouvertes et responsables

Exemple(s) d’indicateur(s) de pilotage

  • % de données ouvertes publiées associés à un schéma de données

Contexte

Afin de garantir leur qualité et leur interopérabilité, certains jeux de données font l'objet d'une standardisation. Les données standardisées sont choisies en fonction des demandes et des usages les plus fréquents.

La standardisation des données offrent un cadre méthodologique et technique à la publication. Elle vise à préciser quels sont les données essentielles, les formats préconisés (codification, unité, ...), la structure du jeu de donnée (ordre de présentation, données obligatoires, ..).

La standardisation des données est un gage de qualité donc de réutilisation et un bénéfice potentiellement positif au regard du coût écologique de sa publication.

L'utilisation de standard, comme proposé à travers le Socle Commun des Locales :

  • invite les collectivités à prioriser l'ouverture des données territoriales particulièrement intéressantes dans le champ de la transparence ou de la création de services, et pouvant constituer un socle national

  • aide les producteurs à ouvrir et à améliorer la qualité des données qu'ils publient.

  • facilite l'interopérabilité des données et leurs exploitations par les réutilisateurs (agrégation, consolidation et traitements automatiques).

Description de la bonne pratique

1- Voir et étudier les standards de données existants

Publier les données selon les standards disponibles chaque fois que cela est possible.

Les schémas disponibles, en cours d'élaboration ou à proposer sont accessibles via schema.data.gouv.fr. Ce service aide les producteurs de données à connaître et comprendre les gabarits de données attendus.

La documentation des schémas précise les modèles de données :

  • Description des données essentielles,

  • Format (chaîne de caractères, nombre entier, géolocalisation à x décimales, date...)

  • Champ obligatoire ou optionnel,

  • Modalité de mise à jour,

  • etc ...

2 - Associer un jeu de données à un schéma existant

Il est recommander d'indiquer si un jeu de données correspond à un schéma depuis l'interface d'administration de data.gouv.fr. Le fait d'indiquer qu'une ressource respecte un schéma permet de bénéficier de vérifications de la qualité des données et d'indiquer aux réutilisateurs que vos données respectent un standard.

Certains producteurs choisissent de faire figurer dans le titre ou la description si le jeu de donnée est associé à un standard. Il serait aussi envisageable de le préciser dans les métadonnées, en intégrant dans la description un lien à la documentation du standard utilisé.

3 - Encadrer les prestataires pour garantir la compatibilité de jeux de données produits aux schémas existants

Lorsque les données produites dans un cadre de marché le titulaire peut être tenu de transmettre ces données à la collectivité dans les formats décrits dans le standard.

Les formats de transmission des données autres que celles mentionnées dans le référentiel national Socle Commun des Données Locales, seront transmises à la collectivité sous un format ouvert qui devra être décrit dans le mémoire technique. Voir : https://opendatafrance.gitbook.io/odl-ressources/fiches-pratiques/aspects-juridiques/clause-a-inserer-dans-les-marches-publics

4 - Participer à l'élaboration des standards

Les standards ne sont pas imposés par une "force" extérieure. C'est un référentiel collectif qui doit être enrichi et entretenu par tous les producteurs potentiels de données au profit des usagers finaux. Vous pouvez donc participer à l'élaboration de standards qui vous paraissent pertinents, ou demander des évolutions dans les standards existants pour les rendre plus aisés à respecter en fonction de vos contraintes de production.

Retour d'expérience

Pour garantir la réutilisation de ses données la ville de Pirae a fait le choix de ne publier que des données standardisées. Ville de Pirae - Données ouvertes basés sur le SCDL

Aussi, afin d'encourager les réutilisation, les données ouvertes accessibles sur data.gouv.fr/fr/datasets/ proposent un filtrage par schémas.

Ressources

Pour faciliter la consultation et récupération des jeux de données, il convient de les publier dans un format ouvert, standard, et non-propriétaire. Pour chaque grand type de données, il existe un ou plusieurs format standard, communément accepté et reconnu par la communauté d'utilisateurs et d'agents. https://www.numerique.gouv.fr/uploads/Referentiel_General_Interoperabilite_V2.pdf

Dernière mise à jour