Ressources OpenDataFrance
OpenDataLocaleSocle Commun des Données Locales
  • Description des ressources
  • Les enjeux politiques et stratégiques de la donnée
    • Les enjeux politiques et stratégiques
      • 1 - Transparence
      • 2 - Conformité réglementaire
      • 3 - Transformation
      • 4 - Confiance
      • 5 - Souveraineté
      • 6 - Gouvernance et coopération
      • 7 - Valorisation
      • 8 - Pilotage
      • 9 - Transition
      • Dossier "Enjeux politiques et stratégiques de la donnée" (version imprimable)
  • Guides méthodologiques
    • Comprendre
      • Définition : les données
      • Le glossaire de la donnée
      • Définition : Les données ouvertes
      • Ouvrir les données : une obligation légale
        • Ouvrir les données pour la démocratie
        • Ouvrir les données pour la modernisation de l’action publique
        • Ouvrir les données pour l’innovation économique
      • Inventaire juridique sur les données
      • Guide pédagogique RGPD
      • Comprendre le cycle de vie des données
      • Les métiers autour des données
      • Les acteurs publics de l’ouverture des données
      • Les acteurs associatifs de l’ouverture des données
      • Les acteurs économiques de l’ouverture des données
      • 10 commandements de l'ouverture des données publiques
      • Les premières étapes pour s’engager dans une démarche d’ouverture des données
      • Les dispositifs de publication des données en open data
      • La conduite de projet
    • Produire
      • Choix des licences open data
      • Foire aux questions sur la licence ODbL
      • Comment publier en open data en présence de données à caractère personnel
      • Les données prioritaires
      • Documenter les données avant publication
      • Produire un fichier CSV de qualité
      • Choisir un portail open data
      • Comment publier un jeu de données sur data.gouv.fr
      • Jeux de données des communes les plus fréquemment ouverts
      • Comment afficher sur son site web des données publiées sur data.gouv.fr
        • Préparer les données pour une publication en open data
      • Recommandations pour favoriser l'interopérabilité des données open data
      • Prestataires Conseil et Formation en open data
    • Animer
      • Dataposition Agent/Elu
      • Animation territoriale open data
        • Le Programme OpenDataLocale
        • Identifier les collectivités de son périmètre d'intervention
        • Convention d'accompagnement
      • Les réutilisations de données
      • Les tiers-lieux et acteurs de la médiation numérique
      • Les Infolabs
      • Autres formats d’animation de l’ouverture des données
      • Hackathon
      • Cartopartie
      • Transparence, Concertation, Observatoire
    • Réutiliser
    • Modèles de documents utiles
      • Exemple de délibération en vue du lancement d’un projet open data dans une commune
      • Consultation pour un portail OpenData
      • Mentions légales pour un portail open data
      • Exemple d'accord Cadre sur l'accompagnement d'une démarche Data
      • Clauses à insérer dans les marchés publics
      • Fiche de poste Chef de projet Data
  • GUIDES THEMATIQUES
    • DataEditorial
    • Données et transition
    • GreenData
    • CultureD
  • Formations
    • CultureD
      • Modules complémentaires de formation (CultureD)
        • PA-AM1 : La donnée: pourquoi s'y intéresser? De sa création à son exploitation
        • PA-AM 2 : Maitriser les fonctions de base d'un tableur
    • Formations en ligne (MOOC)
      • La donnée au coeur de la transformation numérique des territoires, comprendre et agir.
      • Programme e-Learning du Portail Européen de Données
    • MasterClass Dataviz
    • Autres supports de formation
      • L'ouverture des données publiques pour et par les collectivités territoriales
      • Archives
        • Comprendre l'open data
        • Mener un projet d'ouverture de données dans ma collectivité
    • Webinaires
      • Le Mois de la Data (ODF)
      • La data dans les territoires (ODF/Cerema)
      • L'open data et vous (CNFPT/Cerema/ODF)
      • Webinaires TNT
        • Webinaire DCANT #5 - Comment mettre en œuvre l'open data dans les territoires
        • Webinaire DCANT #10 - RGPD et collectivités territoriales
        • Webinaire DCANT #13 - Moissonnage des données territoriales sur datagouv
    • Jeux sérieux
      • Les explorateurs des données territoriales
      • Belle Colline
      • Datopolis
  • Outillages
    • DataClic
    • D-Lyne
    • GéoDataMine
    • Standards des données ouvertes
    • Validata
    • Publier.etalab.io
  • Algorithmes et IA
    • Préambule sur les algorithmes
    • 1 - Règlementations
    • 2 - Recommandations de la CNIL
    • 3 - Guides et Recommandations de l'Etat (DINUM / Etalab)
    • 4 - Autres sources
    • 5 - Exemples et Chartes Territoriales
    • 6 - Inventaire de cas d'usage de l'IA dans les collectivités locales et bonnes pratiques
    • 7 - L'actualité IA
      • Actu IA
      • Lancement officel de l'expérimentaiotn IA générative au sein de la fonction publique
      • La CNIL ouvre une consultation sur la constitution de bases de données d’apprentissage | CNIL [fiche
      • Comment les collectivités se préparent à l'arrivée de l'IA ?
      • Vers un IA Act en Europe… ce qu'il faut retenir du projet de réglementation
      • L'IGN combine IA et open data pour cartographier les fermes solaires
      • Quels régimes de régulation des données pour entraîner les IA ?
      • Enquête sur les profils métiers de l'IA
      • L’Espagne se dote de la première agence de supervision de l’IA en Europe
      • DSI : l'intelligence artificielle au sommet des priorités
      • L'IA pilotée par les données : pierre angulaire de l'innovation
      • France 2030 : les inscriptions pour la seconde vague de l'AAP DIAT sont toujours ouvertes
      • Pourquoi l'open source est le berceau de l'intelligence artificielle
      • L’intelligence artificielle peut optimiser la gestion d’un équipement existant
      • Le gouvernement crée un comité d’experts pour d’établir sa stratégie autour de l’IA générative
      • IA Microsoft couvrira ses clients en cas de poursuite pour violation de propriété intellectuelle
  • RGPD - Protection des données personnelles
    • L'atelier RGPD de la CNIL
    • Kit RGPD de Mégalis Bretagne
  • Ressources complémentaires
    • Fiches OpenDataLab (Occitanie)
    • Etude Cycle de la donnée et transformation du SI (FNCCR)
    • Guide pratique opendata du ministère de la culture
    • Open Data Canvas
    • 1, 2, 3 data, expérimenter !
  • Vidéos pédagogiques tierces
    • Le b.a.-ba de la donnée
    • L'open data à la loupe
    • Grand Lyon Data
    • Open data et secteur public
  • EUROPE ET DONNEES
    • Projets open data en Europe
      • Commission européenne
      • Belgique
    • Références et Actualités
      • Le data Act est adopté par le Parlement
      • Les États membres arrêtent une position commune sur l'équité de l'accès aux données
      • Data Act: MEPs back new rules for fair access to and use of industrial data
      • L'Europe multiplie les initiatives pour réglementer l'IA avant l'heure (Les Echos)
  • Espace ressources partenaires
    • Agence Nationale de la Cohésion des Territoires
    • Etalab
    • INET
    • ECOLAB / CGDD / MTE
  • Group 1
Propulsé par GitBook
Sur cette page
  • Contexte
  • Utilisation des normes existantes
  • Quelles sont les métadonnées essentielles ?
  • Focus sur certaines métadonnées
  • Gestion des métadonnées
  • Création des métadonnées
  • Stocker les métadonnées : quelles sont les options?
  • Qualité des métadonnées
  • Quelques exemples de fiches métadonnées
Exporter en PDF
  1. Guides méthodologiques
  2. Produire

Documenter les données avant publication

Quelques conseils pour rédiger une fiche métadonnée associée au jeu de données et la tenir à jour.

PrécédentLes données prioritairesSuivantProduire un fichier CSV de qualité

Dernière mise à jour il y a 2 ans

Source : OpenDataFrance - Licence : CC-BY-SA

Version : v2.0, date : juillet 2022

Contexte

Les métadonnées sont de l’information structurée qui décrit, explique, localise ou facilite l’obtention, l’utilisation ou la gestion d’une ressource d’information.

Les métadonnées fournissent des informations permettant de comprendre des données. Par exemple, dans les achats de tous les jours, une étiquette fournit des informations sur un produit (composition, origine, date limite de consommation), c’est une métadonnée. Les métadonnées sont des “données sur les données”. Ce sont plus précisement une description normalisée du contenu des jeux de données publiées, c’est donc un élément essentiel dans le processus de publication des données.

Il est important de s’appuyer sur des formats de métadonnées reconnus pour s’assurer de leur pertinence (les données nécessaires) et de leur format (la façon dont on les a structuré et codifié). Les métadonnées ainsi homogénéisées permettent le fonctionnement des plateformes d’échange de métadonnées, qui peuvent à leur tour réduire les barrières d'accès aux ressources, conduisant à une meilleure visibilité, et donc augmentent leur potentiel de réutilisation. Dans de nombreux cas, c’est le portail qui héberge les données qui propose un format pour les métadonnées. Ceux-ci sont généralement en conformité avec les standards internationaux.

Utilisation des normes existantes

Il est important de s’appuyer sur des standards internationaux pour rendre les métadonnées cohérentes et exploitables. Il en existe de nombreuses (c’est un défaut...) mais elles ont des points communs et sont assez structurantes :

Normes et spécifications à usage général : ● Dublin Core pour les documents publiés (textes, images),

Norme spécifique pour les ensembles de données : ● Vocabulaire pour les Catalogue de Données DCAT,

Usage spécifique de DCAT et d’autres vocabulaires pour soutenir l'interopérabilité des portails de données à travers l'Europe: ● Profil applicatif DCAT pour les portails de données en Europe,

Dans le cadre du projet OpenDataLocale, la norme DCAT, la plus courante et adaptée à l’open data, a été utilisée et légèrement simplifiée pour un usage courant. Le contenu et le format de métadonnées est décrit dans la spécification du jeu de donnée CATALOGUE du .

Quelles sont les métadonnées essentielles ?

Les données d'un catalogue sont essentiellement :

  • Titre du jeu de données

  • Description libre de l'objet et du contenu de la donnée

  • Thème du jeu de données

  • Nom de la structure qui diffuse la donnée

  • Nom de la structure qui crée produit la donnée

  • ​Nom de la structure qui gère la donnée

  • Couverture spatiale sur lequel s'appliquent les données

  • Début/Fin de la Plage temporelle couverte par les données

  • ​Fin de la Plage temporelle couverte par les données

  • ​Date de la première publication

  • ​Fréquence de la mise à jour

  • ​Date de la dernière mise à jour publiée

  • Mots-clés permettant des recherches libres

  • ​Licence appliquée sur le jeu de données

  • Liste des formats dans lesquels sont publiées les données

  • Code de la projection géographique quand cela s’applique

  • Langue du jeu de données

  • Liens vers les ressources accessibles

Focus sur certaines métadonnées

THEME​

Les thèmes peuvent être choisis et codifiés librement par les collectivités (voirie, transport, ...). Il est cependant souhaitable de les normaliser pour faciliter des recherches croisées et des sélections dans les gisements de données publiées au niveau national. Un projet de normalisation des thèmes est en cours d’élaboration. Il est recommandé de l’appliquer.

PRODUCTEUR

Ce champ permet de désigner le service ou l’organisme qui produit la donnée.

MOT_CLES

Ce champ permet d’attribuer des tags (ou mots-clés) pour faciliter la recherche des données. Les mots-clés sont totalement libres pour les collectivités. (par ex : “jardins”, “points d’eau”, “mobilité”).

LICENCE

C’est une donnée indispensable qui attribue une licence à un jeu de données. La pratique d’attribution d’une licence à un portail est abusive, même si elle permet de simplifier les déclarations des licences de chaque jeu de données qui héritent ainsi de la licence indiqué sur le portail. Les Licences décrivent le droits et devoirs des Producteurs et des Réutilisateurs du jeu de données concerné.

En pratique, dans le cas des données publiées à titre gratuit, et en vertu du décret publié par l’état sur les licences homologuées, le choix se porte sur deux licences :

  • Licence Ouverte

  • ODBL (OpenDataBaseLicence)

Décret n° 2017-638 du 27 avril 2017 relatif aux licences de réutilisation à titre gratuit des informations publiques et aux modalités de leur homologation.

Un document produit dans le cadre d’OpenDataLocale présente les licences, leur portée et les avantages/inconvénients. Dans la majorité des cas, la Licence Ouverte, LO v2​, répond très bien aux besoins des collectivités. L'usage d'ODBL doit être fait avec prudence en raison des restrictions qu'elle engendre.

Gestion des métadonnées

Les métadonnées doivent être gérées pour assurer leur :

  • Disponibilité : les métadonnées doivent être stockées où elles peuvent être consultées et indexées afin de pouvoir être trouvées

  • Qualité : les métadonnées doivent être de qualité constante afin que les utilisateurs sachent qu'ils peuvent y faire confiance

  • Persistance : les métadonnées doivent être entretenues au fil du temps

  • Licence ouverte : les métadonnées devraient être disponibles sous une licence du domaine public pour permettre leur réutilisation

Le cycle de vie de métadonnées est plus grand que le cycle de vie des données :

  • Les métadonnées peuvent être créées avant que les données ne soient créées ou capturées, par exemple, pour informer sur les données qui seront disponibles dans le futur.

  • Les métadonnées doivent être conservées après que les données ont été supprimées, par exemple, pour informer sur les données qui ont été déclassées ou retirées.

Création des métadonnées

La création de métadonnées peut être prise en charge par des processus (semi)automatiques :

  • Les propriétés de documents générées par des outils bureautiques, par exemple la date de création d’un document.

  • Informations spatiales et temporelles capturées par des caméras, des capteurs

  • Informations issues du processus de publication, par exemple l'emplacement de fichier ou l'URL.

Cependant, d'autres caractéristiques requièrent une intervention humaine :

  • L'objet de la ressource (par exemple un lien vers le vocabulaire d’un sujet)?

  • L'utilisation de la ressource (par exemple un lien vers une licence)?

  • L'information sur la ressource (par exemple un lien vers un site Web ou de la documentation qui décrit la ressource)?

  • Comment de l'information de qualité peut être incluse?

Stocker les métadonnées : quelles sont les options?

En fonction des exigences opérationnelles, les métadonnées peuvent être intégrées avec les données ou stockées séparément des données.

  • Intégrer les métadonnées dans les données (par ex. onglet d’un fichier tabulaire) facilite l'échange de données.

  • La séparation des métadonnées et des données avec des liens vers des fichiers de données correspondants rend la gestion plus facile. C’est le cas le plus courant que l’on retrouve dans la plupart des portails open data

Qualité des métadonnées

La qualité et l'exhaustivité des métadonnées de description des données influent directement sur leur visibilité et leur réutilisation.

  • La précision des métadonnées : est-ce que les caractéristiques de la ressource suffisamment éditorialisées (par ex. indiquer le bon titre, une licence explicite)

  • L‘exhaustivité des métadonnées : est-ce que toutes les caractéristiques pertinentes de la ressource sont documentées ? (par ex. la fréquence de mise à jour permet de s’assurer de la fraicheur de la donnée)

  • La conformité des métadonnées aux normes acceptées : est ce que les métadonnées sont conformes à une norme spécifique de métadonnées ? (par ex. la description d’un ensemble de données doit être conforme à la normalisation du Socle Commun des Données Locales ou le référentiel international DCAT).

  • La cohérence et la provenance des métadonnées : sont-elles basées sur des sources fiables (en général le Producteur) ?

  • La capacité de traitement des métadonnées : les métadonnées sont-elles correctement lisibles par machine? (par ex. en rendant disponible les métadonnées en RDF et/ou XML, et non en texte libre).

Quelques exemples de fiches métadonnées

http://dublincore.org/documents/dcmi-terms
http://www.w3.org/TR/vocab-dcat/
http://joinup.ec.europa.eu/asset/dcat_application_profile/description
Socle Commun des Données Locales
https://www.legifrance.gouv.fr/loda/id/JORFTEXT000034502557/
Fiche de métadonnées sur le portail data.gouv.fr
Fiche de métadonnées sur le portail OpenDataSoft