Comment publier un jeu de données sur data.gouv.fr

Guide pour publier un jeu de données sur le portail des Données Publiques National “data.gouv.fr” opéré par la mission interministérielle Etalab.

Source : OpenDataFrance - Licence : CC-BY-SA

Version : v2.0, date : juillet 2022

Crédits : Ce document a été réalisé à partir du tutoriel publié par OpendataLab (Préfecture de région Occitanie) et le SICOVAL pour accompagner les communes se lançant dans l’opendata. Ce document s’est lui-même appuyé sur le guide d’utilisation de l’API Data.gouv produit par la mission Etalab : https://www.data.gouv.fr/fr/pages/onboarding/producteurs/ Il a été complété par OpenDataFrance lorsqu’il a été nécessaire de généraliser la fiche pour un usage au niveau national. Nous remercions la préfecture de région Occitanie et le SICOVAL pour leur contribution.

Contexte

Le portail national data.gouv.fr permet à tout acteur public de créer un domaine pour sa collectivité et d’y publier gratuitement tous les jeux de données qu’il souhaite ouvrir.

Qui est considéré comme producteur de données ?

Le producteur d'une base de données, entendu comme la personne qui prend l'initiative et le risque des investissements correspondants, bénéficie d'une protection du contenu de la base lorsque la constitution, la vérification ou la présentation de celui-ci atteste d'un investissement financier, matériel ou humain substantiel. Cette protection est indépendante et s'exerce sans préjudice de celle résultant du droit d'auteur ou d'un autre droit sur la base de données ou un de ses éléments constitutifs. Source Legifrance

Les services publics certifiés

Les organisations inscrites sur la plateforme « data.gouv.fr » estimant assurer une mission de service public peuvent effectuer une demande en ligne pour être reconnue comme telle. Une organisation certifiée bénéficie d’un meilleur référencement. Pour devenir un service public certifié, inscrivez-vous sur le site en tant qu’organisation, puis effectuez la demande sur la page suivante : https://doc.data.gouv.fr/organisations/certifier-une-organisation/. Une vérification par email ou courrier vous sera demandée. Vous pouvez néanmoins commencer à publier vos jeux de données avant d’obtenir le badge de certification.

Qu'est qu'un jeu de données ?

Un jeu de données peut contenir plusieurs ressources (fichiers de données, fichiers d'explications, API, liens...) qui constituent un lot cohérent sur un thème donné. Par exemple «La Réserve Parlementaire», contiendra plusieurs ressources, typiquement un fichier par année.

Comment en tant que producteur, puis-je publier des jeux de données ?

Créez un compte sur « data.gouv.fr ». Dès que vous serez inscrit, vous pourrez «contribuez» et «publier un jeu de données».

Un jeu de données peut être publié simplement avec un titre et une ressource. Pour autant, il sera mieux référencé s'il contient des informations supplémentaires qui le décrivent : période couverte, fréquence de mise à jour, territoire couvert, thématiques…

Publier un jeu de données sur data.gouv.fr

Pour plus de précision, voir le guide publié par Etalab sur data.gouv.

Créer un compte

Au préalable de la publication des données sur data.gouv.fr, il faut avoir créé un compte en tant que producteur. Cela se passe ici : https://doc.data.gouv.fr/gestion-du-compte/creer-un-compte/

Créer l'organisation

Vous devez par sécurité vérifiez que votre collectivité n’existe déjà pas dans les entités connues par Etalab (déclarée par un collègue par exemple, ou déclarée automatiquement par Etalab dans certaines conditions).

Si le nom de votre organisation est bien libre, créez votre organisation : https://doc.data.gouv.fr/organisations/creer-une-organisation/ C'est une responsabilité importante, assurez vous d'avoir la légitimité pour le faire et soyez précis et complet dans les éléments que vous enregistrez. Il sera toujours possible de corriger, voire de supprimer, la fiche Organisation mais prenez dés le début de bonnes habitudes.

Le libellé de la structure doit respecter des règles implicites pour faciliter la découverte et clarifier sans ambiguité l'organisation :

  • Nom juridique exact de la structure :

    • valable : Rennes

    • non valable : Ville (de) RENNES, Mairie de Rennes, etc

  • Lorsque qu'il s'agit d'un organisme associé, le préciser :

    • VIB (opérateur Vélo Libre Service Brest)

Publication d'un jeu de données

Les règles de publication se trouvent sur la même page : https://doc.data.gouv.fr/jeux-de-donnees/publier-un-jeu-de-donnees/

Sur certaines données vous avez la possibilité de vérifier s'il existe un schéma de description pour la ou les données concernées (Délibérations, subventions, DAE...) : https://publier.etalab.studio/

Vous serez ainsi certain.e de publier vos données dans un format déjà défini, d'en vérifier la structure et la conformité à son schéma.

Affectation de Ressources à un jeu de données

Un jeu de données peut contenir plusieurs ressources (exemple : le jeu de données des statistiques des bibliothèques de Grenoble comprend la liste des 17 bibliothèques municipales de Grenoble, puis 6 éléments statistiques concernant ces bibliothèques (Nombre de prêts annuels de 2008 jusqu'à 2016, Nombre d'inscrits de 2008 jusqu'à 2016, Nombre d'emprunteurs de 2008 jusqu'à 2016, Nombre de visiteurs de 2008 jusqu'à 2016, Catégorie socio-professionnelle des emprunteurs depuis 2012 jusqu'à 2016....

Ces fichiers peuvent être dans des formats différents (XLS, CSV, json, geojson...) mais aussi avoir une emprise géographique ou temporelle différente. Il est donc nécessaire de bien veiller à ce que la description de ces ressources soit correctement effectuée ; tout est ici : https://doc.data.gouv.fr/jeux-de-donnees/difference-jeu-de-donnees-et-ressource/

Dernière mise à jour