BP 8 - Faciliter la découvrabilité des jeux de données

Priorité :

Mise en œuvre :

Exemple de pilote : Référent aux données ouvertes et responsables

Exemple(s) d’indicateur(s) de pilotage

  • nombre (ou %) de jeux de données récupérés par API

  • nombre (ou %) de jeux de données référencés sur plus d'un portail

Contexte

Les données dupliquées et redondantes consomment des ressources matérielles (les disques de stockage) et de façon récurrente de l’énergie (pour la redondance). Cette pratique vise à faciliter la découvrabilité des données plutôt que leur duplication afin de libérer de l’espace sur le stockage et d'optimiser l'utilisation de données ouvertes.

Plus la donnée est référencée, plus elle est susceptible d’être identifiée et donc utilisée. De fait son coût, technologique et environnemental, peut-être justifié par les usages qu’offre la donnée.

Développer le référencement permet pour le producteur de données de :

  • Faciliter et mieux suivre les réutilisations des données,

  • Permettre des agrégations territoriales ou thématiques

  • Faire des économies d’échelle (technique et financières) par la mutualisation,

Description de la bonne pratique

1 - Eviter la duplication des données

Afin de réduire l'impact environnemental et le coût de stockage de données ouvertes, il convient de limiter leur duplication et de privilégier le moissonnage des données. Une première étape peut s'intéresser à identifier les redondances des jeux de données volumineux et stratégiques : où les données sont publiées, dupliquées ...

2 - Identifier les lieux de publications de données

Des plateformes de données peuvent référencer et moissonner les (méta)données entre portails. Plutôt que de dupliquer un jeu de données, il est donc préférable d'optimiser son référencement en indexant le jeu de données sur d'autres portails. Par exemple :

  • plateforme nationale (data.gouv),

  • plateformes territoriales (échelon régional, départemental, ...),

  • plateforme thématique (transport.data.gouv.fr, data.tourisme, geoportail, ...).

3 - Demander à data.gouv.fr de moissonner votre portail Un moissonneur permet d’importer toutes les données d’un portail d’open data. Vous pouvez aussi demander au moissonneur de n’importer que certains jeux de données, au moyen de filtres. https://doc.data.gouv.fr/jeux-de-donnees/demander-a-datagouvfr-de-moisonner-votre-site/

4 - Maintenir l'accès et la qualité des données produites

Pour maintenir à jour les données référencées et limiter le risque de problème de version des jeux de données sur d'autres plateformes, privilégier un accès aux données par API. Voir la BP 7 - Proposer un accès aux données par API.

Retour d'expérience

La ville de Castelnaudary publie ses données ouvertes directement sur le portail data.gouv.fr. L'exposition et la valorisation des données se fait localement, sur le site officiel de la ville :

Le portail OpenData de la Région Occitanie référence l'ensemble des données produites par le Conseil Départementale de l'Hérault et facilite ainsi leur découvrabilité et le croisement de cas d'usages.

Ressources

Dernière mise à jour