BP 8 - Faciliter la découvrabilité des jeux de données
Contexte
Les données dupliquées et redondantes consomment des ressources matérielles (les disques de stockage) et de façon récurrente de l’énergie (pour la redondance). Cette pratique vise à faciliter la découvrabilité des données plutôt que leur duplication afin de libérer de l’espace sur le stockage et d'optimiser l'utilisation de données ouvertes.
Plus la donnée est référencée, plus elle est susceptible d’être identifiée et donc utilisée. De fait son coût, technologique et environnemental, peut-être justifié par les usages qu’offre la donnée.
Développer le référencement permet pour le producteur de données de :
Faciliter et mieux suivre les réutilisations des données,
Permettre des agrégations territoriales ou thématiques
Faire des économies d’échelle (technique et financières) par la mutualisation,
Description de la bonne pratique
1 - Eviter la duplication des données
Afin de réduire l'impact environnemental et le coût de stockage de données ouvertes, il convient de limiter leur duplication et de privilégier le moissonnage des données. Une première étape peut s'intéresser à identifier les redondances des jeux de données volumineux et stratégiques : où les données sont publiées, dupliquées ...
2 - Identifier les lieux de publications de données
Des plateformes de données peuvent référencer et moissonner les (méta)données entre portails. Plutôt que de dupliquer un jeu de données, il est donc préférable d'optimiser son référencement en indexant le jeu de données sur d'autres portails. Par exemple :
plateforme nationale (data.gouv),
plateformes territoriales (échelon régional, départemental, ...),
plateforme thématique (transport.data.gouv.fr, data.tourisme, geoportail, ...).
4 - Maintenir l'accès et la qualité des données produites
Pour maintenir à jour les données référencées et limiter le risque de problème de version des jeux de données sur d'autres plateformes, privilégier un accès aux données par API. Voir la BP 7 - Proposer un accès aux données par API.
Retour d'expérience
Ressources
Dernière mise à jour