# BP 8 - Faciliter la découvrabilité des jeux de données

{% hint style="info" %}
**Priorité :**&#x20;

* [x] **prioritaire,**&#x20;
* [ ] recommandée,
* [ ] pour aller plus loin
  {% endhint %}

{% hint style="info" %}
**Mise en œuvre :**&#x20;

* [ ] facile,&#x20;
* [x] **moyenne**,&#x20;
* [ ] difficile
  {% endhint %}

{% hint style="info" %}
Exemple de pilote : Référent aux données ouvertes et responsables
{% endhint %}

{% hint style="info" %}
**Exemple(s) d’indicateur(s) de pilotage** <br>

* nombre (ou %) de jeux de données récupérés par API
* nombre (ou %) de jeux de données référencés sur plus d'un portail
  {% endhint %}

## Contexte&#x20;

Les données dupliquées et redondantes consomment des ressources matérielles (les disques de stockage) et de façon récurrente de l’énergie (pour la redondance). Cette pratique vise à **faciliter la découvrabilité des données plutôt que leur duplication** afin de libérer de l’espace sur le stockage et d'optimiser l'utilisation de données ouvertes.&#x20;

Plus la donnée est référencée, plus elle est susceptible d’être identifiée et donc utilisée. De fait son coût, technologique et environnemental, peut-être justifié par les usages qu’offre la donnée.&#x20;

Développer le référencement permet pour le producteur de données de :&#x20;

* Faciliter et mieux suivre les réutilisations des données,&#x20;
* Permettre des agrégations territoriales ou thématiques
* Faire des économies d’échelle (technique et financières) par la mutualisation,&#x20;

## Description de la bonne pratique

**1 - Eviter la duplication des données**

Afin de réduire l'impact environnemental et le coût de stockage de données ouvertes, il convient de limiter leur duplication et de privilégier le moissonnage des données. Une première étape peut s'intéresser à identifier les redondances des jeux de données volumineux et stratégiques : où les données sont publiées, dupliquées ...&#x20;

**2 - Identifier les lieux de publications de données**&#x20;

Des plateformes de données peuvent référencer et moissonner les (méta)données entre portails. Plutôt que de dupliquer un jeu de données, il est donc préférable d'optimiser son référencement en indexant le jeu de données sur d'autres portails. Par exemple : &#x20;

* plateforme nationale (data.gouv),&#x20;
* plateformes territoriales (échelon régional, départemental, ...),
* plateforme thématique (transport.data.gouv.fr, data.tourisme, geoportail, ...).

**3 - Demander à data.gouv.fr de moissonner votre portail**\
\
Un moissonneur permet d’importer toutes les données d’un portail d’open data. \
Vous pouvez aussi demander au moissonneur de n’importer que certains jeux de données, au moyen de filtres. \
<https://doc.data.gouv.fr/jeux-de-donnees/demander-a-datagouvfr-de-moisonner-votre-site/>

**4 - Maintenir l'accès et la qualité des données produites**&#x20;

Pour maintenir à jour les données référencées et limiter le risque de problème de version des jeux de données sur d'autres plateformes, privilégier un accès aux données par API. Voir la [bp-7-proposer-un-acces-aux-donnees-par-api](https://opendatafrance.gitbook.io/greendata-pour-un-impact-maitrise-des-donnees/greendata/1.2-bonnes-pratiques/bp-7-proposer-un-acces-aux-donnees-par-api "mention").&#x20;

## Retour d'expérience&#x20;

La [ville de Castelnaudary](https://ville-castelnaudary.fr/fr/mairie/open-data) publie ses données ouvertes directement sur le portail data.gouv.fr. L'exposition et la valorisation des données se fait localement, sur le site officiel de la ville : &#x20;

Le portail OpenData de la Région Occitanie référence l'ensemble des [données produites par le Conseil Départementale de l'Hérault ](https://data.laregion.fr/pages/accueil/)et facilite ainsi leur découvrabilité et le croisement de cas d'usages. \ <br>

## Ressources&#x20;

* [Demander à data.gouv.fr de moissonner votre site](https://doc.data.gouv.fr/jeux-de-donnees/demander-a-datagouvfr-de-moisonner-votre-site/)
