Dispositifs de publication des données en open data

Comme vu dans la fiche “Les premières étapes pour s’engager dans une démarche d’ouverture des données”, les jeux de données, une fois recensés, peuvent être publiés sur le site web de la collectivité avec le répertoire des documents administratifs (dont le catalogue des données publiées). Il existe plusieurs dispositifs de publication :

  • le site internet de l’organisation,

  • les plates-formes de publication de données en open data.

Le site internet de l’organisation

La méthode la plus simple pour publier les données consiste à diffuser les jeux de données directement sur le site internet de la collectivité ou sur des plateformes collaboratives pour les données géographiques. Un tableur constituant le catalogue des données pourra être associé à des liens hypertextes permettant le téléchargement des fichiers. Les données pourront être centralisées au sein d’une rubrique du site internet ou sur une page de type “www.maville.fr/opendata”. Cette méthode de publication est peu onéreuse, rapide à mettre en œuvre et permet de faire porter à connaissance les jeux de données au plus près des citoyens.

Les plates-formes de publication de données en open data

La publication sur une plate-forme de données permet une gestion plus fine pour la production de données (gestion des versions, des téléchargements, des statistiques, mise en place d’API...). Cela apporte des fonctionnalités avancées pour les réutilisateurs (recherche par métadonnées, déclaration des usages, datavisualisations…). Une telle plate-forme, sans nul doute, apporte plus de visibilité aux données publiées.

Ce type d’acquisition se fait plutôt dans le cadre de choix technologiques qui relèvent d’une montée en charge des usages avec des besoins grandissants en termes de réutilisation des données. La mise en place d’un entrepôt de données avec des fonctionnalités de multiformats, de web services (API), d’accès restreint ou temps réel, de visualisation de données s’avère de plus en plus fréquente au sein des collectivités au-dessus d’une certaine taille critique (EPCIs, métropoles, départements, régions…). Cette “mutation technologique” est souvent adossée à une stratégie accompagnant la transformation numérique du territoire, ou les données ouvertes et intelligentes sont un des leviers d’action (Open to Smart Data).

A partir du moment où les données sont hébergées sur une plate-forme, elles peuvent être publiées sur les autres plates-formes existantes. Par exemple, admettons que les données soient déposées sur une plate-forme régionale, celle-ci a très probablement mis des mécanismes pour que les données soient également publiées sur la plate-forme nationale http://www.data.gouv.fr/, qui elle-même verse des données sur unes des plates-formes de données Europénnes comme https://data.europa.eu/. De tels exports de données s’appelle des versements ou des dépôts de données. L’opération inverse est le moissonnage de données, il s’agit d’une opération d’extraction de données. Le moissonnage peut être initié par une plateforme de niveau national (http://www.data.gouv.fr/), de niveau inter-communal (région, département ou EPCI) ou par des tiers qui souhaitent collecter les données en open data.

Acquérir une plate-forme de publication de données en open data

Plusieurs acteurs privés peuvent proposer des prestations pour la fourniture d’une plateforme open data :

  • La plate-forme de données est clé en main et accessibles en mode “SaaS” (Software as a Service). Ce sont par exemple les solutions que proposent les sociétés Mgdis, OpendataSoft, Excelerate Systems, Socrata, Junar….

  • La plate-forme de données est sur la base de solutions Open Source:

    • CKan est vraisemblablement l’offre la plus mature et aboutie,

    • Udata est une solution développée par Etalab sur le même modèle que http://www.data.gouv.fr/,

    • DKan facilite la publication d’articles,

    • Plusieurs projets de collectivités ambitionnent de mutualiser les infrastructures et développements en versant et en documentant les codes sources sous licence libre. C’est ce que propose le syndicat mixte des Alpes maritimes, le Sictiam, avec la plateforme Ozwillo.

    • ...

Publier sur une plate-forme de publication de données en open data

Il est possible de publier les données sur une plate-forme existante. Elles sont soit nationales, soit locales. A minima, la collectivité ne devrait pas faire l'impasse de recenser systématiquement ses données sur http://www.data.gouv.fr/ ou sur une plate-forme locale.

Déposer les données sur une plate-forme nationale

La plate-forme nationale http://www.data.gouv.fr/ est une plate-forme multithématique, administrée par Etalab. Publier les données sur une telle plate-forme est une solution pérenne, opérationnelle et gratuite.

Il existe d’autres plates-formes nationales qui ont une vocation thématique : données du tourisme, données du transport, données culturelles… Quand elles sont publiques, ces plates-formes sont portées par des ministères. Elles ont l’ambition de mettre à disposition des données de qualité. Leurs démarches de publication reposent sur une valorisation du travail interne des producteurs de données, à l’image de ce que propose le Géoportail de l’Urbanisme qui recense les documents d’urbanisme selon des formats homogénéisés.

Déposer les données sur une plate-forme locale

Pour les données géographiques, depuis août 2015, les communes peuvent s’appuyer sur leur région ou leur département, puisque ces dernières ont la charge de « la coordination, au moyen d’une plate-forme de services numériques qu’elle anime, de l’acquisition et de la mise à jour des données géographiques de référence nécessaires à la description détaillée de son territoire ainsi qu’à l’observation et à l’évaluation de ses politiques territoriales, données dont elle favorise l’accès et la réutilisation. » (Code Général des Collectivités Territoriales, art. L4211-1, al. 13, http://frama.link/CGCT_L4211-1). Ce type de plates-formes peuvent proposer des données en open data, voir accueillir des données non-géographiques. De telles plates-formes se sont constituées, entre autres, sous l’impulsion de la directive INSPIRE. Ainsi, elles appliquent des formes de publication tenant compte des standards et normalisations.

Outre cette obligation réglementaire, de nombreux acteurs en charges de compétences territoriales mutualisées proposent des plates-formes de dépôts de données. Il arrive que dans certains territoires, il puisse y avoir plusieurs plates-formes de ce type.

  • dans le Sud-Ouest, il y a PIGMA pour les données géographiques sur le périmètre Nouvelle Aquitaine, les portails open data du département de la Gironde et de la métropole de Bordeaux de périmètres plus restreints ou encore un portail dédié aux données de l’offre de transport sur le pays Basque (français et espagnol).

  • en région PACA, à partir de 2018, les portails de données géographiques et open data seront mutualisés sur une même plate-forme.

On peut penser que les plates-formes pour déposer les données vont se multiplier dans les années à venir.

Inventaire des 10 fonctionnalités essentielles d’un service de publication de données :

Fonctionnalités

Site web

Data.gouv.fr

plate-forme dédiée

Consultation et téléchargement des jeux de données

Oui

Oui

Oui

Recherche avancée (filtres et facettes ; thématique, format, licence…)

Non

Oui

Oui

Catalogue de données au format tableur

Oui

Oui

Oui

Catalogue de données “expert” (export multi-formats, filtres)

Non

Non/Oui

Oui

Fonctionnalités participatives : suivre un thème, une organisation, un jeu de données, déclarer une réutilisation, commenter, participer au forum..)

Non

Oui

Oui

Entrepôt de données muti-formats

Non

Non/Oui

Oui

API et web services

Non

Non/Oui

Oui

Visualisation de données (graphiques, dataviz, cartographie)

Non

Non

Oui

Statistiques d’usage

Non

Oui

Oui

Workflow (gestion des révisions des metadonnées et des données, fork, crowdsourcing)

Non

Oui

Oui

Oui

Oui

Oui

Recherche avancée (filtres et facettes ; thématique, format, licence…)

Non

Oui

Oui

Catalogue de données au format tableur

Oui

Oui

Oui

Catalogue de données “expert” (export multi-formats, filtres)

Non

Oui/Non

Oui

Fonctionnalités participatives : suivre un thème, une organisation, un jeu de données, déclarer une réutilisation, commenter, participer au forum..)

Non

Oui

Oui

Entrepôt de données muti-formats

Non

Oui/Non

Oui

API et web services

Non

Oui/Non

Oui

Visualisation de données (graphiques, dataviz, cartographie)

Non

Non

Oui

Statistiques d’usage

Non

Oui

Oui

Workflow (gestion des révisions des metadonnées et des données, fork, crowdsourcing)

Non

Oui

Oui