Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Source : OpenDataFrance - Licence : CC-BY-SA
Version : v2.0, date : mai 2022
Les données occupent une place non négligeable dans notre monde contemporain. Big, small, smart, open, froide, chaude, nombreux sont les qualificatifs qui viennent préciser la nature et le statut de la donnée. Prenons le temps de bien comprendre ce qu’est une donnée, quand elle est numérique, publique, sensible, personnelle...
Une donnée est un élément défini et isolable : elle est constituée à partir de règles ou de catégories communément admises (mesure, classification…). Par exemple, les distances en France sont établies en kilomètres alors qu’en Angleterre, ce sont les miles. La donnée peut être relevée dans notre environnement grâce à l’observation et peut être produite à partir de capteurs (un thermomètre) ou de formulaires de saisie dans une application (feuille d’impôt). Une donnée sert de base à une analyse ou permet de réaliser une recherche.
L'information est le résultat de l’interprétation de la donnée par une personne. Elle est une donnée interprétée dans un contexte précis. Un ciel bleu au Pôle Nord et aux Caraïbes ne sera pas interprété de la même manière.
Un document est un objet matériel conçu pour transmettre des informations de façon pérenne. Il suppose une organisation pour représenter l’information et faciliter sa transmission.
Un document administratif est un document produit ou reçu par une administration qui agit dans le cadre d’une mission de service public. Les documents administratifs sont communicables. Ce principe vaut pour tous les documents, quels que soient leur date, leur lieu de conservation, leur forme, leur support, le caractère public ou privé de l’acteur détenteur. Juridiquement, la loi pour une République numérique (article 4) ne définit pas l’obligation de mise à disposition des données, mais uniquement des documents administratifs et ce qu’ils recouvrent.
Une donnée n’est pas toujours numérique, loin de là ! Mais le nombre de données numériques enregistrées et stockées est croissant depuis la naissance du web. Une donnée est numérique quand elle peut être lue et traitée par un ordinateur. Les outils comme les tableurs permettent de visualiser les données numériques dans des tableaux et de voir comment elles sont organisées. En règle général elles sont regroupées en ensembles cohérents, les sets de données.
Les données sont publiques à partir du moment où elles ont été produites ou reçues dans le cadre d’une mission de service public. Les données publiques peuvent être le fruit du travail d’enquête d’une administration, comme le recensement. Et elles peuvent aussi être créées par des délégataires de service public, comme par exemple dans les transports, le service d’eau et le traitement des déchets. Les prestataires ont avec la loi pour une République numérique l’obligation de restituer à la collectivité les données collectées et établies dans le cadre de leur activité.
Source : OpenDataFrance - Licence : CC-BY-SA
Version : v2.0, date : mai 2022
Plusieurs droits existent en France : le droit de communication, d’accès et de réutilisation.
Le droit de communication correspond au “droit des administrés à l'information”. Ce droit découle de l'article 15 de la Déclaration des Droits de l'Homme et du Citoyen de 1789 : “La Société a le droit de demander compte à tout Agent public de son administration.” Les acteurs publics ont diverses obligations de communication auprès de leurs publics.
Le droit d’accès concerne les documents administratifs produits ou reçus dans l’exercice de missions de service public. Les citoyens peuvent les demander et en obtenir une version personnelle sous forme d’un document papier ou électronique, sur clé usb…
Le droit de réutilisation s’applique aux informations contenues dans les documents publics. Les citoyens peuvent utiliser ces informations dans une de leur production. Ils doivent citer leur source et respecter la licence de réutilisation.
D’après le Code des Relations entre le Public et l'Administration (CRPA), tout document ayant fait l’objet d’une communication ou d’une diffusion en ligne est soumis au principe de libre réutilisation (article L321-1) et de gratuité (article L. 324-1). Ce changement s’est opéré récemment fin 2015 par la loi relative à la gratuité et aux modalités de la réutilisation des informations du secteur public (loi Valter - n° 2015-1779 du 28 décembre 2015) dont nombre d’articles sont abrogés et versés dans le CRPA.
Les administrations ont ainsi le devoir :
de répondre aux demandes de documents administratifs. Lorsqu'une demande est adressée à une administration et porte sur un document administratif qu’elle ne détient pas, car détenu par une autre administration, elle transmet la demande à l'administration concernée et en avise le demandeur.
de publier tous les documents administratifs qui font l'objet d'une obligation de publication (répertoire d'informations publiques, données essentielles des marchés publics et des subventions, budget...)
de publier les documents administratifs sous forme électronique dans un standard ouvert, aisément réutilisable et exploitable par un système de traitement automatisé.
Pour les administrations de plus de 50 agents (équivalent temps plein) et de plus de 3500 habitants, les administration ont, en outre, le devoir de publier les documents administratifs lorsqu'ils sont communicables à tous et qu'ils existent sous forme électronique.
En particulier :
les documents qui sont communiqués aux demandeurs et leurs mises à jour.
les documents qui figurent dans le répertoire d'informations publiques.
les données mises à jour de façon régulière et dont la publication présente un intérêt économique, social, sanitaire ou environnemental.
les bases de données que les administrations produisent ou reçoivent et qui ne font pas l'objet d'une diffusion publique par ailleurs.
les règles définissant les principaux traitements algorithmiques utilisés dans l'accomplissement de leurs missions lorsqu'ils fondent des décisions individuelles.
Une administration a le droit de produire une décision défavorable à la réutilisation d'informations publiques. Pour ce faire, elle doit notifier au demandeur sous la forme d'une décision écrite motivée comportant l'indication des voies et délais de recours.
En résumé, les citoyens ont droit:
à la liberté d'accès aux documents administratifs (CRPA),
à la liberté d'accès :
des documents administratifs dont les conclusions concernent le demandeur (Loi Cnil),
aux règles qui définissent le traitement algorithmique ayant pour objectif une décision individuelle (LPRN) (sauf s'il y a un secret protégé par la loi
de choisir la forme que doit prendre la communication (dans la limite des possibilités techniques de l'administration) : consultation gratuite sur place, délivrance d'une copie (si cela n'altère pas l'original), par courrier électronique (sans frais si le document existe originellement dans une version électronique), par une publication en ligne. Le demandeur peut être amené à payer le cout de production de cette copie, affranchissement compris.
de recourir à la Cada dans un délai de 2 mois, s'il n'a pas obtenu de réponse pendant un mois après sa demande.
à la réutilisation gratuite (il existe quelques exceptions) les données publiques tout en respectant la licence.
Par exemple, les données qui ont des droits de propriété intellectuelle détenus par des tiers, ne peuvent pas être réutilisées directement. Dans ce cas, c'est à l'administration d'indiquer au réutilisateur l'identité du titulaire de ces droits ou, si celle-ci n'est pas connue, l'identité de la personne auprès de laquelle l'information en cause a été obtenue. Ce point est non applicable aux bibliothèques, musées et archives. La licence précisera en particulier les conditions de réutilisation. A minima : les informations ne doivent pas être altérées, leur sens ne doit pas être dénaturé; leurs sources et la date de leur dernière mise à jour doivent être mentionnées. Si la réutilisation d'informations publiques contient des données à caractère personnel le réutilisateur devra respecter de la loi Informatique et Liberté.
L'ouverture des données est une démarche qui vise à définir des modalités de publication et de mise à disposition des données : l’enjeu est de simplifier l’accès aux données et de favoriser leur usage. Cette approche est résumée par l'acronyme FAIR : des données Faciles à trouver, Accessibles, Interopérables et Réutilisables. En ce sens cette démarche est souvent à l'origine de la structuration d'une politique des données, plus large.
La démarche d’ouverture offre un accès aux données et un cadre de réutilisation grâce à l’utilisation de licences et de formats qui permettent le traitement, la reproduction, la modification et la redistribution.
Pour les acteurs publics, la démarche d’ouverture, en plus de répondre à des obligations légales, constitue un levier d'action et d'animation des politiques publiques. Trois volets thématiques constituent des motifs pour valoriser et développer l’ouverture des données : l'ambition démocratique, la modernisation de l’action publique et le développement de l'innovation.
Source : OpenDataFrance - Licence : CC-BY-SA
Version : v2.0, date : mai 2022
Un algorithme est une méthode de traitement des données.
La CNIL en donne cette définition : une suite finie et non ambigüe d’étapes pour obtenir un résultat à partir d’éléments fournis en entrée. Un algorithme est en général automatisé mais sa définition peut également s'appliquer à une suite de séquences non informatisées.
La loi pour une République numérique impose un certain nombre d'obligations aux collectivités utilisant un algorithme :
Expliquer le système utilisé, ce qui suppose de publier au préalable un inventaire
Apposer dans la décision une mention qui rend visible l'utilisation d'un algorithme
En cas de demande, fournir une explication individuelle, détaillée
C’est une interface de dialogue, technique et normalisée, qui permet d’échanger des informations et des services entre machines. Une API permet à un service de fournir des données de façon standardisée. Exemple : une API peut renvoyer les coordonnées GPS d'une adresse postale donnée par la Base d’Adresse Nationale Ouverte.
C’est un ensemble structuré de données. Une base de données permet de stocker des information de manière cohérente pour opérer des traitements, fournir des services dans le but de faciliter leur usage.
En règle générale, les données dans une base sont dites "structurées". En effet, pour que l’ordinateur puisse correctement traiter les données numériques, il est important d’établir des règles détaillées et précises lors de leur enregistrement, de bien définir les valeurs des champs, d’établir une structure fonctionnelle claire. C'est l'interprétation et la représentation de données numériques qui donnera lieu à la création d'informations intelligibles.
Cette expression désigne un ensemble de données caractérisé par du Volume, de la Variété (texte, son, image) et une Vélocité (données chaudes). Ces dernières, pour être exploitées, implique d'utiliser des outils spécifiques. Le Big Data peut d'ailleurs désigner aussi bien les données que les infrastructures permettant de les exploiter.
C’est l'utilisation de la créativité, de l'intelligence et du savoir-faire d'un grand nombre de personnes, en sous-traitance, pour réaliser certaines tâches traditionnellement effectuées par un employé ou un entrepreneur (Wikipédia juillet 2017 : https://fr.wikipedia.org/wiki/Production_participative). Par exemple, les contenus de Wikipédia et d’Open Street Map sont réalisés en crowdsourcing.
Le csv est un nom d’un format de fichier contenant des données textuelles. Les données sont lisibles par un très grand nombre d’outils : les tableurs, les éditeurs de texte... L’organisation du fichier étant répandue et simple, elle peut être plus facilement traitée par un programme.
On appelle web sémantique l’extension du web traditionnel pour permettre à toute donnée d’être publiée et documentée de façon standard. Les données liées, c’est la possibilité d’attribuer une URL à un objet et de pouvoir pointer vers elle de façon fixe. Par exemple, Wikidata permet de donner accès à des données de base (dates de naissance, capitale d’un pays...).
Toute donnée faisant directement ou indirectement référence à un lieu spécifique ou une zone géographique est considérée comme une donnée géographique (article L127-1 du code de l’environnement). Certaines données géographiques sont géolocalisées : elles utilisent des coordonnées pour localiser des faits ou d’autres données. D’autres sont géolocalisables lorsqu’elles utilisent des références de localisation indirectes : une adresse, un code postal, un nom de lieu par exemple. Les données géographiques sont d’un intérêt majeur dans le domaine de l’open data, principalement pour les raisons suivantes :
La localisation de l’information est le critère de croisement de bases de données le plus courant, car elles permettent une représentation des données sous forme de cartes géographiques.
Leur contribution à la connaissance des territoires les rend indispensables à l’action publique en particulier pour l’ensemble des politiques touchant à l’aménagement.
Les données géographiques publiques font l’objet de règles et de recommandations de diffusion à l’échelle nationale et européenne, notamment suite à la directive européenne INSPIRE.
Dans le cadre du Service Public de la Donnée, les données de référence sont précisées par l’article 14 de la Loi Pour une République Numérique. Ce sont des informations publiques qui satisfont les conditions suivantes :
Elles constituent une référence commune pour nommer ou identifier des produits, des services, des territoires ou des personnes ;
Elles sont réutilisées fréquemment par des personnes publiques ou privées autres que l'administration qui les détient ;
Leur réutilisation nécessite qu'elles soient mises à disposition avec un niveau élevé de qualité.
Un décret dresse la liste des données de références, ainsi que l'administration responsable de leurs conditions de production et de publication. La Base Adresse Nationale, la base Siren, le Répertoire Opérationnel des Métiers et des Emplois (code ROME produit par Pôle Emploi) sont des données de référence.
Il s’agit d’une catégorie de données protégées, en France par la Loi Informatique et Libertés et en Europe, par le Règlement Général sur la Protection des Données (RGPD). Cette loi définit une donnée à caractère personnel comme “une donnée qui permet d’identifier, directement ou indirectement, une personne physique” (art. 2). Cela correspond donc à des éléments directement identifiants tels que le nom, l’adresse, le numéro de téléphone, l’identifiant personnel ou les identifiants par croisement avec d’autres données (géolocalisation, statut familial, etc). Les données à caractère personnel d’une personne appartiennent à sa vie privée. Les fichiers dits “clients”, “fournisseurs”, “usagers” contiennent des données à caractère personnel qui rendent techniquement possible l’identification précise d’une personne.
Il n’existe pas, au sens juridique, de “données personnelles” ; c’est souvent un abus de langage qui désigne des données à caractère personnel.
Les données sont qualifiées de « publiques » lorsqu’elles sont produites ou collectées ou reçues par l’Etat, une collectivité territoriale, un organe parapublic ou un délégataire dans le cadre de leurs activités de service public. Ces différents acteurs publics ou privés rassemblent et structurent des données qui leur servent à mener leurs missions de service public. Les données publiques sont de natures extrêmement hétérogènes :
données temporelles comme les horaires d’ouverture,
données financières comme les montants d’un budget,
données géographiques comme les codes postaux ou la localisation des accidents de la route sur une commune ...
Les données publiques servent à la mise en place de politiques publiques. Elles sont des éléments essentiels à la prise de décision dans l’action publique et à la réalisation de celle-ci. Leur communication et leur mise à disposition garantissent aux citoyens un accès et un usage différent de celui prévu initialement.
Une donnée sensible est également une notion juridique française issue de la Loi Informatique et Liberté (article 8). C’est une donnée à caractère personnel qui concerne l’intimité d’une personne physique. Ce type de données est particulièrement protégé par la loi Informatique et Libertés. Cela comprend les données sur les origines raciales ou ethniques, les opinions politiques, philosophiques ou religieuses, l’appartenance syndicale, la santé ou la vie sexuelle. Les données sensibles ne peuvent être recueillies et exploitées qu’avec le consentement explicite des personnes. Elles appartiennent également à la catégorie des données personnelles.
La fouille de données consiste en l’exploration de masse de données issues de documents ou base de données pour les analyser à partir de méthodes comme la statistique, le traitement automatisé/algorithmique, les systèmes d'intelligence artificielle. L’objectif de cette analyse est de comprendre, résoudre ou encore prévoir des actions.
Il s’agit de représentation graphique de données. Quelques formes simples et connues de visualisation de données sont le “camembert”, l’histogramme, le nuage de points. La visualisation de données peut s’appuyer sur différentes sources de données. Elle a pour objectif de rendre les données plus lisibles et compréhensibles.
(voir Pour Comprendre Fiche 1 - Définition : les données)
Le terme "interopérable" désigne le fait que deux systèmes techniques peuvent échanger aisément des données. Plus les systèmes respectent les normes et les standards ouverts, plus ils sont interopérables.
Un jeu de données est un ensemble de données formant un tout cohérent. Le jeu de données est composé de plusieurs variables et observations associées à ces variables. En règle général, un jeu de données comprend une variable clé unique (identifiant ou clé primaire) qui permet de relier le jeu de données à un autre, afin d'augmenter et compléter l'information initiale.
Exemple : la liste de présence des conseillers municipaux lors des assemblées en 2012, est un jeu de données.
C’est l’abréviation de Google, Amazon, Facebook, Apple, Microsoft : il s’agit des entreprises les plus puissantes de l’internet et accessoirement celles qui détiennent et/ou manipulent le plus de données. On les dénomme également "Big Tech".
Une licence est un contrat qui précise les conditions de réutilisation d’un jeu de données. Par exemple, des données sous licence ODBL ou Licence Ouverte sont appliquées à l'open data.
Les administrations sont tenues de publier en ligne ou de communiquer les documents administratifs qu'elles détiennent aux personnes qui en font la demande. Cela ne s'applique qu'à des documents achevés et ne concerne pas les documents préparatoires à une décision administrative tant qu'elle est en cours d'élaboration. Dans le cas où la demande permet de bénéficier d'une décision individuelle créatrice de droits, les documents sont communicables à l'auteur de cette demande dès leur envoi à l'autorité compétente pour statuer sur la demande. Le droit de communication perdure, même si le document est déposé aux archives. Le droit de communication cesse lorsque les documents font l'objet d'une diffusion publique.
Une métadonnée est une information descriptive liée à une donnée. Par exemple, la date de production de la donnée, son producteur, son format, sa licence constituent des métadonnées. Pour qu’un jeu de données soit facilement accessible et réutilisable, la qualité des métadonnées joue un rôle déterminant.
Une mission de service public est une action menée par une administration pour satisfaire l’intérêt général. Il peut s’agir de service public administratif ou d’un service public industriel et commercial. La jurisprudence a établi un faisceau d’indices permettant de déterminer si l’on est en présence d’un service public :
une activité d’intérêt général,
la présence directe ou indirecte d’une administration,
la présence de prérogatives de puissance publique,
les modalités de financement public.
Pour approfondir la notion, le wiki du CNFPT : https://frama.link/Def-servicepublic-cnfpt
C’est un mouvement qui regroupe les outils, les principes et les méthodes permettant à chacun de mesurer ses données personnelles, de les analyser et éventuellement de les partager. Les outils du quantified self peuvent être des objets connectés, des applications mobiles ou des applications Web (Wikipédia juillet 2017 : https://fr.wikipedia.org/wiki/Quantified_self). Le fait de mesurer le nombre de pas effectués par jour constitue une pratique de quantified self.
Le self data désigne la production, l’exploitation et le partage de données personnelles par les individus, sous leur contrôle et à leurs propres fins : pour mieux se connaître, prendre de meilleurs décisions, se faciliter la vie, etc. "Si j'ai une donnée sur vous, vous l'avez aussi et faites-en ce que bon vous semble !"
Le service public de la donnée créé par l’Article 14 de la loi pour une République numérique vise à mettre à disposition, en vue de faciliter leur réutilisation, les jeux de données de référence qui présentent le plus fort impact économique et social. Il s’adresse principalement aux entreprises et aux administrations pour qui la disponibilité d’une donnée de qualité est critique. Les producteurs et les diffuseurs prennent des engagements auprès de ces utilisateurs. La mission Etalab est chargée de la mise en oeuvre et de la gouvernance de ce nouveau service public. Elle référence l’ensemble des données concernées (Extrait : https://www.data.gouv.fr/fr/reference).
Source : OpenDataFrance - Licence : CC-BY-SA
Version : v2.0, date : juin 2022
Pour les acteurs publics, la démarche d’ouverture, en plus de répondre à des obligations légales, constitue un levier d'action et d'animation des politiques publiques. Regardons ici celui de l'innovation économique.
Faciliter la mise à disposition des données publiques contribue à soutenir le développement économique des acteurs locaux et nationaux. Internet des objets, territoires intelligents, transition énergétique, big data, French Tech : les données servent l’innovation publique comme privée. L'ouverture des données doit ainsi atteindre une certaine massification tout en garantissant un haut niveau de qualité pour être un levier d'innovation. Le développement de Hubs de données sectoriels ou territoriaux visent à structurer ce passage à l'échelle dans l'accès aux données.
De nombreux exemples de réutilisations de données publiques au service d'une innovation existent.
Citons-en quelques uns :
L'application Handimap réutilise les données voirie/urbanisme (hauteur des trottoirs, places de parking handicapés, etc) pour développer son calculateur d'itinéraire pour personnes à mobilité réduite.
L'application Meilleurs Agents propose notamment un outil en ligne d’estimation des prix des biens, en réutilisant les données de demandes de valeurs foncières. À partir de l’exploitation des données ouvertes, l’entreprise propose désormais une carte interactive représentant l’ensemble des transactions passées en fonction du lieu et du type de bien.
Source : OpenDataFrance - Licence : CC-BY-SA
Version : v2.0, date : juin 2022
Pour les acteurs publics, la démarche d’ouverture, en plus de répondre à des obligations légales, constitue un levier d'action et d'animation des politiques publiques. Regardons ici celui de l'ambition démocratique.
L'accès aux informations publiques est un droit fondamental inscrit dans l’article 15 de la Déclaration des Droits de l'Homme et du Citoyen : “La Société a le droit de demander compte à tout Agent public de son administration”.
Rendre des comptes, cela signifie que l’administration, dans sa mission de service public, doit être en mesure d’expliquer et de partager les éléments qui lui ont permis de réaliser ce service public. Ce droit est rappelé dans le Code des Relations entre le Public et l'Administration (CRPA) et garantit l'accès et la réutilisation des informations publiques par défaut en France. Historique, il a dû revêtir de nouvelles modalités à l'heure du digital qui ont été clarifiées par la Loi pour une République Numérique, du 7 octobre 2016.
La notion d'action publique recouvre toute les actions menées pour répondre à des besoins de la société. Les politiques publiques correspondent la structuration de plusieurs actions publiques par une administration qui les organise et les structure.
L'action publique détermine un cadre social et politique. Elle repose sur des principes, ceux du service public, égalité, adaptabilité et continuité mais également sur des lois et règlements qui s'incarnent notamment dans plusieurs codes (code des relations entre le public et l'administration, code général des collectivités territoriales...).
Ouvrir les données permet d’assurer l'accessibilité des informations produites et mobilisées au sein de politiques publiques. Les données peuvent être analysées, comparées et ainsi être source de débat et de décisions. L’objectif est de favoriser la confiance des citoyens et usagers envers les administrations qui non seulement produisent des services mais peuvent parfois également lever des financements (impôts, taxes) pour produire cette action publique.
Selon une étude du Piew Internet Research de mars 2011, les citoyens vivant sur un territoire ayant ouvert ses données sont 3 fois plus satisfaits de leur action publique.
Publier des données ouvertes peut s'inscrire dans la perspective de renforcer le dialogue entre le citoyen et l’administration. Les données peuvent ainsi contribuer à la mise en place d’un modèle participatif qui favorise l'implication citoyenne, en concourant au développement de la participation et la coproduction.
L’exemple de la métropole de Nantes : un groupe de citoyens, appartenant au projet OpenStreetMap reprit le fichier des bases adresses, publié par la collectivité en 2012 et proposa des modifications améliorant des informations locales utiles à tous, grâce à une coproduction.
Les démarches d’ouverture visent à donner aux citoyens des ressources auxquelles ils n’avaient pas accès auparavant : elles rendent opérationnels et effectifs non seulement le droit d’accès aux informations publiques par leur mise en ligne sur des portails dédiés, mais surtout le droit de manipuler, traiter et exploiter ces informations.
Source : OpenDataFrance - Licence : CC-BY-SA
Version : v2.0, date : mai 2022
D’une façon générale, l’expression “open data” est souvent employée pour désigner à la fois les politiques ou stratégies d’ouverture des données, et les données ouvertes à proprement parler. Mais que signifie “ouverture des données” ? La notion d’ouverture fait référence de manière métaphorique à la volonté de favoriser la publication d’informations sans restriction d’accès et d’utilisation. La publication en open data suppose la possibilité pour un tiers de traiter et manipuler les données.
L’ouverture des données est une politique publique qui développe des portails de mise à disposition de données et favorise la mobilisation et la réutilisation de données dans l’action publique. Cela s’appuie sur la pratique de médiations : il s’agit non seulement de publier en ligne et mettre à disposition des données dans un format ouvert, mais aussi de proposer des dispositifs d’accompagnement et d’animation de la publication.
Tous les acteurs peuvent ouvrir des données : des associations, des personnes, des entreprises...
Différents aspects limitent la diffusion des données : par exemple, les secrets légaux, les coûts importants de mise à disposition, les formats de fichiers propriétaires ou les conditions restrictives dans les clauses des marchés...
Une donnée ouverte est une donnée numérique caractérisée, à minima, par plusieurs propriétés :
elle est librement accessible,
elle est compréhensible,
elle est dans un format suffisamment répandu pour être exploitable par une machine,
elle est réutilisable par tous, ses conditions de réutilisation sont précisées dans une licence.
Une donnée ouverte n’est pas forcément une donnée publique. Associations, citoyens ou entreprises peuvent mettre des données à disposition, sans que celles-ci soient produites dans le cadre d’une mission de service public.
L’ouverture des données se réalise par la publication des données sur des sites web, des portails ou via des API (Interface pour l’accès Programmé aux Applications). Les données sont mise à disposition sous différents formats de fichiers qui permettent la manipulation et le traitement des données.
Thème
Format
Représentation
Tableur
.ods , .csv
Sémantique
.rdf
Géographique
.kml, .shp
Image
.png, .gif, .jpeg
3D
X3D
Données complexes
.xlm, .json
Source : OpenDataFrance - Licence : CC-BY-SA
Version : v2.0, date : juin 2022
Les fiches métiers présentées ci-dessous ont été écrites à partir des informations disponibles sur les sites de l’Onisep et du CIDJ. Toutefois, certains métiers très récents ne disposent pour l’heure d’aucune fiche et ont donc été rédigées à partir d’informations collectées auprès d’autres sources.
Il ou elle est le véritable chef d'orchestre de la définition et de la mise en œuvre de la politique des données au sein de l'organisation en ayant en charge :
l'acquisition d'une sémantique commune : dictionnaires de données, métadonnées...
la définition et l'animation de la gouvernance de la donnée, notamment sur la politique opendata mais plus largement de production de "communs"
la gestion des logiciels d’hébergements des données
le choix des outils pour exploiter les données
la définition des droits d'accès aux données, en prenant appui sur des "ambassadeurs" par domaine thématique
le conseil aux différentes parties prenantes pour rendre la donnée accessible et l'exploiter
la veille réglementaire et technologique sur les données
Son rôle est de faciliter la circulation et l’accès aux données dans son entreprise. Il/elle doit être capable d’effectuer le tri de toutes les données pour repérer les plus pertinentes et les plus importantes, afin de faciliter la prise de décisions aux dirigeants de l’entreprise.
Il/elle doit très bien connaître les services, les métiers et les processus qui composent et régissent l’entreprise. Il/elle doit également s’assurer de la qualité des données et informations récoltées, que leur source soit interne ou externe à l’entreprise.
L’administrateur ou l’administratrice des données travaille avec d’autres spécialistes que sont les data scientist, les programmeurs et les analystes du web.
Il/elle a pour mission de déployer un projet d’ouverture des données de la collectivité ou de l’organisation : il/elle peut s’appuyer sur une plate-forme de publications des données propre à sa structure ou mutualisée.
Il/elle doit savoir conduire un projet d’ouverture des données et être un bon communicant au vue des nombreuses prises de contacts avec les élus, des représentants de communes ayant déjà ouvert leurs données, de syndicats mixtes faisant de l’open data, etc.).
Le chef ou la cheffe de projet open data doit être à l’écoute des besoins des divers services qui composent l’organisme pour leur proposer des solutions adaptées. Il/elle doit aussi faciliter la production de nouvelles données et favoriser la réutilisation de celles mises à disposition par la collectivité ou l’entreprise. Il contribue à la cartographie des données dans sa démarche de publication.
L’archiviste collecte, classe et répertorie les documents en possession de l’administration ou de l’entreprise pour laquelle il travaille. Avec la digitalisation des supports, son expertise concerne aussi les données.
La collecte de ces archives s’effectue auprès de services de collectivités, d’associations, de syndicats ou de fonds privés pouvant être aussi bien des entreprises que des particuliers. Il est le garant de ce qui doit être conservé pour des finalités patrimoniales (recherches et connaissances)
L’archiviste trie et classe les documents acquis en conservant les sources. Il maîtrise non seulement les cycles de conservation, mais également la méthodologie d'indexation. Il est ainsi un véritable partenaire dans tous projets de dématérialisation.
Enfin, l’archiviste assiste les différents publics dans leurs recherches et les aide à décrypter les documents conservés. Il/elle organise des événements visant à la promotion de ce patrimoine au travers d’expositions, d’ateliers pédagogiques, de conférences, etc. mais peut aussi devenir un partenaire sur des actions de sensibilisation en matière d'archivage numérique.
L’éditeur ou l’éditrice de données a pour mission principale l’animation et la valorisation de l’offre de données sur le portail opendata de l'organisation. Pour cela, il ou elle favorise la mise en avant de données thématiques, valorise les réutilisations connues et contribue à développer la notoriété du portail. L’éditeur ou éditrice de données a un rôle de gestion et d’évolution du site web. Il ou elle met en place des dispositifs techniques et humains pour favoriser le débat, la production d’idées et de connaissances à partir de données et joue un rôle important auprès des réutilisateurs, notamment en se positionnant en animateur ou animatrice de communautés.
Le ou la journaliste de données doit savoir effectuer comme tout autre journaliste, une veille informationnelle et une recherche d’informations, mais sur internet et dans des bases de données. Il ou elle doit aussi vérifier la validité et le sérieux des informations recueillies et assurer la protection des sources.
Il ou elle doit être capable de questionner les données, c’est-à-dire d’évaluer leur pertinence et leur fiabilité avant de les utiliser, d’extraire des données depuis divers types de documents et fichiers (un tableur, un PDF, une image…) et de nettoyer des données brutes par la création d’un tableur pour le croisement de sources.
Le ou la journaliste des données doit savoir rédiger des consignes destinées à un infographiste ou maîtriser les outils de visualisation de données. Il ou elle peut savoir lire et produire une cartographie à partir de méthodes et outils géographiques.
Plusieurs journaux se sont spécialisés dans la production de travaux d’analyse journalistique fondés sur les données : Le Temps (en Suisse), The Guardian (En Grande-Bretagne).
“Job le plus sexy du 21ème siècle” selon la Harvard Review, le data scientist possède des compétences en statistiques, traitement de données et en programmation informatique. Il ou elle met en œuvre un ensemble de techniques d’analyse, dont les algorithmes et le machine learning. Il est possible d’utiliser le terme d’“analyste de données”.
Data scientist et data analyst ont pour mission le croisement et le traitement de données qu’elles soient produites par l’entreprise, achetées ou collectées sur des services tiers. Tous deux extraient les données et doivent savoir les interpréter pour les transformer en informations utilisables par l’organisation pour l’aider dans sa prise de décisions opérationnelles et stratégiques. Pour assurer la collecte, le traitement, le stockage et la restitution des données, ils/elles conçoivent les modèles et algorithmes nécessaires à ce travail et sont par cette fonction considérés comme n’étant pas de simples statisticiens. Ils/elles sont capables d’imaginer et de concevoir de nouveaux modèles d’analyses de traitement des données brutes et qui ne peuvent pas l’être par les outils de gestion de bases de données existants.
Les data scientist et data analyst recherchent des données pertinentes pour l’entreprise, proposent des modifications à apporter aux bases de données, conçoivent des “entrepôts des données”, les évaluent, les traitent et les restituent dans le système d’information cible. Ils ou elles travaillent en règle général sous la coordination de l'administrateur/administratrice des données.
Là où le ou la data analyst travaille le plus souvent sur une unique source de données (thématique métier), le ou la data scientist œuvre sur un plan bien plus large en croisant des données issues de sources multiples, dans des formats diversifiés.
Ces deux profils possèdent une triple compétence
d’expertise statistique et informatique,
de connaissances en bases des données et en l’informatique,
d’expertise métier dans le secteur d’activités pour lequel ils ou elles travaillent.
Toute administration publique a l'obligation de désigner un Délégué à la protection des données depuis le 25 mai 2018, date d'entrée en application du règlement européen sur la protection des données.
Il ou elle est le référent sur la question de la protection des données personnelles et assure une veille sur la publication de nouveaux décrets ou de nouvelles lois en liens avec la protection de ces données. Il est l'interlocuteur de la CNIL.
Son expertise lui permet de conseiller l’organisme public ou privé pour lequel il travaille sur les décisions à prendre concernant la récolte, le traitement et l’archivage des données, les conditions dans lesquelles ce travail peut-être fait et les limites. Sa présence au sein de l’organisme est un gage de sécurité et rassure les acteurs externes et internes sur les usages que seront fait de leurs données. Enfin, sa capacité à trier les données en fonction de leur pertinence, de leur finalité, de leur sécurité et de leur conservation limitée permet à l’organisation d’avoir des jeux de données fiables et donc d’envisager leur utilisation sereinement.
Le géomaticien est un expert de la donnée géographique numérique : de sa création, de sa gestion, de sa valorisation et de sa diffusion. Il est en capacité de spécifier, créer, administrer et opérer un SIG. Il est souvent l'un des métiers très acculturé à la donnée au sein d'une organisation et constitue ainsi un contributeur utile à la mise en œuvre d'une gouvernance des données.
La nécessité d’interconnecter le SIG à d’autres systèmes d’information transversaux ou métiers conduit les géomaticiens à maîtriser :
les outils et concepts de la « qualité » des données (métadonnées, réutilisation dans d’autres applications informatiques….),
les modalités techniques de diffusion (dont les normes et standards).
Pour assurer ses missions, le géomaticien s’appuie sur une formation scientifique et technique comprenant, dans des proportions variables, des bases en géographie, en informatique et topographie ainsi que des compétences thématiques.
Il ou elle assure également des fonctions d’accompagnement, d’animation et de gestion reposant sur une dimension humaine forte, consistant par exemple à former des utilisateurs à l’usage de l’information géographique, contractualiser des partenariats avec des organismes extérieurs et animer un réseau d’acteurs s’ouvrant, de plus en plus, au grand public.
Définition extraite du « Petit guide pratique de la géomatique à destination des employeurs, des candidats et des formateurs », AFIGEO – 2013
Les missions de la médiation numérique portent sur trois grands axes :
Donner accès aux outils du numérique à tous : Il ou elle fournit l’accès à un ordinateur et une connexion internet aux personnes qui n’en possèdent pas, mais aussi à une imprimante.
Accompagner les usagers du numérique dans leur pratique quotidienne en ligne : Le médiateur ou la médiatrice explique et montre comment écrire et envoyer un courriel, comment effectuer une démarche en ligne pour faire une demande auprès d’une administration ou d’une entreprise, comment acheter un livre ou un billet de spectacle sur internet, comment télécharger une application et s’en servir, etc.
Développer une culture numérique : Cela passe par l’enseignement des bons gestes (comment se comporter sur internet auprès des autres utilisateurs, comment éviter les pièges tels que des tentatives d’escroqueries, comment protéger ses données personnelles, etc.)
Même si son rôle est orienté sur la sensibilisation aux outils numériques, il est de ce fait un partenaire à solliciter à toute politique de la donnée qui inclut des briques de sensibilisation et d'accompagnement.
Un producteur ou une productrice de données est une personne responsable des données, de leur création à leur validation au sein d’un service. Il ou elle contrôle la qualité et la fiabilité des données. Il ou elle peut être également en charge de la phase de mise à disposition. Dans les métadonnées d’un jeu de données ouvert, le producteur de données désigne l’entité qui pilote la collecte, le stockage et la mise à disposition des données. Il connaît parfaitement la thématique et les processus métiers dans lesquels il intervient.
Le ou la statisticien(ne) collecte les informations et les chiffres qu’il doit étudier. Pour mener à bien cette mission, il ou elle prépare un questionnaire ou une grille d’évaluation. Ce travail porte sur des domaines aussi larges que des enquêtes d’opinion, des études qualitatives, des essais thérapeutiques, etc. Il lui échoit de fixer la méthodologie d’enquête à adopter ; celle-ci peut se faire par téléphone, par courrier ou par internet. Il s’entoure d’assistants et d’enquêteurs pour mener à bien ce travail.
Une fois l’enquête terminée, il traite les résultats obtenus en vue de leur analyse. Pour ce faire, il utilise des logiciels qui décortiquent chaque donnée, qui résultent sous la forme de tableaux et de graphiques, que le statisticien devra synthétiser. Les résultats seront ensuite présentés à l’organisme ou la personne ayant passée la commande de l’enquête qui pourra agir en fonction de ces résultats.
Source : OpenDataFrance - Licence : CC-BY-SA
Version : v2.0, date : juillet 2022
La mission Etalab, créée en février 2011, est chargée de stimuler et coordonner la politique d’ouverture et de partage des données publiques (« open data ») et de coordonner la représentation française au sein du Partenariat pour un gouvernement ouvert (« Open Government Partnership »). Rattachée aux services du Premier ministre, la mission Etalab fait partie de la direction interministérielle du numérique de l’Etat (DINUM). La mission Etalab a 3 principales missions :
accompagnement des administrations dans l’ouverture des données publiques, gestion de la plateforme data.gouv.fr et mise en place du service public de la donnée (SPD) ;
circulation et exploitation (exemple Lab IA) des données au sein de l’administration en œuvrant pour des politiques publiques pilotées par la donnée ;
ouverture du gouvernement et représentation de la France au sein du Partenariat pour un gouvernement ouvert.
La Commission Nationale de l’Informatique et des Libertés (CNIL) est une autorité administrative indépendante créée en janvier 1978. Elle est en charge de la protection de la vie privée et des libertés dans l’usage de l’informatique. La CNIL a trois grandes missions :
l’information et le conseil,
le contrôle
les sanctions.
En France, tout traitement de données à caractère personnel doit faire l’objet de protections particulières précisées par la loi pour une République numérique et le Règlement Général pour la Protection des Données. A partir d’avril 2018, le Délégué à la Protection des Données (DPO) remplace le Correspondant Informatique et Libertés (CIL). Ses fonctions et responsabilités sont élargies pour protéger les données à caractère personnel.
La Commission d’Accès aux Documents Administratifs (CADA) a été créée en 1978 et est une autorité administrative indépendante. Elle a pour vocation de garantir à tout citoyen l’accès aux documents administratifs, dans une logique de transparence et de redevabilité des administrations; elle garantit également le droit à la réutilisation des informations publiques. Depuis 1978, ce droit d’accès est assuré, quel que soit le format d’origine du document. La CADA peut être saisie par tout citoyen en cas de refus de communication ou de réutilisation. Ses missions sont définies par la loi “CADA” de 1978, codifiée dans le livre III du Code des Relations entre le Public et l’Administration (CRPA).
Les collectivités territoriales ont l’obligation de désigner un correspondant CADA qui a pour missions de :
Réceptionner les demandes d'accès aux documents administratifs et de licence de réutilisation des informations publiques ainsi que les éventuelles réclamations et de veiller à leur instruction
Assurer la liaison entre l'autorité auprès de laquelle elle est désignée et la commission d'accès aux documents administratifs.
Il peut être également chargée d'établir un bilan annuel des demandes d'accès aux documents administratifs et de licence de réutilisation des informations publiques qu'elle présente à l'autorité qui l'a désignée et dont elle adresse copie à la commission d'accès aux documents administratifs.
La Haute Autorité pour la Transparence de la Vie Publique est une autorité administrative indépendante qui succède à la Commission pour la Transparence Financière de la Vie Politique suite à la loi relative à transparence de la vie publique du 11 octobre 2013. Elle est en charge de la publication des déclarations de situation patrimoniale et des déclarations d’intérêts de certains élus et des membres du gouvernement. Elle a pour mission la publication des données des déclarations sous la licence ouverte promue par Etalab (LO) et la tenue du registre des représentants d’intérêts.
Le COEPIA est le Conseil d’Orientation de l'Édition Publique de l’Information Administrative. Ce conseil a été créé en janvier 2010 et traite des questions relatives à l’édition publique, à l’information et au renseignement administratif, ainsi qu’à la publication des données publiques. En octobre 2015, la composition du conseil a été renouvelée pour renforcer son analyse et son expertise dans le domaine de l’ouverture des données et du gouvernement.
Le Conseil National du Numérique est un organisme consultatif créé en 2011 afin de produire une réflexion sur les enjeux sociaux, culturels et économiques du numérique. Il a mis en place une vaste consultation qui a donnée lieu au rapport “Ambition numérique”, base à la rédaction de la loi pour une République numérique. En avril 2017, le conseil émet un avis sur “la libre circulation des données en Europe”.
Il publie régulièrement des études. Pour accéder à ses travaux :
Les collectivités territoriales ont joué un rôle déterminant en France dans le développement de la culture de l’ouverture et dans les actions de mise à disposition des données publiques. Elaborée dans le cadre de l'Observatoire de l'open data, la carte ci-dessous présente les acteurs ayant engagés une démarche d’ouverture de leurs données.
Tableau de synthèse des textes règlementaires qui encadrent l'ouverture des données publiques.
Source : OpenDataFrance - Licence : CC-BY-SA
Version : v2.0, date : juillet 2022
La publication et la protection des données publiques sont très encadrées.
La base ci-après référence la liste des principaux textes en droit français et européen qui régissent la publication des données.
Source : OpenDataFrance - Licence : CC-BY-SA
Version : v2.0, date : juin 2022
Pour les acteurs publics, la démarche d’ouverture, en plus de répondre à des obligations légales, constitue un levier d'action et d'animation des politiques publiques. Regardons ici celui de la modernisation de l’action publique.
La mise en œuvre d'une démarche d'ouverture de données est l’occasion pour les administrations de mettre en place de nouvelles méthodes et outils au sein de leurs services. L’expérience montre qu’une telle démarche réussit lorsqu’elle constitue un vecteur de décloisonnement et qu’elle est une source de réflexion sur les données produites et collectées.
Une démarche d'ouverture de données est l'occasion de monter en compétences pour les agents et collaborateurs sur la gestion et la qualification des données : savoir les trouver, les utiliser, les croiser, les représenter.
Une démarche d'ouverture de données est l'occasion de mettre en œuvre de nouvelles formes de collaboration en interne comme en externe.
L’État et les collectivités organisent des événements qui visent à favoriser la collaboration à partir de l’utilisation des données : hackathons, datacamp, ateliers, etc. Ces évènements sont des moments de créations de services qui mobilisent aussi bien des équipes internes que des acteurs de la société civile. Ce sont des moments de coproduction et d'échanges riches en enseignements et qui vise l’amélioration des services, qu’ils soient publics ou privés. Le simple fait de faire l’inventaire des données avec les partenaires est souvent productif.
Mais au delà des productions événementielles, la gestion de projets incluant une exploitation des données suppose de développer de nouveaux savoir-être d'ouverture, de collaboration, d'expérimentation qui sont tous des leviers de transformation.
Les données sont la base des informations qui permettent aux décideurs de faire des choix éclairés. Améliorer la qualité des données contribue à fournir des éléments concrets, fiables, pour prendre des décisions et mettre les services publics en cycle d'amélioration continue. Certaines collectivités, comme le département de Saône-et-Loire relie ses données publiques de manière automatisée à son système décisionnel. Services et élus accèdent à des données à travers de nouvelles interfaces et s’appuient ainsi sur des éléments concrets et régulièrement mis à jour pour agir.
Produit par la CNIL pour accompagner les collectivités territoriales
Source : OpenDataFrance - Licence : CC-BY-SA
Version : v2.0, date : juin 2022
Le guide revient sur les principales actions que les collectivités doivent mettre en œuvre (depuis mai 2018) pour être en conformité avec le RGPD :
désigner un délégué à la protection des données (DPO - Data Protection Officer), qui peut être mutualisé avec d’autres collectivités territoriales sous certaines conditions (voir fiche CNIL) ;
recenser les traitements de données et tenir à jour un registre de ceux-ci (voir fiche CNIL) ;
fonder le traitement de toute données à caractère personnel sur l’une des bases légales (voir fiche CNIL) ;
gérer la sous-traitance des traitements (voir fiche CNIL) ;
garantir la sécurité des données (voir fiche CNIL) ;
organiser la réponse aux demandes d’exercice des droits venant des administrés (voir fiche CNIL) ;
notifier à la CNIL, voire aux personnes concernées, les violations éventuelles de données à caractère personnel (par exemple les failles de sécurité) (voir fiche CNIL) ;
effectuer, dans certains cas, des analyses d’impact sur la vie privée et les libertés pour certains traitements à risques (voir fiche CNIL).
Présentation du schéma “Le cycle de vie des données”
Source : OpenDataFrance - Licence : CC-BY-SA
Version : v2.0, date : mai 2022
Crédits : Document élaboré avec les partenaires des territoires d’expérimentation dans le cadre du sprint “cycle de vie des données” OpenDataLocale et en particulier les archives du CD83
Le cycle de vie des données présente le processus de production, d’utilisation et de conservation ou destruction des données dans une organisation. Il liste les différentes étapes et les acteurs intervenants. Le cycle de vie des données s’applique à l’ensemble des données des organisations. Il permet de repérer la manière d’utiliser les données en fonction de leurs caractéristiques et de préciser les différents usages des données en fonction de leur spécificité. Il présente les différentes interventions nécessaires tout au long de la vie des données dans et hors de l’organisation.
Il existe un cycle par usage. Une donnée peut donc appartenir à plusieurs cycles de vie.
Le schéma présente les différentes phases du cycle de vie. Il est un outil utile pour diffuser, auprès de tous, la bonne compréhension de la circulation des données au sein d’une organisation ainsi que les bonnes pratiques qui y sont attachées.
La première phase réside dans dans le choix, l’implémentation et/ou le paramétrage de l’application-métier. Ce premier choix est déterminant car il conditionne l’ensemble du processus d’acquisition et de gestion de la donnée. A l’heure de l’ouverture des données, une application qui ne permettrait qu’un export au format pdf, par exemple, compliquerait la tâche de mise à disposition du jeu de données.
Si la donnée est créée au moment où elle est saisie, cette dernière est conditionnée par les choix effectués en amont sur notamment l’application métier, dans les champs des formulaires. Lors de la phase de planification de la gestion des données, certaines décisions sont prises et déterminent la manière dont les données seront structurées. Le paramétrage de l’application métier conduit ainsi à la production de la structure générale de la base de données interne.
Les outils du SI contraignent la structuration des données. Par exemple : le nommage des champ, leur présence (obligatoire ou pas), le format et la codification de ces champs
Les choix qui sont effectués à cette étape ont des conséquences déterminantes sur le cycle de vie des données : cela a des implications sur la possibilité d’exporter des données et des métadonnées, et sur le choix du/des formats d’export (csv, xml, json...). La qualité des données est clairement un enjeu de cette phase car c’est à ce moment-là que sont définies les règles. L’application doit avant tout répondre aux besoins métiers tout en prenant en compte les besoins techniques et juridiques (archives, CNIL…). C’est à ce stade que la gouvernance est cruciale pour impliquer les personnes concernées et réaliser les bons arbitrages.
La phase d’acquisition de données correspond à la "production" de la donnée.
Les données peuvent être saisies manuellement par un producteur de données (un agent à l’Etat civil, par exemple), ou produites grâce à un capteur (comme lors du comptage du public dans un lieu). Dans le cas d’une captation automatique, représentée par la flèche marquée [1] sur le schéma, on importe des données issues d’une autre application. Les données peuvent donc être récupérées, via des protocoles informatiques, pour limiter la saisie manuelle d’informations existant déjà dans d’autres applications. Cela impose une parfaite correspondance entre l’objet décrit dans chaque champ, le nom et les valeurs possibles de ce champ. Par exemple : dans le cadre d’un marché public, la donnée “identification de l’acheteur” est le SIRET de l’acheteur, elle est donc normée de facto (suite unique de 14 chiffres pour chaque entité), en revanche le “nom de l’acheteur” doit être normalisé en définissant la règle de nommage à utiliser (Par exemple, on a le choix entre Conseil Départemental du Tarn, Département du Tarn, CD Tarn, CD81...). Il est possible de définir les caractères autorisés (majuscules en début de mot ou pour la totalité du mot, minuscules pour toute ou partie du mot, accents, etc.). L’arrêté du 14 avril 2017 relatif aux données essentielles dans la commande publique est un bon exemple de normalisation des données. C'est la question de la standardisation. A ce stade du cycle, il est fondamental que la saisie des données soit guidée. Car la saisie sans contrainte a une forte incidence sur l'hétérogénéité et la complétude, donc sur la qualité. La préparation de la phase de production, via du paramétrage et de la formation, est donc capitale pour la suite du cycle.
Le procédé de vérification et de contrôle qualité est nécessaire pour s’assurer de la fiabilité des données. Il peut prendre la forme de contrôles automatiques ou manuels (c’est pourquoi les procédures de la première phase doivent être réalisées avec précision et de façon exhaustive). Par exemple, dans le cas d’utilisateurs devant saisir manuellement des champs normalisés (tel qu’une date), une application bien paramétrée contraindra la saisie (le champ se présentera sous la forme de date définie : jj/mm/aaaa) ; à l’opposé, une application moins performante nécessitera un contrôle humain. Les phases T1 et T2 peuvent se répéter tant que la donnée n’est pas prête à être validée. La procédure-métier peut nécessiter des modifications, des traitements, des corrections ou des enrichissements.
Dans cette phase T3, iI s’agit de travailler à la validation-métier, sur le “fond”, de la donnée. Les étapes précédentes garantissent la validation sur la forme. Et ce n'est qu'à l'issue de cette phase de validation que la donnée est considérée fiable : elle peut alors être utilisée par le métier, partagée au sein de la collectivité et publiée en ligne à destination des citoyens et des organisations. L’exemple du budget est intéressant : dans une collectivité, chaque entité ou service fait sa demande de budget ; cette demande fait l’objet d’un arbitrage et les montants attribués peuvent être modifiés avant validation. La validation formalise le moment où la donnée correspond à une réalité, à une décision de la collectivité et où elle peut être publiée. Il est important que les outils permettent de figer les données une fois validées afin de garantir la fiabilité et la pérennité.
Le format des données dans la base métier peut ne pas être le même que le format d’export défini pour l’open data. Ce qui est important, c’est que la donnée disponible comporte toutes les informations nécessaires à son formatage open data : éléments nécessaires pour codifier une date, une entité juridique (SIRENE), une adresse ou une localisation (format de projection et niveau de précision), etc.
Juste après la validation, les données peuvent donc être utilisées par d’autres applications-métiers ou être publiées en ligne. Ici, il y a deux branches pour illustrer la diversité des usages :
La publication en open data qui consiste à donner un accès à des fichiers contenant des copies des données sur des sites web (ou portail) avec une licence (la Licence Ouverte ou Licence OdBL). Pour rendre en rendre l'exploitation possible, il est important que les données soient clairement présentées et documentées (métadonnées) et que les fichiers soient lisibles par des machines, dans des formats non propriétaires. Rappelons que la mise en ligne des données est une obligation pour les collectivités de plus de 3500 habitants et 50 agents (ETP) depuis la loi pour une république numérique, dite Loi Lemaire.
L'utilisation par une autre application : dans cette hypothèse, les données correspondent aux besoins de cette application ce qui impose, sur le fond, d’assurer la fiabilité, l’exhaustivité et la fraîcheur des données afin d’éviter de fausser les données de l’application de “destination”. Sur la forme, une standardisation sera la garantie d'une interopérabilité entre les deux applications et assurera qualité et homogénéité.
Pour être possible et facile à mettre en place, il est préférable de prévoir et d’anticiper cette phase de mise à disposition en vue de la réutilisation.
Le numérique laisse penser que tout peut être entreposé et gardé dans les serveurs informatiques sans limite de temps. Or, on ne peut pas tout conserver! Comme dans l’univers du papier, il faut savoir faire un tri. Ce tri consiste à faire le choix de conserver ou détruire certaines données. Il y a des lois qui encadrent la durée de conservation et qui définissent si les données doivent être détruites ou conservées définitivement. Cela dépend de la valeur des données :
la valeur juridique (combien de temps ai-je besoin de conserver pour prouver un délit ou, plus largement, prouver les actes),
la valeur informationnelle (pendant combien de temps ai-je besoin de l’information pour travailler),
la valeur patrimoniale (quand il n’y a plus de valeur juridique ou informationnelle, on l’évalue sous l’angle de la valeur patrimoniale : il est possible d’identifier intérêt pour l’histoire).
Point de vigilance : il peut être intéressant d’avoir réalisé le travail de recensement et d’évaluation de cette fin de cycle (conservation ou destruction) le plus en amont possible. En effet, dans l’environnement numérique, il est beaucoup plus difficile, voire impossible, de réaliser les actions d’“archives” si cela n’a pas été prévu en amont. Associer des compétences expertes sur cette dimension (archivistes) est essentiel.
NB : Les données publiées en open data sont généralement des copies (extrait, normalisation, agrégation) de données-métier. Les données-métier possèdent une logique d’archivage propre, établie en concertation entre les métiers, les archives et la DSI. A priori, il n’y a pas de nécessité absolu pour les données publiées en open data d'être archivées. Cependant, cette pratique est utile si l’on veut conserver l’historique et le contenu des données publiées à un moment donné. Cette décision doit être prise en concertation avec le service des Archives qui décidera de son intérêt juridique, opérationnel ou historique et de son coût.
Nombreux sont les acteurs, agents ou usagers de service public, qui jouent un rôle dans la production, la circulation et l'utilisation de la donnée. L’open data révèle l’importance de la gestion de la donnée (ou de sa gouvernance) durant tout son cycle de vie. Cela a des impacts fonctionnels et techniques mais également organisationnelle. L’amélioration des processus de gestion des données apporte des bénéfices importants à la collectivité dans la maîtrise de son patrimoine informationnel. Cela profite à tous et l’ouverture des données s’en trouve largement facilitée.
Source : OpenDataFrance - Licence : CC-BY-SA
Version : v2.0, date : mai 2022
#association #opendata #datacollectif
Source : OpenDataFrance - Licence : CC-BY-SA
Version : v2.0, date : juillet 2022
L’AFIGEO est l’Association Française pour l’Information Géographique créée en 1986. Elle a pour objet d’accompagner le développement du secteur de l’information géographique en France et à l’international. Elle fédère près de 200 organismes (producteurs et utilisateurs, collectivités territoriales et services de l’État, grands groupes et TPE, universités et organismes de formation...), qui échangent et partagent sur les questions clefs du marché de l’information géographique, des services associés, de ses usages et des évolutions des formations à la géomatique. Elle anime des groupes de travail dont un dédié à l’ouverture des données, participe à des actions internationales (ENERGIC OD…), produit des ressources documentaires (“L’information géographique et l’open data” en 2017) et organise des événements d’envergure.
La Fondation Internet Nouvelle Génération est un think tank créé en 2000 par Daniel Kaplan et Jacques-François Marchandise. Il s’intéresse à toutes les transformations numériques, réunit des acteurs des organisations publiques et privés et favorise le dialogue avec les acteurs de la recherche. Dès 2010, la FING engage des expérimentations sur l’open data dans deux territoires pilotes et anime au niveau national la réflexion sur la réutilisation des données publiques par des événements (Open Data Garage). En 2013, la question du public des données se pose de façon abrupte : or, sans public, comment faire de l’innovation sociale? La campagne Infolab est lancée, une expérimentation sur le Self Data également. L’objectif est de définir la culture des données et produire des médiations qui peuvent faciliter l’accès à cette culture. L'association a cessé son activité en 2022 mais certains de ses chantiers, comme le programme "Culture D" (acculturation à la donnée) sont repris par l'association Opendata France.
Créée en 2009, LiberTIC est une association nantaise de loi 1901 qui a favorisé le développement des démarches d’ouverture sur l’ensemble du territoire français. Grâce à la rédaction d’une lettre ouverte signée par 200 personnes, elle est à l’origine de l’engagement de la ville de Nantes dans l’open data en février 2011. Elle participe à la veille en produisant une carte de France de l’open data et à la création d’outils de sensibilisation (vidéos, ressources documentaires...). L’association est co-organisatrice de la première Opération Libre (et des suivantes) et des éditions de l’Open Data Week (Marseille 2013, Rennes 2015).
L’association Opendata France a été en octobre 2013 et réunit les collectivités engagées dans des démarches d’ouverture des données publiques. Elle a pour objectif de promouvoir l’open data à toutes les échelles territoriales et de faciliter sa mise en œuvre par les échanges avec les différents acteurs économiques et politiques. Elle émet une veille et édite des guides de sensibilisation, organise des formations et événements. Des groupes de travail sont animés sur des thématiques structurantes (standardisation, cadre légal, indicateurs…) et contribuent à la création de référentiels nationaux.
Open Knowledge International est une organisation non-gouvernementale qui milite pour le développement de l’open data en encourageant les initiatives gouvernementales et les réutilisations par la société civile. Elle fournit la solution CKAN, solution technique open source qui permet la publication de données. Elle est à l’origine du projet School of data qui propose des cours en ligne et assure des formations (Ecole des données pour la version française). Elle réalise aussi l’Open Data Index, classement international des pays engagés dans les démarches d’ouverture.
Le projet OpenStreetMap est né en 2004 au Royaume-Uni et se fonde sur la contribution des usagers pour la production de données géographiques. La base de données est sous Open Database Licence cartes (ODbL). En 2006, est créée la fondation OpenStreetMap. En France, l’association a participé à la création de la Base Adresse Nationale (Ban : adresse.data.gouv.fr) aux côtés de l’Etat Français, du Groupe La Poste, de l’IGN. Cette base référence l’ensemble des adresses du territoire français et vise à fournir des données de référence aux acteurs de la sécurité, de la santé et des services.
Regards Citoyens est un collectif qui s’est formé en juillet 2009 et qui s’est constitué en association en juin 2010. L’association travaille à la promotion de la mise à disposition des données publiques par la création et le développement d’outils. Elle met au cœur de ses préoccupations l’éducation et la citoyenneté. Elle produit des dispositifs qui permettent aux citoyens de participer à la vie publique (Crowdsourcing de l'analyse de la consultation Égalité Femmes/Hommes en 2016, numérisation des déclarations d’intérêts en 2013).
Source : OpenDataFrance - Licence : CC-BY-SA
Version : v2.0, date : juillet 2022
Il n’y a pas une feuille de route unique pour engager une démarche d’ouverture de données au sein d’une collectivité ou d’une organisation. Les cheminements suivis ne sont jamais identiques et dépendront du contexte : organisation, forces en présence, stratégie institutionnelle...
Une constante incontournable reste l'engagement des politiques et des décideurs dans le processus. En ce sens, si la loi pour une République numérique introduit l’ouverture “par défaut” des données administratives déjà disponibles au format électronique, une délibération de principe prise par l’instance délibérante semble indispensable pour acter la démarche.
Les grandes étapes sont ensuite de déterminer la gouvernance de cette politique d'ouverture en répondant aux questions : quoi (inventaire des données et choix d'ouverture), qui (instances stratégiques et opérationnelles), où (sur quelle plate-forme de données, en privilégiant les démarches de mutualisation) et comment (licence retenue, fréquence de mise à jour…).
Avant toute démarche il apparaît incontournable de consulter les élus, les décideurs, les directions et services et éventuellement la société civile (représentants, réutilisateurs potentiels…). Cela afin de lister les attentes de l’institution dont découle une éventuelle stratégie open data. Cette phase reste consultative. Elle gagne à être animée avec des techniques issues de l'intelligence collective.
Au sein de l’organisation, il sera également nécessaire d'initier la démarche en mode projet (gouvernance, moyens, calendrier prévisionnel…). Notamment en nommant un élu référent (soutien et légitimité de la démarche), un chef de projet (facilitateur, animateur et communicant), un éventuel comité de pilotage (pour prendre les décisions et diffuser largement l'information au sein de la collectivité) et des éventuels référents par direction ou service (pour décentraliser la démarche et impliquer les métiers).
Il est également important de s’entourer de différentes compétences au sein de la culture des données : CIL/DPO, PRADA, informaticien, géographe, documentaliste, archiviste. Ils constituent des atouts incontournables à ce type de projet, apportant chacun des expertises dans la chaîne de valeurs.
Selon la nature du projet, d'autres expertises peuvent être sollicitées : conduite au changement, animation et concertation, communication et éditorialisation, datavisualisation...
Présenter pourquoi la collectivité engage une démarche d’ouverture de données, préciser son ambition première (Transparence de l’action publique ? Innovation ? Développement économique ? Bien vivre ensemble ?...), spécifier la plateforme de données retenue pour la publication, présenter son organisation en mode projet, préciser la/les licences retenues…
Définir le périmètre des données publiques à ouvrir pour la première mise en ligne. Un simple tableur permet de recenser les jeux de données identifiés comme "ouvrables". On s'attachera à décrire chaque jeu de données aussi précisément que possible, en produisant les métadonnées associées : titre, descriptif, propriétaire, date de création, date de mise à jour, format, licence choisie, contact référent, contient un (ou plusieurs) risque juridique (des données à caractère personnel, des secrets, touche à la sécurité informatique…), remarques...
Pour identifier les premiers jeux de données la collectivité pourra s'intéresser aux données de référence, aux données associées à ses compétences, au Socle Commun des Données Locales, aux recommandations d'Opendata France et surtout au dialogue avec les directions et services pour recenser l'existant.
Pour être compréhensibles et utiles à tous, les producteurs de données vont opérer plus ou moins d’interventions sur les données : les rendre intelligibles pour des personnes extérieurs, supprimer les doublons, s’approcher des standards de publication, géolocaliser les données, anonymiser éventuellement le fichier, documenter les données...
OpenDataFrance propose des outils de validation des données comme Validata.
Une fois recensés, les jeux de données peuvent être publiés directement sur le site web de la collectivité avec le répertoire des documents administratifs (dont le catalogue des données publiées). La publication sur une plate-forme de données permet une gestion plus fine pour la production de données (gestion des versions, du téléchargement, des statistiques, mise en place d’API...). Cette forme de publication apporte aussi des fonctionnalités avancées pour les réutilisateurs (géolocalisation, recherche par métadonnées, déclaration des usages, datavisualisations). L’objectif d’une plate-forme est de développer la visibilité et d’éditorialiser les données publiées.
Il est important, dans cette phase, d'avoir une démarche centrée "réutilisateurs" afin de mettre à disposition les fonctionnalités pertinentes pour favoriser la réutilisation des données. Cela passe notamment par de l'éditorialisation, des vues ou métadonnées sur le contenu, des facilités de téléchargement, la mise en place d'API, voire des Datavisualisations.
A minima, la collectivité devrait recenser systématiquement ses données sur http://www.data.gouv.fr/fr/ ou sur une plate-forme locale.
L’animation et la médiation aux données doit constituer un axe fort de la démarche. La constitution et l’animation d’une communauté de réutilisateurs existants et potentiels, internes (les directions métiers) et externes, reste l’un des meilleurs moyen pour développer les usages. Il convient d’acculturer les agents, les citoyens, les associations et les entreprises aux données. Cet axe de la démarche participe très directement à la transformation numérique du territoire concerné.
Le Laboratoire de la valorisation des données publiques en Occitanie, OpenDataLab, propose un test d’une liste de 48 prérequis pour se lancer dans une démarche d’ouverture des données (http://www.opendatalab.fr/images/Tableurs/Check-list-prerequis-V1.xlsx)
OpenDataLab propose une variante de six étapes pour initier une démarche d’ouverture des données :
Source : OpenDataFrance - Licence : CC-BY-SA
Version : v2.0, date : juillet 2022
Certains acteurs économiques ont joué un rôle majeur dans le développement de l’open data en France. Ils ont contribué notamment à l'émergence de communautés d’acteurs des données ou ont créé des offres de services structurantes qui ont permis aux acteurs publics de démarrer des démarches d'ouverture des données.
Le Groupement Français des Industries de l’Information est un think tank spécialiste du marché de l’information et de la connaissance. Le GFII a pour vocation de rassembler les acteurs de l’information professionnelle - producteurs d’informations, prestataires de solutions, éditeurs, diffuseurs, bibliothèques universitaires, centres de documentation, etc. Le GFII organise des rencontres pour que les acteurs de l’information puissent échanger leurs points de vues sur des sujets aussi larges que l’économie, la législation et les aspects techniques du secteur. Le GFII organise également des groupes de travail autour de sujets stratégiques que l’open et le big data, veille et traitement avancée des données, open access, etc.
La Fédération SYNTEC a été créée le 1er janvier 1991.
Devenue Numeum, fusion de Syntec Numérique et de TECH IN France, elle regroupe les entreprises de services du numérique (ESN), les éditeurs de logiciels, les plateformes et les sociétés d’Ingénierie et de Conseil en Technologies (ICT).
La Fédération apporte son expertise sur plusieurs points : la négociation et la conclusion de conventions et accords collectifs de travail ; la représentation commune de ses unions de syndicats et de ses syndicats auprès des Pouvoirs Publics ; l’étude de questions économiques, techniques, juridiques, etc. d’intérêt commun aux unions de syndicats adhérents.
Les cabinets de conseil CIVITEO, DATACTIVIST, INNOPUBLICA et le cabinet d’avocats PARME Avocats forment une alliance d’entreprises et créent une marque commune pour offrir leurs services aux acteurs de la sphère publique confrontés à l’explosion des problématiques de gestion des données. Transparence, ouverture des données publiques et loi sur l’open data, villes intelligentes et projets de smart city, big data des territoires, recours aux algorithmes et à l’intelligence artificielle, protection des données personnelles des habitants… les enjeux de la gestion des données sont de plus en plus présents dans la sphère publique.
La société OpenDataSoft a été créée en 2011 avec pour volonté de développer une plate-forme en ligne servant à la transformation rapide des données en informations et en services (API, visualisation de données, etc). L’objectif est de faciliter la publication des données par les collectivités territoriales et les entreprises et dans le même temps faciliter le partage de ces données en vue de leur réutilisation par les usagers.
Cityzen Data propose d’aider les villes à installer des capteurs aux endroits clefs pouvant contribuer à l’amélioration des services urbains à destinations des habitants. La société propose également de mettre à disposition de ses clients une plate-forme, des outils d’analyse, des API et des outils de visualisation.
L’infrastructure Ozwillo a été créée suite à un projet européen par des utilisateurs, des développeurs, des fournisseurs de services. Regroupés en association créée le 5 février 2016, avec pour dessein une utilisation neutre et loyale de l’infrastructure Ozwillo et des données. Elle vise aussi à valoriser les données par la maîtrise et l’exploitation de ces dernières ; à promouvoir les applications par une meilleure visibilité et un plus large accès en mobilité de celles-ci ; et la dynamisation des projets, de leur idée à leur commercialisation.
MGDIS édite des logiciels d’aide à la décision et au pilotage depuis 1983, à destination des collectivités locales, des hôpitaux, des EHPAD, des organismes d’État et des établissements publics et parapublics. Ces logiciels de gestion et de pilotage ont plus précisément pour vocation à : aider à la direction financière et à la maîtrise des cycles financiers ; aider et éclairer les directions générales et financières à la prise de décisions stratégiques ; accompagner les élus pour le déploiement des politiques publiques ; organiser et piloter la gestion des dossiers et procédures administratives ; etc.
Isogeo est l’éditeur de la plate-forme web (SaaS) du même nom, créée en 2009 avec l'objectif d’aider les organismes publics et privés à optimiser l’utilisation, le partage et la valorisation de leurs données géographiques.
Depuis, elle permet le recensement et la diffusion de tout type de données via ses outils de catalogage et son API RESTful, permettant de gérer plusieurs niveaux de consultation orientés usages professionnels, semi-professionnels et publics.
dans le champ de la donnée
OpenDataFrance propose une version synthétique et pragmatique de la conduite de projet en abordant :
Agir en "mode projet" permet d'atteindre un objectif fixé en s'appuyant sur des méthodologies éprouvées et d'entrer dans un cadre qui facilite l'obtention du résultat visé, notamment quand il s'agit d'innovation.
Quelle que soit l'ambition initiale, il est recommandé d'appliquer une méthodologie de gestion de projet, qu'il s'agisse :
De l'ouverture de données, du développement d'une plateforme de diffusion de données, d'un projet global de mise en œuvre de l'open data dans une structure publique ou privée (traduction opérationnelle d'une politique, d'une stratégie de la donnée), de la circulation des données (API, élaboration de standard, partage entre acteurs identifiés…),
De l'usage, de l'exploitation des données (création ou amélioration d'un service numérique, pilotage, alimentation de la transition environnementale, de travaux de recherche, d'un observatoire, d'une concertation)…
En initiant un projet, on s'assure en premier lieu de répondre correctement à un besoin.
En agissant selon une méthodologie projet on vise la réussite, cependant, on peut affronter une situation d'échec. Elle ne devra pas être vécue comme une erreur indépassable - droit à l'erreur - mais au contraire comme une leçon dont tous les acteurs du projet s'inspireront pour améliorer leur façon de procéder. Il est important de capitaliser sur les réussites comme sur les échecs et le projet est un cadre qui le permet.
Un projet, c'est :
Un objectif clairement défini à atteindre
Une liste de tâches précises pour y parvenir
Trois principes à équilibrer :
La qualité de la réponse apportée
La maitrise des couts
Le respect des délais
Une attention continue portée à l'usager-bénéficiaire cible.
Le projet est ponctuel, il a un début et une fin (un planning) et il lui est attaché des moyens humains, techniques, juridiques, administratifs et financiers.
Précision : L'amélioration continue d'un service numérique, un produit, d'une solution, d'un jeu de donnée ouvert… est une démarche qui pourra être initiée à l'issue du projet. Elle est généralement portée par un.e Chef.fe de produit (product owner) ou un Ingénieur d’amélioration continue (commun dans le secteur industriel).
Le projet dans le domaine du numérique et de la donnée a naturellement une dimension d'innovation et par la même intègre la conduite du changement dans son déroulé et l'itération (développement ou résolution par phases successives) dans sa réalisation.
Ressources :
Les notions de bases de la gestion de projet : Blog "Réussir ses projets"
UTILO, kit des facilitateurs d'innovations publiques en Bretagne (susciter l’intelligence collective pour concevoir ou faire avancer un projet) par La communauté des Facilitateurs d’innovation publique de Bretagne UTILO et le Ti Lab
Exemple de conduite de projet partenarial RUDI par Rennes Métropole : plateforme et "réseau social" de donnée
Guide de l'innovation centrée-usager par La FING
Développer de nouveaux services numériques par le CEREMA
Les principes de gestion de projet : QCDA
6 étapes clés de la conduite du changement par le MBA marketing digital & e-commerce de l'Institut Léonard de Vinci
Conduite du changement organisationnel dans l'administration publique -Revue de littérature - FE Nouiker - International Journal of Accounting, - 2021 - ijafame.org
La conduite de projet est une mission à part entière qui peut être menée par des personnes dont c'est la fonction (chef.fe, directeur.trice de projets) ou confiée pour un temps donné à un agent, un.e salarié.e, un.e intrapreneur.euse dans le secteur public ou privé, un.e prestataire… expert.e sur le domaine de la donnée et/ou plus globalement du numérique ou encore, dont l'engagement sur le sujet traité assure le portage du projet.
Une lettre de mission – ou toute démarche similaire - est recommandée car elle permet d'asseoir la légitimité d'un.e chef.fe de projet.
Le.a chef.fe de projet est garant de la réussite du projet, c'est lui.elle qui en porte la responsabilité.Démarche d'ouverture des données ou développement de service numérique, un projet ne peut aboutir positivement que par la désignation d'une personne l'incarnant.
Le.a chef.fe de projet constitue une équipe projet sur laquelle il n'a pas de pouvoirs hiérarchiques mais qu'il fédère (management transversal) afin de faire émerger synergie des compétences et intelligence collective au service du projet. Chaque membre de l'équipe projet a des tâches à mener et des objectifs à atteindre, assignés par le.a chef.fe de projet avec qui la communication doit être fluide et constante.
Le.a chef.fe de projet réalise également un état des lieux de son écosystème local et plus global pour identifier des partenaires potentiels, des homologues travaillant sur les mêmes sujets (mutualisation envisageable), les réseaux existants et les structures pouvant lui apporter ressources et documentation, soutien, animation d'événement en lien avec le projet ou de mobilisation de "testeurs", démarche de médiation (réseaux, associations, monde académique, experts reconnus sur le domaine, laboratoires d'innovation locale, tiers-lieux …).
Le.a chef.fe de projet doit mettre en œuvre une gestion de projet qui s'appuie sur 3 volets :
la planification (calendrier – diagramme de Gantt par exemple- coordination des tâches, jalons)
le suivi (organisation, mesures d'ajustement au contexte)
le contrôle (activités effectuées, objectifs atteints)
Il.elle s'assure en continu de la qualité de la communication au sein de l'équipe projet, avec les personnes ressources sollicitées ponctuellement, les commanditaires (élus, direction, propriétaire du projet…) partenaires le cas échéant et bien entendu avec les usagers finaux. Plus globalement, il met en œuvre un plan de communication tout au long du projet et pas uniquement sur les résultats finaux, même si c'est un point d'orgue de ses actions de communication.
La gouvernance d’un projet, c'est une définition des rôles et responsabilités de chaque acteur du projet, notamment l'équipe projet mais aussi des personnes ressources impliquées, sollicitées ponctuellement. Parmi les outils qui peuvent être exploités pour les préciser : RACI ou matrice de responsabilité.
Sur le sujet spécifique de la gouvernance de la donnée (et de la coopération), un article dédié est en ligne sur l'espace ressources d'OpenDataFrance.
Une gouvernance claire permet un pilotage clair : plusieurs responsables signifie une absence de responsabilité voire un conflit, situation à écarter dans la gestion de projet au profit d'un dialogue constructif et d'une circulation active des informations.
La gouvernance peut se traduire, lorsque les moyens informatiques de la collectivité ou de la structure le permet, par la création d’une plateforme de gestion de ce projet incluant les échanges permettant une transparence sur l'ensemble des actions menées et des résultats obtenus.
La gouvernance d'un projet se traduit aussi dans sa "comitologie". La gestion de projet nécessite de mettre en place des instances qui seront dimensionnées selon l'envergure du projet. Voici une liste d'instances standards qui sera adaptée au contexte et aux enjeux :
Le comité politique (COPOL) : C'est un échange avec les élus dont les délégations sont impactées ou pour qui le projet est une mise en œuvre du plan de mandat et des politiques qu'ils portent, dans le cas des collectivités territoriales. Ce peut-être également une réunion avec les ministres, le Préfet mais aussi le.a Président.e ou CEO dans le secteur privé (selon le contexte, les porteurs de la politique). Il s'agit d'aborder généralement l'initialisation du projet (accord politique sur les objectifs visés et sur le lancement du projet), un bilan intermédiaire et une présentation des résultats.
Le comité stratégique (COSTRA) : Tout projet s'appuie sur une stratégie (enjeux auxquels le projet répond) et un plan d’action visant à établir les charges et à coordonner l’action des intervenants. Sa composition doit permettre d'avoir une vision globale du projet, permettant de dresser un état des lieux du projets à ses différentes phases. C'est une réunion régulière qui a pour vocation de prendre des décisions, de renforcer l’adhésion de tous les acteurs et faire office de "sponsor du projet". Le comité stratégique rassemble les décideurs et garantit la concordance entre les actions menées dans le cadre du projet et la stratégie dans laquelle elle s'inscrit.
Le comité de Pilotage (COPIL) : Le comité de Pilotage figure, parmi les instances de gouvernance, comme celui chargé, d’une part, d’impulser l’intervention du sponsor, afin de s’assurer que la meilleure décision sera prise, et, d’autre part, d’établir l’état d’avancement du projet IT. Il est le garant de la cohérence entre les décisions à prendre et les enjeux de l’opération, notamment au regard des délais et des coûts du projet IT. Sa fonction est multiple. Du suivi global de l’avancement du projet à la prise de décision conformément aux finalités, en passant par l’orientation ou la modification des actions sur proposition du client, le comité de Pilotage a un rôle clé dans la bonne marche du projet. Le COPIL est une instance essentielle qui s'assure que le projet se déroule conformément aux objectifs définis. C'est l'instance qui permet de :
Suivre la progression du projet selon le planning initial
S'assurer de l’avancée des livrables prévus
Suivre le budget, le planning et la qualité des livrables
Identifier les alertes et les risques, définir les solutions
Prendre des décisions sur les sujets bloquants et les ressources à affecter, définir des modes de solutions et prendre des décisions Le COPIL remonte au COSTRAT ou COPOL les problèmes qui relèvent de leur périmètre et donc de décisions majeurs. Pour les organisations plus modestes, le COPIL fait office de COSTRAT et de COPOL.
Le comité de Projet (COPROJ) : C'est la cheville ouvrière du projet, une instance plus opérationnelle qui permet très concrètement de piloter le projet. Le.a chef.fe de projet anime ce comité et s'assure au travers de cette instance du bon déroulé du projet et d'une coordination de ses acteurs comme des tâches affectées, en cours et à venir. Les points de tension sont passés en revue, comme l'est l'application d'un potentiel PAQ (Plan d’Assurance Qualité), une revue des livrables est réalisée avec le degré d'avancement (recette, livraison…). C'est le cadre de décisions opérationnelles en matière de modification ou de conformité des choix fonctionnels ou techniques avec une revue des différents indicateurs (KPI) et adaptation, au regard de ce suivi, des ressources.
Outre ces instances, on peut également avoir le comité de Décision Métier (CODEM), le comité de décision technique (COTEC), le comité de suivi des activités de maintenance (CORUN).
Concevoir un projet c'est identifier le besoin et définir les objectifs pour y répondre.
Il s'agit de formaliser les principales étapes et d'identifier les ressources (humaines en premier lieu) et les parties prenantes pour atteindre les objectifs.
Il peut être utile de faire des études de faisabilité pour estimer l'envergure du projet (coût, mobilisation de compétences internes ou externes, évolution technologique…) afin de mesurer les capacités à le porter.
Dans cette phase de conception, il est nécessaire d'établir des critères de réussites et de suivre les indicateurs tout au long du projet.
L'organisation propre au projet doit être mise en place, en s'assurant que les responsabilités soient établies, chaque domaine de compétences nécessaire soit couvert et que la gouvernance soit installée.
Le calendrier du projet est arrêté. Pour chaque livrable,
les tâches à réaliser sont précisées,
le budget attribué
le temps de leur réalisation déterminé
les ressources nécessaires identifiées
la personne responsable désignée
les dépendances entre tâches bien comprises (doivent-elles être réalisées avant, parallèlement, après.. certaines autres tâches)
Une évaluation des risques (par exemple par la méthode AMDEC - Analyse des Modes de Défaillance, de leurs Effets et de leur Criticité) permet d'anticiper les problèmes et de trouver collectivement des solutions.
C'est l'étape de la réalisation, les tâches sont effectuées selon le plan d'action, sous le pilotage du.de la chef.fe de projet. Une attention particulière est portée aux activités majeures qui garantissent la réussite du projet et des jalons qui leur sont attachés sur lesquels il est nécessaire d'être très attentif.
Il est conseillé de mener un projet, lorsqu'il est complexe, en plusieurs étapes afin de garantir la mobilisation des personnes impliquées sur le long terme, sans épuisement ni démotivation, et de reconnaitre pour chacune des étapes, les réussites acquises. C'est un acte fédérateur qui permet à l'équipe de mesurer concrètement les avancées et de maintenir l'engagement collectif. L'attention portée aux talents participant au projet reste la clé essentielle de son succès.
Les livrables intermédiaires doivent être testés si possible auprès de l'utilisateur-usager final. On privilégiera la méthode agile qui permettra une itération sur chacun de ces résultats afin de réagir au plus tôt en cas d'inadaptation aux besoins et ceci afin de garantir l'atteinte des objectifs comme la satisfaction du client-usager.
L'énergie nécessaire à la réalisation et à l'exécution du projet doit être mobilisable jusqu'au livrables finaux, gages d'atteintes des objectifs.
La valorisation des livrables (donnée ouverte, plateforme de diffusion mise en ligne, service numérique et application déployés…) nécessite un accompagnement au changement (formation, séance de présentation, événement) qui ne s'improvise pas et une stratégie de communication anticipée.
Un bilan du projet doit être établi afin de capitaliser sur les résultats positifs tout comme les problèmes rencontrés afin d'enrichir la conduite de projet à venir.
Une revue des indicateurs créés au moment de la conception est réalisée et permet de mesurer pertinence du dimensionnement des ressources, difficultés et atouts du projet.
Ressources :
Conduite de projet : définition et principes communs (WikiTerritorial – CNFPT)
Diffuser la culture du mode projet dans la fonction publique (Direction Générale de l'Administration de la Fonction Publique - 2019)
La gestion de projet selon l'école EDC Paris Business School
L'impact d'un projet doit être évalué. Il existe plusieurs méthodes pour le mesurer et au préalable, il faut définir des indicateurs – quantitatifs, qualitatifs – qu'il sera nécessaire de suivre pour opérer des actions correctrices ou comprendre le niveau de satisfaction de la cible du projet.
Ressources :
L'outil de définition des indicateurs développé par la Direction Interministérielle de la Transformation de l'État (DITP)
Explorer le DLI, diagramme logique des impacts proposé par la DITP
MOOC "Évaluation et étude d’impact" par Dr Rémy Bachelet, maître de cong-férence à Centrale Lille
Une méthode agile est une approche itérative et incrémentale pour développer une solution (logicielle généralement mais adaptable à tout livrable d'un projet) en s'appuyant sur l'intelligence collective, et répondant le plus efficacement possible aux besoins exprimés par les utilisateurs- usagers-citoyens.
Parmi les modes de gestion de projet, la méthode agile est celle plébiscitée car dans ses principes, on trouve celui qui guide son exécution : " Les utilisateurs ou leurs représentants et les développeurs doivent travailler ensemble quotidiennement tout au long du projet".
Il s'agit donc de placer l'usager-bénéficiaire cible (le citoyen in fine dans le cas de projets d'intérêt général) au cœur du projet, tout au long de son déroulé, quitte à opérer des changements dans les fonctionnalités, même tardivement dans l'avancée du projet, et d'exploiter ces modifications pour mieux répondre au besoin exprimé, pour "satisfaire le client (usager) en livrant rapidement et régulièrement des fonctionnalités à grande valeur ajoutée" (principe n°1 du "Manifeste pour le développement agile de solution").
Il existe plusieurs méthodes agiles sur lesquelles il est nécessaire de se former avant de l'appliquer. Parmi elles, on trouve :
Le Scrum qui est cadre de développement itératif de produits ou solution, de projets, complexes. C'est une méthode pour livrer "de manière productive et créative des produits de la plus grande valeur possible ». Scrum s'appuie sur le découpage d'un projet en "sprints" d'une durée de quelques heures à un mois. Chaque sprint débute par une estimation du besoin suivie d'une planification opérationnelle puis se termine par une démonstration de ce qui a été achevé. Le projet est ainsi découpé en "boîtes". Une des notion-clés est le “scénario utilisateur” : c'est une synthèse des spécificités de la tâche à réaliser ou de la fonctionnalité à développer.
Plus ancien et "base" de la méthode agile, le RAD (Rapid Application Development) débute par une formalisation des besoins exprimés ("cadrage"), une définition globale de l'architecture technique ("design") et une "construction" qui consiste en la réalisation à proprement parlé avec une validation immédiate et permanente via des tests (d'une application, d'une solution et pourquoi pas d'une donnée en cours de publication pour s'assurer de son utilisabilité) impliquant le porteur du besoin (l'utilisateur final) en mode itératif-incrémental-adaptatif.
Adaptation en continu et sécurité doivent aller de pair et l'un ne se fait pas au détriment de l'autre. Agilité et sécurité concourent au développement des projets où la gestion du risque numérique a été prise en compte. Un guide en ligne éditée par l'ANSSI permet de bien intégrer la sécurité informatique au projet agile. De même, la protection des données personnelles devra être prise en compte dans tout développement et donc by design, afin de respecter le Règlement Général sur la protection des Données Personnelles (RGPD).
Ressource :
"Synthèse des synergies entre écoconception, cybersécurité et protection des données" par la Mission Numérique Eco-Responsable
C'est dans cet esprit d'agilité qu'a été lancé beta.gouv. Il est possible de trouver ressources et accompagnement dans le cadre de ce programme d’incubation "qui aide les administrations publiques à construire des services numériques utiles, simples, faciles à utiliser et qui répondent vraiment aux besoins des gens."
Il existe d'autre modes de gestion de projet traditionnelle par cycle en V ou en cascade qui comporte plusieurs phases se déroulant linéairement. Il comporte un risque d’écart entre le besoin exprimé, traduit dans un cahier des charges fonctionnel (sans modification possible), et le besoin réel au moment de la "livraison".
Ressources :
MOOC "Gestion de projet agile avec scrum" par Dr Rémy Bachelet, maître de conférence à Centrale Lille
"Entrez dans le monde des méthodologies agiles" sur OpenClassRooms
MOOC Découvrez comment créer des services publics innovants par beta.gouv
En matière de conduite de projet d'innovation, le "design thinking", la pensée design, est une approche de l’innovation centrée sur l’humain qui peut nourrir la phase de conception comme d'exécution (voire de clôture) du projet.
C’est une méthode de conception globale, en vue de réaliser des services ou produits innovants en lien constant avec les besoins de l'usager.
Dans le cadre de l'Open Data, elle sert aussi bien le processus d'ouverture de la donnée ("comment faire en sorte que la donnée que j'ai ouverte soit utilisable simplement ?") que celui de sa valorisation ("de quelles données j'ai besoin pour développer le service qui répond aux attentes de ses bénéficiaires ?").
Il comporte 4 phases qui correspondent fortement à celles de la méthode agile Scrum et on voit le parallèle qui peut être opéré :
Identifier la problématique pour mieux définir le problème en s'immergeant dans le contexte de l'utilisateur-usager final ("être en empathie" avec ce dernier)
Rechercher des idées (idéation) par différents processus de créativité
Prototyper grâce à des brouillons, des maquettes, des schémas, toit processus qui aide à la visualisation, la compréhension de la solution… pour recevoir un premier retour de l'usager-bénéficiaire
Tester les solutions pour les affiner tout en en apprenant encore davantage sur les utilisateurs finaux et implémenter avec l'enjeu d'une amélioration en continu
Pour en savoir plus sur cette démarche, un document fait référence, il s'agit de "La boîte à outils Design Thinking de la d.school de Stanford" (en français).
Le.a chef.fe de projet doit mener régulièrement un exercice de présentation de son projet, que ce soit dans le cadre de l'initialisation pour obtenir l'aval des élus, décideurs comme l'adhésion de l'équipe projet au moment de sa constitution ou encore bien entendu obtenir des financements (de sa propre structure, de partenaires potentiel) ou encore dans le cadre d'appels à projets ou de différents challenges (trophées de l'innovation, etc).
Il s'agit de mettre en récit son projet par la construction et mise en œuvre de pitchs qui devront être adaptés à chaque défis rencontrés (cible, contexte, besoins des auditeurs métiers par exemple).
Parmi les ressources recommandées :
Intervention de Stéphane Schultz (Agence d'innivation 15marches.fr) à Rennes : "Pitch & Love (mon weekend en Startupie)"
"How to pitch" et "L'art du pitch" par l'agence NOD-A - Makestorming
La conduite de projet se doit d'intégrer les grands enjeux de société et d'être porteuse d'inclusion et d'impact positif sur le cadre de vie.
Pour mener à bien un projet d'innovation, il est essentiel de prendre en compte :
L'accessibilité : pour faciliter la mise en accessibilité des sites et services numériques, la direction interministérielle du numérique(DINUM) édite le Référentiel Général d’Amélioration de l’Accessibilité(RGAA) constitué de 2 parties que sont les obligations légales et la méthode d'implémentation
L'éco-conception grâce au Référentiel général d'écoconception de services numériques (RGESN)
L'impact environnemental de l'ouverture des données, pour le maitriser en intégrant les bonnes pratiques dans le cadre de son projet d'ouverture : guide GreenData d'OpenDataFrance
Les enjeux de la transition par la donnée grâce aux ressources des programmes "Données et transitions" (OpenDataFrance), Green Data for Health, EcoSphères…
Le numérique comme facteur de transition et de dynamique territoriale avec le "Kit Agir Local - Le numérique au service des démarches environnementales de nos territoires" (FING - 2017)
L'inclusion numérique notamment dans la conduite du changement. Gérer un projet c'est veiller à inclure tous les acteurs de sa chaine de valeur, à toutes les étapes du projet comme à l'usage du ou des livrables. Pour bien intégrer tous les aspects de l'inclusion, la MedNum propose ressources et réseaux.
Les conseils ci-après sont ouverts à toute suggestion d'enrichissement et retours d'expérience via contact@opendatafrance.email et réseaux OpenDataFrance !
Si votre projet a pour objectif de créer un service numérique (au sein même d'une structure publique ou si vous êtes un.e citoyen.ne, un acteur privé) une des phases clés au-delà des développements, est d'accéder aux données qui vont permettre à ce service de délivrer les fonctionnalités attendues.
De manière générale, il s'agit d'identifier (de quelles données ai-je besoin ?), de rechercher (est-ce que parmi ces données, certaines sont ouvertes ou pourraient être rendues accessibles ?), de créer des données (lorsqu'il est certain que l'accès est impossible, qu'elles ne sont générées par aucun producteur public ou privé). N'est pas abordée dans ce point méthodologique la question des données personnelles qui pourrait être exploitées par un service numérique et qui doit faire l'objet d'une démarche ad hoc, exigeante et encadrée par le RGPD).
Pour mener à bien le projet de mise en œuvre d'un nouveau service numérique, Il faut donc en garantir l'alimentation :
en données jugées nécessaires à son développement,
en donnée dont la qualité est suffisante pour répondre aux exigences de fiabilité du service,
en données dont la production, actualisation, qualité, diffusion, accès sont pérennes pour assurer la permanence du service (sa continuité s'il s'agit d'un service public numérique)
en données accessible via des API pour mettre en œuvre un flux direct et plus efficient pour la sécurisation du service
en données locales (dans la phase de test) dont on s'assure qu'elles sont également disponibles sur un périmètre géographique plus large (phase de montée à l'échelle du service dans un objectif de déploiement national et/ou international) et selon un standard ou schéma reconnu, adopté, si possible (le jeu de données peut être accessible mais structuré différemment ce qui oblige à un "nettoyage" et à une remodélisation de la donnée pour qu'elle puisse être intégrée au service déjà développé).
Il existe de nombreux usages de la donnée qui permettent de s'inspirer des méthodes d'appréhension de la donnée, ils sont décrits dans les espaces dédiés aux utilisations des données ouvertes sur la plateforme nationale data.gouv et sur le site OpenDataFrance.
Pour accéder aux données nécessaires au service numérique à venir, il est nécessaire d'avoir une double approche : thématique et géographique, et d'appliquer la formule définissant le développement durable : "Penser global, agir local". Enfin, on jugera de la qualité de la donnée rendue accessible.
Plutôt que penser "données", il est conseillé de découvrir les acteurs en lien avec les thématiques qui sont celles de votre service numérique. Ils seront précieux dans la fourniture de données mais également comme potentiels partenaires ou sponsors de votre projet, voire même à l'origine d'évolution de vos objectifs par de nouvelles idées émergentes à leurs contacts. Par exemple, vous imaginez une application qui alerte les personnes, selon les allergies dont elles souffrent, de la présence des allergènes qui les concernent. Il est utile de dresser, sous forme de séance de créativité collective, une liste, ou plus efficace, une carte mentale (dénommée également "des idées", heuristique) globale des acteurs de cette thématique (pour la santé on imaginera de prime abord le Ministère de la Santé, l'Agence Régionale de Santé, le Département pour ses compétences sociales, les médecins, les pharmaciens, les hôpitaux, les départements, etc et pour les allergies, on pourra penser au Réseau National de Surveillance Aérobiologique, aux allergologues, au Ministère de la transition écologique et de la cohésion des territoires, au réseau des associations agréées de surveillance de la qualité de l'air, etc)
Cette recherche permet de se familiariser avec la sémantique des domaines explorés : une acquisition des termes usuels des sujets que vous allez traités via votre servuce numérique, permet le dialogue avec les experts que vous allez solliciter et d'affiner ainsi votre demande de données
Après cet exercice, il s'agit d'établir une priorisation des acteurs qui vous semblent les plus pertinents comme producteurs des données attendues, vérifier s'ils disposent ou non d'une plateforme de données.
Sur la recherche de données,
La démarche initiale est de consulter la plateforme nationale https://www.data.gouv.fr/fr/ pour savoir si les acteurs que vous avez identifiés ont publié des données via cette infrastructure de référence. Data.gouv.fr est aussi le socle du service public de la donnée avec des jeux de référence et de grande utilité et qualité, généralement essentielles pour tout service numérique (la Base Adresse Nationale par exemple)
Une recherche classique sur cette même plateforme sera réalisée sur les domaines des données attendues (la basique recherche du terme "allergie" renvoie à plus de 40 jeux de données)
Des plateformes et des écosystèmes propres à la donnée sont opérés également par les différents services de l'État qui peuvent apporter une vision des données disponibles par grands domaines : Recherche.data.gouv, Green Data For Health, EcoSphères (à venir)…
Pour élargir encore le champ d'appréhension du potentiel de données, une recherche thématique peut être faire sur https://data.europa.eu/fr (pour "allergie", on a plus de 3000 jeux de données dont la qualité est évidemment assez inégale), ce qui ouvre le champ d'investigation
Sur l'accès concret aux données,
Enfin, une fois cette vision globale de la cartographie des acteurs et des données opérées, il est nécessaire de sélectionner quelques producteurs clés qu'il est utile de contacter :
pour vous aider dans votre recherche (ne pas hésiter à solliciter une aide notamment auprès des acteurs publics)
pour vous donner les liens directs vers des données ouvertes qui vous sont nécessaires et qu'on ne trouve pas (encore) forcément facilement,
pour étudier l'ouverture de données dont vous avez besoin, ce qui peut être vécu comme une opportunité par un acteur public ou privé contrairement aux idées reçues pour la mise en visibilité des compétences de ces producteurs qu'elle permet, mais aussi pour repérer les processus de création de valeur permis par ces données et auxquels ces producteurs n'auraient pas forcément pensé.
Il existe également un inventaire des organisations et de leur plateforme de données actualisée en continu par OpenDataFrance ou une cartographie des portails opérés par OpenDataSoft https://opendatainception.io
Ils sont les premiers alliés du.de la créateur.trice de service numérique par la valorisation des données ouvertes qu'il.elle rend tangible : les collectivités territoriales, les établissements publics, les syndicats ou opérateurs locaux traitant du numérique, les services de l'État en local… Il est conseillé également de contacter les acteurs du secteur privé (entreprises, association…) qui peuvent vous apporter un soutien et vous donner accès potentiellement aux données dont vous avez besoin (un cadre contractuel est généralement mais pas systématiquement proposé pour obtenir un accès).
En développant votre service sur un périmètre géographique restreint vous pouvez entamer un test dans un cadre maitrisé pour le monter à l'échelle dans un second temps (périmètre géographique et/ou cible élargis) voire viser un lancement national en vous appuyant sur votre réseau initial pour élargir, et la cible de votre service, et vos ambitions. Il est utile de :
Repérer sur votre territoire d'atterrissage (votre domicile, le lieu d'implantation de votre startup, entreprise, le périmètre de votre collectivité si vous êtes agent public, etc) et donc en proximité, les laboratoires d'innovation publics ou non qui pourraient accompagner votre projet (atelier de co-création, de co-identification de données) ou les agences ou structures d'accompagnement de entrepreneurs, du développement économique local, etc
En sollicitant les acteurs publics, vous leur permettez un retour sur les usages des données ouvertes et d'améliorer la qualité de ces données pour les rendre plus exploitables grâce au cas d'usage que vous leur soumettez
En rentrant en relation avec les écoles, enseignants, chercheur, monde académique plus généralement pour échanger,; comprendre des travaux qui pourraient alimenter en données ou en fonctionnalités votre projet et réciproquement, faire de votre projet un input pour des études, recherches, etc
Pour chaque donnée identifiée, on pourra avoir une première estimation de sa qualité en explorant les métadonnées pour connaitre les conditions de leur production, le producteur (et vérifier sa fiabilité), la fréquence d'actualisation… etc. La qualité d'une donnée se jud-ge en premier lieu par les métadonnées mises à disposition du réutilisateur potentiel.
La qualité de la donnée doit être analysée afin de décider si elle peut être intégrée au service et garantir sa fiabilité. On observera plusieurs critères qui caractérisent cette qualité de la donnée (data quality) :
Les métadonnées : "les données sur la donnée" doivent être accessibles et apportent des informations essentielles sur la fiabilité de la donnée. On évitera d'exploiter une donnée sans métadonnées. Il existe des normes pour ces métadonnées par exemple l'ISO 19115 (entre autres) pour les métadonnées propres à l'information géographique. Les métadonnées apportent un éclairage sur les sources de ce jeu de données, qui les produit et dans quel contexte, comment, quel niveau d'exactitude (une marge d'erreur peut être précisée), qui les diffuse…
La fréquence d'actualisation : il est nécessaire de connaître la fréquence de mise à jour (temps réel, mensuel, annuel, etc) voire l'engagement sur cette fréquence d'actualisation (souvent précisée dans les métadonnées) et une vérification régulière est nécessaire pour s'assurer de sa mise en œuvre
La complétude : difficile à juger quand on ne connait pas dans un premier temps le jeu de données, on s'assure que les attributs sont complétés de façon suffisante pour pouvoir être exploités
L’homogénéité : en lien avec la complétude, on peut vérifier si pour chaque item proposé, les attributs sont complétés de façon cohérente (parmi les contre-exemples, des dates apparaissant sous différents formats ou des adresses saisies mais pas de géolocalisation précise, etc),
La conformité : cela apparait comme une évidence et cependant il est toujours utile, lorsqu'un jeu de données est rendu accessible (partagé ponctuellement ou en open data) de vérifier s'il respecte bien toutes les obligations légales (par exemple le respect de toutes les obligations du RGPD dans le cas d'un jeu de données anonymisées constitué à partir de données initialement personnelles)
La normalisation : le respect d'un standard de données ou d'un schéma est gage de qualité du jeu de données. En favorisant l'interopérabilité des données on facilite évidemment l'usage de cette donnée. La normalisation est un catalyseur de scalabité pour un service numérique puisqu'on peut supposer qu'il sera possible de retrouver sur un autre territoire, voire au niveau national, international, ce même jeu de données publié sous cette même structure.
Enfin, l'expertise d'un.e ingénieur données, d'un.e data scientist, d'un.e expert.e data, même ponctuellement si le budget du projet ne permet pas de les intégrer à l'équipe, permettra de solidifier l'approche de la donnée et est une garantie pour la réussite de votre projet de service numérique.
Créer un service numérique est un projet collaboratif par excellence qui peut se traduire par l'ouverture de nouvelles données (celles qui vous étaient nécessaires) ou d'amélioration de la qualité des données déjà accessibles, c'est aussi une opportunité d'établir des dialogues entre structures sollicitées au travers du projet, de replacer le.a citoyen.ne au coeur du numérique. Créer un service numérique est donc facteur de création de valeur autant économique que sociale et environnementale.
Source : OpenDataFrance - Licence : CC-BY-SA
Version : v2.0, date : juillet 2022
Comme vu dans la fiche “Les premières étapes pour s’engager dans une démarche d’ouverture des données”, les jeux de données, une fois recensés, peuvent être publiés sur le site web de la collectivité avec le répertoire des documents administratifs (dont le catalogue des données publiées). Il existe plusieurs dispositifs de publication :
le site internet de l’organisation,
les plates-formes de publication de données en open data.
La méthode la plus simple pour publier les données consiste à diffuser les jeux de données directement sur le site internet de la collectivité ou sur des plateformes collaboratives pour les données géographiques. Un tableur constituant le catalogue des données pourra être associé à des liens hypertextes permettant le téléchargement des fichiers. Les données pourront être centralisées au sein d’une rubrique du site internet ou sur une page de type “www.maville.fr/opendata”. Cette méthode de publication est peu onéreuse, rapide à mettre en œuvre et permet de faire porter à connaissance les jeux de données au plus près des citoyens.
La publication sur une plate-forme de données permet une gestion plus fine pour la production de données (gestion des versions, des téléchargements, des statistiques, mise en place d’API...). Cela apporte des fonctionnalités avancées pour les réutilisateurs (recherche par métadonnées, déclaration des usages, datavisualisations…). Une telle plate-forme, sans nul doute, apporte plus de visibilité aux données publiées.
Ce type d’acquisition se fait plutôt dans le cadre de choix technologiques qui relèvent d’une montée en charge des usages avec des besoins grandissants en termes de réutilisation des données. La mise en place d’un entrepôt de données avec des fonctionnalités de multiformats, de web services (API), d’accès restreint ou temps réel, de visualisation de données s’avère de plus en plus fréquente au sein des collectivités au-dessus d’une certaine taille critique (EPCIs, métropoles, départements, régions…). Cette “mutation technologique” est souvent adossée à une stratégie accompagnant la transformation numérique du territoire, ou les données ouvertes et intelligentes sont un des leviers d’action (Open to Smart Data).
A partir du moment où les données sont hébergées sur une plate-forme, elles peuvent être publiées sur les autres plates-formes existantes. Par exemple, admettons que les données soient déposées sur une plate-forme régionale, celle-ci a très probablement mis des mécanismes pour que les données soient également publiées sur la plate-forme nationale http://www.data.gouv.fr/, qui elle-même verse des données sur unes des plates-formes de données Europénnes comme https://data.europa.eu/. De tels exports de données s’appelle des versements ou des dépôts de données. L’opération inverse est le moissonnage de données, il s’agit d’une opération d’extraction de données. Le moissonnage peut être initié par une plateforme de niveau national (http://www.data.gouv.fr/), de niveau inter-communal (région, département ou EPCI) ou par des tiers qui souhaitent collecter les données en open data.
Plusieurs acteurs privés peuvent proposer des prestations pour la fourniture d’une plateforme open data :
La plate-forme de données est clé en main et accessibles en mode “SaaS” (Software as a Service). Ce sont par exemple les solutions que proposent les sociétés OpendataSoft, Dat4Citizen ou autres (voir la page sur le choix d'un portail).
La plate-forme de données est sur la base de solutions Open Source:
CKan est vraisemblablement l’offre la plus mature et aboutie,
Udata est une solution développée par Etalab sur le même modèle que http://www.data.gouv.fr/,
DKan facilite la publication d’articles,
Plusieurs projets de collectivités ambitionnent de mutualiser les infrastructures et développements en versant et en documentant les codes sources sous licence libre. C’est ce que propose le syndicat mixte des Alpes maritimes, le Sictiam, avec la plateforme Ozwillo.
...
Il est possible de publier les données sur une plate-forme existante. Elles sont soit nationales, soit locales. A minima, la collectivité ne devrait pas faire l'impasse de recenser systématiquement ses données sur http://www.data.gouv.fr/ ou sur une plate-forme locale. D'autant plus que, une fois déposées sur data.gouv, l'utilisation d’un script comme metaclic (open source et gratuit) peut permettre de créer une page web simple sur son site web qui présentera de façon très correcte les données déposées sur data.gouv.
La plate-forme nationale http://www.data.gouv.fr/ est une plate-forme multithématique, administrée par Etalab. Publier les données sur une telle plate-forme est une solution pérenne, opérationnelle et gratuite.
Il existe d’autres plates-formes nationales qui ont une vocation thématique : données du tourisme, données du transport, données culturelles… Quand elles sont publiques, ces plates-formes sont portées par des ministères. Elles ont l’ambition de mettre à disposition des données de qualité. Leurs démarches de publication reposent sur une valorisation du travail interne des producteurs de données, à l’image de ce que propose le Géoportail de l’Urbanisme qui recense les documents d’urbanisme selon des formats homogénéisés.
Pour les données géographiques, depuis août 2015, les communes peuvent s’appuyer sur leur région ou leur département, puisque ces dernières ont la charge de « la coordination, au moyen d’une plate-forme de services numériques qu’elle anime, de l’acquisition et de la mise à jour des données géographiques de référence nécessaires à la description détaillée de son territoire ainsi qu’à l’observation et à l’évaluation de ses politiques territoriales, données dont elle favorise l’accès et la réutilisation. » (Code Général des Collectivités Territoriales, art. L4211-1, al. 13, http://frama.link/CGCT_L4211-1). Ce type de plates-formes peuvent proposer des données en open data, voir accueillir des données non-géographiques. De telles plates-formes se sont constituées, entre autres, sous l’impulsion de la directive INSPIRE. Ainsi, elles appliquent des formes de publication tenant compte des standards et normalisations.
Outre cette obligation réglementaire, de nombreux acteurs en charges de compétences territoriales mutualisées proposent des plates-formes de dépôts de données. Il arrive que dans certains territoires, il puisse y avoir plusieurs plates-formes de ce type.
dans le Sud-Ouest, il y a PIGMA pour les données géographiques sur le périmètre Nouvelle Aquitaine, les portails open data du département de la Gironde et de la métropole de Bordeaux de périmètres plus restreints ou encore un portail dédié aux données de l’offre de transport sur le pays Basque (français et espagnol).
en région PACA, à partir de 2018, les portails de données géographiques et open data ont été mutualisés sur une même plate-forme.
Le choix d'une plateforme de publication est détaillé ici
Fonctionnalités
Site web
Data.gouv.fr
plate-forme dédiée
Consultation et téléchargement des jeux de données
Oui
Oui
Oui
Recherche avancée (filtres et facettes ; thématique, format, licence…)
Non
Oui
Oui
Catalogue de données au format tableur
Oui
Oui
Oui
Catalogue de données “expert” (export multi-formats, filtres)
Non
Non/Oui
Oui
Fonctionnalités participatives : suivre un thème, une organisation, un jeu de données, déclarer une réutilisation, commenter, participer au forum..)
Non
Oui
Oui
Entrepôt de données muti-formats
Non
Non/Oui
Oui
API et web services
Non
Non/Oui
Oui
Visualisation de données (graphiques, dataviz, cartographie)
Non
Non
Oui
Statistiques d’usage
Non
Oui
Oui
Workflow (gestion des révisions des metadonnées et des données, fork, crowdsourcing)
Non
Oui
Oui