Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Archives de supports précédents, non mis à jour, généralement remplacés par de nouveaux supports.
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
#transparence #ouverture #redevabilité #appropriation #democratiedeproximite
Transparence et Open Data en synthèse :
L'Open Data sert la transparence de l'action publique,
bénéfique aux citoyens qui peuvent s'emparer des données ouvertes pour établir un dialogue avec l'administration ou proposer eux-mêmes des services qui amélioreront leur cadre de vie,
profitable aux collectivités territoriales et aux services de l'Etat eux-mêmes par la valorisation du travail de l’administration en rendant lisibles, visibles, accessibles les compétences comme les expertises de leurs agents.
La France porte une tradition de transparence démocratique et de partage des informations détenues par la puissance publique, inscrite dans sa Constitution (Article XV de la Déclaration des Droits de l'Homme et du Citoyen). Vecteur de cet accès à l'information, l'Open Data est l'objet de politiques nationales et locales, permettant de placer, en 2021, la France en tête du classement des pays européens engagés dans l'ouverture des données publiques.
L'Open Data désigne l'effort que font les institutions, notamment les administrations d'Etat et territoriales, qui rendent accessibles les données dont elles disposent. La politique française d'ouverture des données s'appuie notamment sur le droit d'accès aux documents administratifs (loi CADA du 17 juillet 1978) qui considère que les données, produites ou détenues par les administrations dans le cadre de leurs missions de service public, doivent être mises à disposition des citoyens. Cela ne concerne ni les données personnelles, ni celles touchant à la sécurité nationale, ni celles couvertes par les différents secrets légaux.
L'ouverture des données est un "outil" au service de trois objectifs :
Contribuer au fonctionnement démocratique, non seulement par la transparence mais aussi par la concertation et l'ouverture à de nouveaux points de vue qu'elle rend possibles
Améliorer l'efficacité de l'action publique en partageant les informations entre agents, entre acteurs publics pour un service public "augmenté" et plus efficient
Proposer de nouvelles ressources pour l'innovation économique, sociale et environnementale : les données partagées trouvent des réutilisateurs qui les intègrent dans de nouveaux services à forte valeur ajoutée
"La transparence de l’action publique, la gouvernance ouverte à la participation citoyenne, la réinvention des services publics par le numérique sont des valeurs essentielles à promouvoir en France comme à l’international. La France a une voix singulière à faire entendre : elle croit en notre modèle de services publics, en son avenir à l’âge numérique et en l’alliance entre les écosystèmes innovants et citoyens."
Axelle Lemaire, Secrétaire d'État chargée du Numérique - Avril 2014
L'Open Data fait partie intégrante de la modernisation de l'action publique à plusieurs titres :
Le citoyen attend des institutions modernes de la transparence, des comptes sur leur action, la possibilité de dialoguer
L'administration est souvent la première bénéficiaire de cette politique d'ouverture, qui rompt les silos et conduit à simplifier les systèmes d'information, la gouvernance de la donnée et les processus eux-mêmes
La disponibilité de ces données permet à l'administration d'envisager de nouvelles méthodes de travail : évaluation et pilotage des politiques publiques, suivi en temps réel des projets territoriaux, stratégies guidées par la donnée...
L'ouverture des données est la première marche vers ce que l'on désigne généralement par le terme d'« administration-plateforme » : apprendre à travailler avec les citoyens, leur fournir les ressources voire des infrastructures qui leur permettent d'entrer dans des démarches d'innovation ouverte, d'engager collectivement les processus de transformation numérique centrés usagers, de transition des territoires prenant en compte toutes ses dimensions...
« La politique de la donnée doit constituer une priorité stratégique de l'État dans ses relations avec tous ses partenaires, notamment les collectivités territoriales et les acteurs privés »
Jean Castex, Premier Ministre - Circulaire n°6264/SG du 27 avril 2021 relative à la politique publique de la donnée, des algorithmes et des codes sources
Le fondement constitutionnel de l'Open Data - l'accès libre des citoyens aux données qui traduisent l'action publique - est l'essence même de la Démocratie. L'Open Data est vecteur d'"accountability" ou obligation de rendre des comptes. Ce concept anglo-saxon (XIIIème siècle) traduit l'esprit de l'article XV de la Déclaration des Droits de l'Homme et du Citoyen, il recouvre tous les aspects de l'ouverture des données publiques :
la reddition de comptes (le fait de présenter l'état des biens d'autrui qu'on a administrés)
la responsabilité (la collectivité territoriale exerce des compétences et en assume les effets par l'information qu'elle en donne)
et la transparence
"Cette obligation de rendre des comptes couvre des champs multiples : politique, économique, social, environnemental, éthique. Elle conduit à poser de nombreuses questions relatives au pouvoir, au leadership, au contrôle, à la responsabilité individuelle ou collective, aux systèmes de mesure de la performance dans les organisations." "Obligation de rendre des comptes, enjeux de légitimité et d'efficacité", Bernard Pras, Philippe Zarlowski - Revue française de gestion - 2013 / 8 N°237"
"Rendre des comptes" signifie ainsi que l’administration, dans sa mission de service public, doit être en mesure d’expliquer et de partager les éléments qui lui ont permis de délivrer ce service.
Ce droit est rappelé dans le Code des Relations entre le Public et l'Administration (CRPA) au travers de l'accès aux données publiques par défaut en France.
#cadrereglementaire #cadrelégal #juridique #obligationsreglementaires #compliance #risquejuridique #conformite
Conformité réglementaire et Open Data en synthèse :
Les acteurs publics doivent considérer l'obligation réglementaire comme une opportunité de rationnaliser leur approche de la donnée. En l'ouvrant par défaut, collectivités territoriales ou services de l'Etat se dotent nécessairement d'outils, de processus, de règles - d'une gouvernance - qui rationnalisent la gestion et garantissent la qualité de la donnée, ils fiabilisent par là-même les services publics numériques qu'elle alimente.
Pour connaitre en détails le cadre juridique s'appliquant à l'Open Data, la CNIL et la CADA ont élaboré avec Etalab un référentiel complet : "Guide pratique de la publication et de la réutilisation des données publiques (open data)".
Pour favoriser la participation du public aux décisions politiques, le.a citoyen.ne bénéficie de droits, notamment d"'information des administrés et de communication".
Ce droit est inscrit dans la Constitution du 4 octobre 1958, texte fondateur de la Vème République. L'article XV de la Déclaration des Droits de l'Homme et du Citoyen de 1789 dispose :
La Société a le droit de demander compte à tout Agent public de son administration
Le cadre réglementaire sur lequel s'appuie l'Open Data s'est largement étoffé depuis sa loi fondatrice n° 78-753 du 17 juillet 1978, dite Loi CADA. Sa connaissance et son application nourrissent la gestion de l'administration et par là-même la qualité du service public.
En donnant accès aux données qu'il.elle produit ou gère, l'Etat ou la collectivité :
fait preuvre d'exemplarité en matière de Démocratie participative,
démontre sa capacité à inclure le.a citoyen.ne dans la bonne gestion de la cité
et sa volonté de dialogue avec ses usagers sur la base d'informations ouvertes les plus objectives possibles.
La loi pour une République numérique a marqué une étape majeure dans l’ouverture des données publiques en France en la rendant "obligatoire par défaut". Ses dispositions sont de trois types :
La circulation des données et du savoir. L'ouverture des données publiques devient la règle et non plus l’exception. Les administrations doivent publier en ligne dans un standard ouvert leurs principaux documents, y compris leurs codes sources, ainsi que l'ensemble de leurs bases de données présentant un intérêt économique, social, sanitaire ou environnemental. L’accès aux documents administratifs est donc élargi et cette avancée a pour conséquence de limiter la communication sur demande des documents administratifs - des données les constituant - puisqu'ils sont rendus librement accessibles en ligne par défaut ;
La création d’un service public de la donnée. L'Etat au travers d'Etalab, est chargé de mettre à disposition des données de référence - présentant le plus fort impact économique ou social - en vue de faciliter leur réutilisation par les acteurs publics comme privés (administrations, entreprises, associations...) en leur garantissant un niveau élevé de qualité de service. L'article Article L321-4 du CRPA précise que toutes les administrations concourent à cette mission.
L'ouverture des données d’intérêt général. Il s'agit d'imposer l’ouverture de certaines données détenues par des personnes privées et qui contribuent à l’intérêt général. Ces données sont généralement produites, gérées, colectées par des acteurs privés titulaires de délégations de service public ou dont les activités sont subventionnées par la puissance publique. La Loi d'Orientation des Mobilités du 24 décembre 2019 a par exemple traduit cette obligation en rendant accessible un large champ de données des services de transport.
Tout.e citoyen.ne a droit à la liberté d'accès aux documents administratifs communicables et aux données les constituant (Code des Relations entre le Public et l'Administration) ainsi qu'aux documents administratifs et données qui le.a concernent (Loi Informatique et Libertés).
Le "Guide de demande de données publiques auprès des collectivités" édité par Bordeaux Métropole en 2015 propose une méthodologie claire pour l'exercice de ce droit d'accès.
Tout.e citoyen.ne qui en fait la demande a le droit d’obtenir la communication de documents administratifs, notion très large intégrant les données (dont celles qui constituent la version numérique de ces documents).
Ce droit d'accès concerne tous les documents produits ou reçus par une administration publique (administrations d'Etat, collectivités territoriales, établissements publics), de même que les documents détenus par les organismes privés chargés d'une mission de service public s'ils sont liés, par leur nature, leur objet, ou leur utilisation à la gestion de cette mission.
La loi n° 2016-1321 du 7 octobre 2016 pour une République numérique a introduit de nouveaux documents soumis au droit d’accès et à la réutilisation publique. Il s’agit des codes sources (art. L. 300-2 du CRPA), les documents relatifs à la gestion du domaine privé de l’État et des collectivités territoriales (art. L. 300-3) et des règles définissant le traitement algorithmique ainsi que les principales caractéristiques de sa mise en œuvre au bénéfice de l’usager qui a fait l’objet d’une décision individuelle prise sur le fondement de ce traitement algorithmique (art. L. 311-3-1).
Les limites ont été repoussées par la Loi pour une République numérique qui consacre désormais le passage d’une logique de communication ponctuelle des documents administratifs, à une logique d’ouverture par défaut des informations détenues par les administrations, afin d’en permettre l’exploitation et la valorisation par les bénéficiaires du droit d’accès.
Les seules limites à la communication sont :
L'existence même du document ou des données. L'administration doit les avoir effectivement en sa possession et si ce n'est pas le cas, ils seront communicables uniquement s'ils peuvent être créés par un traitement automatisé d’usage courant (simple)
Le fait que le document soit préparatoire à une décision et dans ce cas, il n’est communicable que lorsque la décision qu’il prépare est intervenue (art. L. 311-2)
L'absence de caractère définitif du document (art. L. 311-2). Sont exclus la communication de brouillons, de versions intermédiaires, de notes prises en vue de la rédaction d'un rapport...
Les seuls arguments qui justifient un refus de communication de données (ou documents administraifs) sont liées au fait qu'elles pourraient porter atteinte à l’exercice des activités régaliennes de l’État et à l’intérêt général.
Sont opposables :
Les secrets dits absolus (défense nationale, conduite de la politique extérieure, monnaie et crédit publics) selon le 2° de l’article L. 311-5 du Code des Relations entre le Public et l'Administration
Les secrets relatifs, opposables aux tiers mais pas aux personnes intéressées (secret médical, vie privée) et secret industriel et commercial.
Lorsque la décision de communication est défavorable, la décision motivée est transmise au demandeur par l'administration qui précise les voies et délais de recours.
Le.a citoyen.ne peut alors saisir la Commission d'Accès aux Documents Administratifs (CADA) dans un délai de 2 mois en cas de refus ou s'il.elle n'a pas obtenu de réponse de l'administration un mois après sa demande.
Les citoyens peuvent formuler leur demande sous toute forme (orale, écrite, en ligne) et recevoir les documents ou données sur tout support (physique ou numérique, papier ou sur Internet) voire les consulter sur place. Ils sont libres de demander la forme que doit prendre la communication (dans la limite des possibilités techniques de l'administration).
Cette demande doit contenir des éléments précis pour guider la recherche des documents ou données attendus (intitulé, thème, espace géopgraphique, date de production ou période couverte, format, etc).
Le droit de réutilisation s’applique aux informations contenues dans les documents publics, aux données. Les citoyens peuvent utiliser ces données librement, en respectant la Licence d'utilisation attachée à chaque donnée. S'il s'agit de la "Licence Ouverte", chaque réutilisateur.trice doit notamment citer sa source et la date de sa dernière mise à jour.
D’après le Code des Relations entre le Public et l'Administration (CRPA), tout document ayant fait l’objet d’une communication ou d’une diffusion en ligne est soumis au principe de libre réutilisation (article L321-1) et de gratuité (article L. 324-1). Ce changement s’est opéré par la loi relative à la gratuité et aux modalités de la réutilisation des informations du secteur public (Loi Valter n° 2015-1779 du 28 décembre 2015, transposition de la Directive européenne Public Sector Information de 2013, révisée depuis).
Par principe, les données publiques communiquées ou publiées par les administrations peuvent être utilisées par toute personne (physique ou morale, publique ou privée) qui le souhaite à d’autres fins que celles de la mission de service public pour les besoins de laquelle les documents ont été produits ou reçus.
L'administration doit :
Répondre impérativement au demandeur de documents administratifs ou données que ce soit négativement (argumentation) ou positivement par communication au demandeur et/ou par publication en ligne
Respecter le délai d'un mois pour répondre à la demande de documents ou données
Transmettre à l'administration qui le ou les détient, la demande de document ou données reçue lorsqu'elle ne la concerne pas
S'assurer, lorqu'elle publie des documents ou données en ligne,
que leur format est ouvert
et aisément réutilisable et exploitable par un système de traitement automatisé,
que la licence attachée est bien applicable à ces données ouvertes
L'administration qui emploie plus de cinquante personnes en équivalents temps plein, à l’exclusion des collectivités de moins de 3 500 habitants, doit, en outre, mettre en ligne :
Les documents qu’elles communiquent ainsi que leurs versions mises à jour
Les documents qui figurent dans le répertoire d'informations publiques (RIP)
Les données mises à jour de façon régulière et dont la publication présente un intérêt économique, social, sanitaire ou environnemental.
les bases de données mises à jour de façon régulière, qu’elle produit ou reçoit et qui ne font pas l’objet d’une diffusion publique par ailleurs
Les données dont l'ouverture est obligatoire, encadrée par des législations spéciales prévoyant des modalités de publication particulières (commande publique, subventions, etc)
Ainsi que, en lien avec les données, et dont la publication est rendue obligatoire par la Loi pour une République numérique :
Les règles définissant les principaux traitements algorithmiques utilisés dans l'accomplissement de leurs missions lorsqu'ils fondent des décisions individuelles (voir le guide "Transparence des algorithmes publics" édité par Etalab)
Les codes sources. Tout code source obtenu ou développé par un organisme remplissant une mission de service public est considéré comme un document administratif, relevant des obligations de publication en Open Data (voir le guide "Ouverture des codes sources des logiciels" édité par Etalab)
#souveraineté #sobriété #cybersecurité #sécurité #gouvernance #risque #maitrisedesrisques #sobriété #confiance #autonomie #encapacitation #empowerment #protection
Souveraineté et Open Data en synthèse
La souveraineté numérique, c’est « s’autodéterminer dans l’espace numérique » pour Pauline Türk, professeur de droit public à l’université de Nice-Côte d’Azur. L'Open Data nourrit cette autodétermination par l'autonomie, l'indépendance et la sécurité auxquelles elle contribue. L'ouverture des données permet de maitriser son territoire, de garantir l'alimentation des services numériques et physiques qui permettent d'y vivre et est une opportunité de lutte active contre les risques qu'il soient physiques ou liés à la cybercriminalité.
La notion de souveraineté est présente au coeur de la Constitution - Article 3 - « La souveraineté nationale appartient au peuple, qui l'exerce par ses représentants et par la voie du référendum ».
La souveraineté appliquée au domaine du numérique et de la donnée est emminemment liée à l'"encapacitation" de ses citoyens-acteurs pour répondre à ses enjeux que sont :
L'autonomie notamment dans la prise de décision et dans l'action, qui nécessite de connaitre, comprendre les sujets touchant au numérique et à la donnée, d'en maitriser les briques fondamentales. La formation continue aux bases du numérique est indispensable pour tout acteur du service public, le mentorat ou l'accompagnement de pair à pair sont aussi des vecteurs de connaissance. Il faut savoir s'appuyer sur des personnes-ressources - experts en interne des administrations ou au sein de structures partenaires ou encore prestataires - pour une maitrise des aspects les plus complexes. Elus, décideurs comme agents, la Data Literacy - capacité à utiliser, analyser et communiquer grâce aux données - est un volet à explorer pour mener les politiques publiques propres au numérique et à la donnée.
L'indépendance, entre autres vis à vis des acteurs dominant d'un marché, avec pour les administrations de l'Etat, les collectivités territoriales, et tout acteur assurant une mission de service public, la possibilité de délivrer un service en maitrisant parfaitement les données qui l'alimentent. L'Open Data étant un facteur de cette "disponibilité garantie" de la donnée. En effet, l'ouverture révèle l'existence même de ces données et elle permet leur amélioration continue car les utilisateurs sont également des veilleurs en matière de qualité de la donnée. L'Open Data est par essence synonyme de réversibilité des données, c'est-à-dire la possibilité, pour un acteur public ayant confié à un tiers (prestataire, concessionnaire, délégataire...) voire externalisé tout ou partie de son exploitation informatique (développement, projet, brique de son système d'information), de recouvrer ses données à l'issue du marché ou contrat. Enfin, lorsque l'on évoque l'indépendance, on l'associe à la géopolitique. L'Open Data est aussi facteur d'indépendance vis à vis des forces étrangères puisqu'en maitrisant par exemple le stockage des données en France (voire en Europe) on évite ainsi d'exposer les données et on s'assure de l'application du droit français : lorsque des données sont confiées à un opérateur hors Union Européenne, elles sont logiquement hors du cadre législatif européen.
La sécurité, celle des territoires et de la France, incluant la cybersécurité. Concernant l'Open Data, la question de la sécurité touche entre autres la garantie de l'alimentation en données des services et infrastructures sensibles, la protection des données personnelles (application du Règlement européen de Protection des Données) ou encore plus globalement la nécessaire parfaite connaissance et maitrise des domaines terre, mer, air, espace et cyber. Sur la question de la sécurité des systèmes d'information, l'Open Data peut en être un vecteur aussi contre-intuitivement que cela puisse paraître : elle permet la coopération, le développement d'un cadre de confiance et la parfaite description des espaces numériques comme physiques, participant ainsi à la lutte contre la menace cyber ou dans un cadre bien réel.
Etre autonome c'est la faculté d'agir librement sans dépendance. En matière de données, c'est disposer de toutes celles nécessaires à l'action publique sans dépendre de tiers qui, au travers de leur statut de fournisseurs exclusifs de données, pourraient tenter d'user de leur influence.
Pour accompagner la prise de décision et piloter une politique publique, assurer sa traduction opérationnelle, il est nécessaire d'avoir une connaissance préalable du contexte, un état des lieux, puis d'opérer des actions pour engager les évolutions souhaitées et mesurer leurs impacts pour ajuster ses choix initiaux. La création de cette boucle vertueuse ne peut s'opérer sans des données qui alimenteront des indicateurs, ni des talents - ressources humaines - qui maitrisent l'exploitation de la donnée.
Accompagner la prise de décision par la donnée, c'est s'assurer d'une vision objective. Lorsque la donnée est ouverte, un temps précieux est gagné car basiquement, le temps consacré à la recherche ou la production même de cette donnée est considérablement réduit. Le gain de temps est facteur d'autonomie, car il libère les énergies pour les concentrer sur l'analyse puis l'action.
En ouvrant les données exploitées, toute démarche de pilotage bénéficie d'une crédibilité accrue - transparence des intrants - et de l'intelligence collective : des tiers peuvent vérifier et apporter des points de vue complémentaires, toujours utiles quand il s'agit d'engager des transformations profondes du cadre de vie par exemple. S'appuyer sur un collectif riche de sa diversité permet à un acteur public, une autonomie au sens premier du terme (Dictionnaire Le Robert) : "Droit de se gouverner par ses propres lois, à l'intérieur d'un État".
Pour illustrer le principe de l'indépendance en matière de numérique, les données géographiques apportent un éclairage déclinable à l'envi sur nombre de domaines. Maitriser son espace est gage d'indépendance. Il est essentiel pour la puissance publique de ne pas être tributaire d'acteurs tiers sur le plan matériel, moral, intellectuel quand il s'agit de mettre en oeuvre des politiques qui impactent le présent et l'avenir des citoyens et notamment leur espace de vie.
La géographie est un domaine sensible et exemplaire en matière d'indépendance. Si de grandes plateformes mondiales de services proposent des cartes et des outils d'optimisation de déplacement sur les territoires, elles mettent d'emblée leurs utilisateurs dans un état de dépendance quand les alternatives sont limitées. Aussi, si ces plateformes choisissaient de rendre payant ces services ou de les supprimer, cela pourrait engendrer des difficultés pour un pays ne disposant pas de ses propres données géographiques, incontournables pour l'administration d'un Etat.
OpenStreetMap est la carte ouverte et collaborative du monde, elle est enrichie chaque jour par plus d’un million de contributeurs. Cette carte et ses données ouvertes font partie des communs numériques - ces ressources sont produites et gouvernées de manière collective et selon des règles communes - et offrent la possibilité aux Etats de disposer d'une représentation de leur territoire produite par leurs citoyens. Cette démarche nourrit l'indépendance dans l'accès aux informations géographiques tout en s'appuyant sur le collectif qu'elle responsabilise et valorise.
En France, l’Institut National de l’information Géographique et forestière (IGN) est un établissement public à caractère administratif placé sous la tutelle des ministères chargés de l’écologie et de la forêt. Sa vocation est de produire, diffuser des données et des représentations (cartes en ligne et papier, géovisualisation) de référence relatives à la connaissance du territoire national et des forêts françaises ainsi qu'à leur évolution. Il répond à deux grands défis relevant de l'indépendance de la France sur ces domaines :
cartographier les impacts de l’activité humaine sur son environnement (anthropocène) pour mieux évaluer les conséquences du changement climatique,
produire des données géographiques au service de la souveraineté numérique de la Nation pour proposer une alternative robuste au modèle des géants du numérique.
La France assure ainsi sa souveraineté lorsqu'elle se dote d'une maitrise de son territoire via la donnée, en l'occurence géographique dans cet exemple. C'est le cas également de la mobilité avec son Point d’Accès National aux données de transport, autre exemple nourissant l'indépendance.
Enfin, de très nombreuses collectivités ont été des pionnières en matière d'élaboration de leur référentiel de données géographiques. Bien avant la directive européenne INSPIRE (voir le site du Conseil National de l'Information Géolocalisée) qui a rendue obligatoire l'ouverture de données environnementales et géographiques, les territoires franççais ont développé des expertises pointues en matière de Systèmes d'Information Géographiques (SIG), socle nécessaire à l'exercice du droit des sols, à la maitrise de l'urbanisme, des projets d'aménagements...
La souveraineté inclut la capacité d'un Etat, d'un territoire à assurer sa sécurité, celle des citoyens, pour garantir par ailleurs son indépendance et son autonomie.
L'Open Data nourrit la sécurité physique comme numérique par :
Le partage de multiples données qui vont permettre la maitrise du territoire. Sont accessibles en Open Data la géographie des territoires, de la France, ses caractéristiques, l'emplacement des multiples objets qui composent le cadre de vie comme les batiments publics et privés, les "Point d'intérêt" (POI) dont les pharmacies, les hôpitaux et dans certains cas les datacenters (inventorier par OpenStreetMap par exemple), la géolocalisation des défibrillateurs ou encore les périmètres de prévention des risques naturels, les différentes zones de protection, les axes routiers, les adresses précises grâce à la Base Adresse Nationale... La production et la difusion de données 3D, le développement de l'accès au LIDAR associés à l'intelligence artificielle devrait accroître la précision du "jumeau numérique" de notre géographie physique. Connaître un territoire, en partager la même représentation, garantir son exactitude et sa véracité grâce à l'implication de tous les acteurs de la sécurité, c'est garantir sa protection. A propos des données géographiques, le Vice-amiral d’escadre Nicolas Vaujour, souligne dans l'éditorial du magazine de l'IGN (N°106 - Printemps 2022) :
"La France compte parmi les rares pays à disposer d’une chaîne complète, de l’acquisition d’informations depuis l’espace ou sur le terrain à la production des données."
La montée en compétences des citoyens sur le numérique. La sécurité, qu'elle soit physique ou numérique dépend en premier lieu du facteur humain. L'Open Data encourage les producteurs de données comme les utilisateurs à se réapproprier la donnée et accroit logiquement leur capacité à apréhender le numérique, ses atouts et ses risques.
Une connaissance nécessaire des obligations nées de l'application du Règlement européen de protection des données (renforçant celles issues de la Loi Informatique et Liberté de 1978). Que l'on ouvre ou exploite des données, il est impératif de s'assurer du respect du RGPD et qu'aucune donnée personnelle ne soit rendue publiquement accessible. Ainsi, c'est un volet de la sécurité qui est appliqué en continu par les acteurs de l'Open Data. De nombreux travaux liés à l'anonymisation de données initialement personnelles sont en cours pour en permettre le partage, cependant dans la plupart des cas, la réidentification des données ne pourrait être totalement exclue et l'ouverture est donc impossible. D'autres cas d'anonymisation très poussée empêchent in fine l'exploitation des données qui perdent toutes leur caractéristiques dans le processus. Cette double problématique qui interroge les acteurs de l'Open Data est le gage de leur volonté d'une parfaite prise en compte des obligations du RGPD. Du point de vue du citoyen, l'application du RGPD a été accompagnée d'une large communication et de conséquences sur les services numériques qui ont dû adapter leur conditions générales d'utilisation voire leur fonctionnement. Cela a eu un impact sur la prise de consciences des citoyens quant à l'exploitation de leurs données personnelles et des risques numériques qu'ils pouvaient éviter.
Une implication logique de l'"écosystème Open Data", parties prenantes du secteur du numérique, dans la cybersécurité. Les données, si elles sont ouvertes, se doivent d'être protégées pour ne pas être corrompues avant que l'utilisateur ne les exploite : l'intégrité des données ouvertes doit être garantie et la sécurité de toute la chaîne de valeur de l'Open Data est un souci constant de ses acteurs. Que ce soient les données ouvertes, les infrastructures qui les génèrent, les stockent ou les diffusent, il faut pouvoir écarter toute vulnérabilité (configuration, application des mises à jour, sécurité physique et numérique des accès...) pour éviter une surface d’exposition aux attaques. La cybersécurité doit être une préoccupation clef lors de l'acquisition de solutions, de prestations d'hébergement ou encore d'exploitation des services. Il faut assurer en parallèle la résilience des infrastructures comme des données en cas de cyberattaque ou plus simplement d'accident de type incendie, innondation, ce qui implique des Plans de Reprise d'Activité par exemple. A l'heure où les cyberattaques se multiplient, l'Agence Nationale de la Sécurité des Systèmes d’Information a renforcé son action et publier de nombreux guides dédiés à la prévention et à la gestion de crise d’origine cyber. La FNCCR a également publié une étude sur la cybersécurité des villes intelligentes riche d'enseignements.
#transparence #conformitereglementaire #transformation #confiance #souverainete #cooperation #gouvernance #valorisation #pilotage #Transition
L'accès et la valorisation des données relèvent en premier lieu de décisions politiques pour un acteur public.
OpenDataFrance a identifié les 9 enjeux majeurs d'un engagement en faveur de l'Open Data, afin d'initier, puis de garantir la pérennité voire l'accélération de la "mise en accès" de la donnée, pour en révéler son potentiel de valeur économique, environnementale, sociale et sanitaire. 9 enjeux qui sont autant de défis stratégiques à relever au service de l'intérêt général.
#confiance #protection #charte #RGPD
Confiance et Open Data en synthèse
L'Open Data est un facteur de confiance réciproque entre les collectivités territoriales qui rendent transparent et lisible l'exercice de leurs compétences et prouve la fiablité du service public qu'elles délivrent tandis que les citoyens-usagers sont placés dans une situation de responsabilité et d'acteur de leur propre cadre de vie via l'exploitation des données auxquelles ils accèdent.
L'édition 2021 du "Baromètre de la confiance des Français dans le numérique", publié par l'association Acsel, dresse le portrait d’une France qui a largement adopté les usages numériques mais reste méfiante : 1 Français sur 2 pense qu’il est risqué d’utiliser Internet.
Si le niveau de confiance globale à l’égard d’Internet stagne (43 % vs 42 % en 2020), il n'est pas homogène, selon les services numériques utilisés : seulement 35 % des Français accordent leur confiance aux réseaux sociaux tandis que ce taux monte à 70 % dans le cadre de l’e-administration. Ce constat, même s'il interroge, est encourageant pour les acteurs publics qui se sont engagés dans une transition numérique accélérée.
Une des externalités positives majeures de l'ouverture des données est la confiance qu'elle génère. L'Open Data vient apporter la preuve que les données qui alimentent les services publics sont librement vérifiables par tous les citoyens.
L'Open Data est un gage de fiabilité puisque les données utilisées par des tiers voient leur qualité testée au travers de nouveaux usages. Aussi, il est essentiel de donner les moyens aux réutilisateurs de faire remonter les anomalies qu'ils auraient identifiées auprès des services qui ont ouvert la donnée. Cette collaboration est un vrai vecteur de confiance réciproque.
L'accès à la donnée a été renforcée par la Loi pour une République numérique mais aussi par le Règlement Général sur la Protection des Données (RGPD) ou General Data Protection Regulation (GDPR). Ce règlement européen a permis une prise de conscience des citoyens français de leur pouvoir de réappropriation ("empowerment") des données personnelles.
En effet, on peut considérer que quelle que soit la donnée (personnelle, publique, d'intérêt général), il existe une tendance de fond à replacer le citoyen au coeur des enjeux du numérique, et cela passe entre autres par lui donner accès à ses briques essentielles que sont les données.
Il est crucial de bien équiibrer cette approche entre la garantie du droit d’accès à l’information publique - l'Open data - et la nécessaire protection des données à caractère personnel pour lesquelles seule la personne concernée dispose d'un accès. C'est le rôle des deux institutions françaises : la CADA et la CNIL qui travaillent de concert pour garantir la confiance générée par cette approche globale de l'accès à la donnée.
L'accès aux données permet une meilleure compréhension des services numériques puisqu'il est possible d'aller "à la source" de l'information ou de la connaissance générée.
La législation française (Loi pour une République numérique) impose une transparence également sur les algorithmes publics qui exploitent la donnée (ouverte ou non) : il est obligatoire d'expliquer une décision administrative individuelle obtenue par un traitement automatique.
Cette explicabilité des algorithmes publics participe à la confiance des citoyens. Cependant, s'ils sont spécifiques au secteur public et donc censés opérer au service de l’intérêt général, les risques généralement associés à ces traitements sont :
la défiance vis-à-vis de ces outils perçus comme des « boîtes noires »,
les biais ou discriminations, en particulier pour les algorithmes dits apprenants;
le respect d'une éthique pour des utilisations peu ou mal anticipées de traitements algorithmiques.
Pour pallier cet impact potentiellement négatif de l'exploitation de données, la loi pour une République numérique a introduit un principe de transparence des algorithmes publics qui servent à fonder des décisions administratives individuelles. Validé par le Conseil constitutionnel qui a explicité les conditions d’utilisation de ces algorithmes, ce principe a été conforté par le Règlement européen sur la protection des données personnelles (RGPD) introduisant des obligations en vue d’un usage plus transparent et responsable des algorithmes pour l’action publique.
Aussi, ouverture des données comme des vecteurs de leur exploitation (algorithmes) sont propices à restaurer la confiance en l'économie numérique.
Enfin, se réinterroger comme le fait le Conseil National du Numérique (CNNum) plus globalement sur la relation des humains avec le numérique, permet de cultiver cette confiance et d'adapter l'approche de la donnée pour la nourrir.
#cooperation #gouvernance #responsabilite #role #processus #cycledeviedeladonnee #mutualisation #optimisation #efficience #communs
Gouvernance, coopération et Open Data en synthèse
L'ouverture de la donnée ne peut s'opérer sans une gouvernance qui lui est attachée pour en garantir son utilité, utilisabilité et utilisation. Elle doit s'inscrire dans une politique ad hoc pour que tous les acteurs qui gravitent sur sa chaîne de valeur agissent dans un cadre de confiance au sein duquel ils ont conscience de leur périmètre d'action et de leurs responsabilités.
L'Open Data est l'essence même de la coopération. C'est parce qu'il y a partage qu'il y a échange et création de valeur. 1 + 1 = 3, c'est l'équation de l'Open Data.
De l'accès "simple" à la donnée ouverte, jusqu'au projet collectif s'appuyant sur elle ou encore au commun numérique, l'Open Data peut être le socle :
d'une efficience du service public,
d'une optimisation des ressources,
de la création d'une dynamique territoriale, nationale, voire mondiale quand il s'agit d'adresser la transition environnementale.
Pour mener une oeuvre commune - coopérer - le partage de données est un préalable et leur ouverture indispensable. Pour aller plus loin et envisager une mutualisation, c'est à dire une mise en commun de moyens (humains, financiers, logistiques... ) pour réaliser des économies d'échelle, l'open data est d'autant plus nécessaire : elle objective la situation par la transparence qu'elle induit, elle porte à connaissance du plus grand nombre l'action commune menée, elle permet aux parties prenantes de s'emparer des sujets dans un cadre garantissant l'égalité d'accès à l'information.
L'Open Data s'entend ainsi comme vecteur de collaboration entre collectivités. Elle peut alimenter la nécessaire adhésion aux objectifs des parties dans le cadre de l'établissement d'un partenariat entre acteurs du secteur public et/ou privé, du monde académique (travaux de recherche par exemple)...
L'Open Data est également l'aboutissement de démarche de co-contruction de bases de données avec la société civile : le crowdsourcing ("approvisionnement par la foule" ou encore "co-production avec les citoyens") est une dynamique qui mobilise des contributeurs qui deviennent ainsi des acteurs de la donnée, aussi bien producteur qu'utilisateur de la donnée ouverte.
Dans cet esprit des ressources partagées, gérées et maintenues collectivement par une communauté, il est essentiel d'aborder les Communs et de s'interroger collectivement sur l'intégration de l'Open Data dans ce cadre (voir les articles "Les communs numériques" - Le Monde Septembre 2021 et "Théorie des communs administratifs" - Banque des Territoires Août 2020 ou encore le site de la Mission Société Numérique - ANCT - dédié aux Communs).
Enfin, la coopération ne s'envisage qu'avec l'élaboration et l'application d'une gouvernance de la donnée, c'est à dire la définition des procédures et des responsabilités des intervenants (personne, structure) dans le cycle de vie de la donnée, y compris sa valorisation. Il s'agit de garantir la qualité et la sécurité des données ouvertes, d'identifier qui peut effectuer une action dans la gestion d'une donnée et selon une méthode pré-déterminée, de suivre son linéage... et comment, le cas échéant, on peut établir un cadre d'exploitation (Intelligence artificielle éthique par exemple explorée par Ekitia) sans pour autant aller à l'encontre de la philosophie de l'Open Data (principe de la réutilisation libre). La gouvernance est avant tout question d'établissement de dialogue entre acteurs de la donnée.
D'après le Guide des coopérations publié en 2019 par le Gouvernement français, "la mise en place, temporaire ou pérenne, de moyens communs à deux ou plusieurs personnes morales", autrement dit la coopération voire la mutualisation peut aller d'une "simple" mise à disposition de services ou d'équipements par un partenaire au service d'autres personnes publiques, elle peut passer par la création d'un service commun spécifique qui intervient pour tous les partenaires. Ultime stade de coopération, des communes peuvent transférer leurs compétences vers une structure (établissement public de coopération intercommunale) qui les met en œuvre pour tout le territoire concerné... Quel que soit le socle de ce partenariat, il nécessite un partage d'information, une transparence de l'action menée au profit de toutes les parties prenantes.
L'ouverture de données propres aux objets de cette coopération permet une objectivité bénéfique à la confiance qui sous-tend chaque partenariat. L'Open Data peut être intégrée dans la convention qui va lier les parties, elle peut ainsi être mise au service des acteurs de ce partenariat comme des citoyens qui auront la preuve des retombées positives de cette coopération, ou qui pourront accompagner les partenaires dans la résolution de défis nouveaux apparaissant dans la mise en oeuvre de la coopération.
Des observatoires partenariaux lancés sur certains territoires traduisent cette coopération ouverte et transparente, gage de confiance et de responsabilité des acteurs publics impliqués. Dans cet esprit, on peut souligner l'approche de l'Observatoire de la commande publique de la Région Bretagne.
La production participative ou crowdsourcing permet de constituer une base de données ouvertes par "l'utilisation du travail, de la créativité, de l'intelligence et du savoir-faire d'un grand nombre de personnes" (Wikipédia "Production participative"). On peut également traduire littéralement "crowdsourcing" par l'"approvisionnement par la foule".
Il s'agit pour plusieurs contributeurs de créer et d'actualiser une même donnée. C'est une garantie de complétude, de qualité et de perennité.
Parmi les exemples emblématiques, Wikipédia est l'encyclopédie universelle libre et participative en ligne. Dans le domaine des données, OpenStreetMap est la carte coopérative libre, alimentée par des millions de contributeurs dans le monde, dont des colectivités territoriales, elle-mêmes en tant que structures ou leurs propres agents contributeurs. Cette démarche collaborative de cartographie en ligne permet de constituer une base de données géographiques ouvertes et exploitables universellement. Elle est diffusée sous licence "Open Database License" (ODbL) permettant à chacun d’exploiter publiquement, commercialement ou non, cette base de données, à condition de maintenir la licence sur la base de données, sur les modifications qui y sont apportées, et de mentionner expressément l’usage, s’il génère des créations à partir de celle‐ci.
Le crowdsourcing se développe au coeur des territoires comme au sein des administrations de l'Etat afin de cosntituer des bases de données ouvertes les plus qualitatives en mobilisant plusieurs acteurs qui vont co-construire et faire évoluer collectivement un même jeu de données. La base nationale de référence des adresses (https://adresse.data.gouv.fr) peut être considérée comme crowdsourcée car alimentée par l'ensemble des communes françaises à terme. Il existe aussi des initiatives très locales comme le projet participatif Manger Local https://mangerlocal.grandlyon.com.
La donnée mobilise par essence plusieurs individus quelle que soit la taille de la collectivité. Production, gestion, diffusion, utilisation, valorisation interne ou "externe" par des tiers, vont nécessiter une réflexion ou une action de multiples acteurs qu'il est nécessaire de coordonner.
La gouvernance de la donnée va garantir la pleine maitrise de la donnée par la collectivité, sa souveraineté, la protection comme le respect des obligations réglementaires et une meilleure fiabilité et valorisation de la donnée. Le terme de gouvernance désigne les mesures, règles, organes de décision, d'information pour un controle et bon fonctionnement. Il s'agit de définir qui fait quoi, selon quelle méthode et avec quelle responsabilité sur l'ensemble de la chaine de valeur de la donnée.
La gouvernance de la donnée exige de :
Définir des rôles et responsabilités qu'ils soient à visée stratégique ou opérationnelle. En premier lieu, toute gouvernance de la donnée s'appuie sur un exécutif, un.e élu.e en charge de la politique de la donnée : le.a Maire, le.la Président.e ou l'adjoint.e, le.a vice-Présidente en charge du numérique, de la donnée ou plus explicitement, de l'Open Data. Le processus de décision, la posture des décideurs (élus, manageurs), le "risque" qu'ils assument, doivent être clairs. Les rôles administratifs sont ensuite propres à chaque organisation et leur dénommination même varie selon les choix opérés par la collectivité. On peut affirmer qu'une démarche d'ouverture des données ne peut s'opérer que par la désignation d'un agent la portant et l'incarnant. C'est un.e chef.fe de projet Open Data, un.e administrateur.trice général.e des données (voir pour référence la démarche de l'Etat avec dès 2014, la désignation de son Administrateur Général des Données suivie de celles de plusieurs "AGD" ou "CDO" comme "Chief Data Officer" au sein de collectivités puis dernièrement dans chaque Ministère), un.e chargé.e de mission Open Data ou responsable de service dédié... Ce peut être un.e directeur.trice ou une direction qui s'empare du sujet. De manière plus opérationnelle, on trouve les rôles de dataowner, datasteward ou dataarchitect, datascientist, toutes ces fonctions sont endossées sans forcément être inscrites dans l'organigramme de la collectivité. La gouvernance en place doit clairement désigner les périmètres de responsabilité des intervenants sur la chaine de valeur de la donnée au sein des services métiers, de ceux des systèmes d'information, des services en charge de l'innovation numérique quand ils existent, ainsi que, le cas échéant, de la personne ou du service en charge de l'Open Data,
Mettre en place des instances politiques, de pilotage et décisionnelles, de mise en oeuvre et opérationelles. La coordination des actions garantit le traitement des tâches nécessaires au cycle de vie de la donnée. Ces instances peuvent être aussi bien internes que partenariales en intégrant les réutilisateurs de la donnée pour en améliorer l'utilisabilité.
Etablir des processus et méthodologie relatifs à la génération, la gestion, la sécurisation (informatique et juridique) et au partage de la donnée afin d'en garantir la qualité, l'interopérabilité, la validité et la traçabilité. Désigné généralement par le sigle MDM comme "Master Data Management", c'est la démarche qui consiste en une supervision globale des données et plus pragmatiquement, elle débute par un inventaire des données (pas seulement celles destinées à être ouvertes), puis de définir leurs "points de vérité", c'est à dire l'emplacement de leur source garantissant leur intégrité (généralement au coeur des métiers exercés par les services de la collectivité). Puis, selon des techniques plus ou moins avancées (du simple tableur à la plateforme de MDM), le cycle de vie de la donnée (création, modification, suppression) est tracé afin de garantir leur fiablité. Enfin, il s'agit de simplifier leur accès par des applications, ou de garantir leur ouverture par défaut,
Identifier des modes de valorisation de la donnée et les favoriser en interne avec une réappropriation de la valeur de la donnée au travers du développement de services publics numériques, de la data analyse, data science, de l'intelligence artificielle d'intérêt général comme en "externe", c'est à dire l'exploitation par des tiers, acteurs publics, privés (startups, entreprises, plateforme), monde académique (etudiants, chercheurs) ou associatifs.
La gouvernance de la donnée ne peut s'opérer que sur la base d'une stratégie de la donnée permettant de fixer le sens, les valeurs communes et les enjeux qu'entend relever la collectivité au service de l'intérêt général. Dans cet esprit, les chartes de la donnée edictées par plusieurs collectivités dont la pionnière Nantes, sont un socle interessant pour élaborer une gouvernance territoriale de la donnée.
Un guide des chartes territoriales de la donnée a été élaboré à l'initiative des Interconnectés. C'est un commun qui vise deux objectifs : capitaliser sur les démarches des collectivités territoriales ayant déjà élaboré une charte et accompagner celles qui entendendent lancer leur projet.
De nombreux acteurs ont analysé et défini des process de mise en oeuvre de la gouvernance de la donnée tels que :
le Ministère de l'Economie et des Finances et de la Relance avec Civitéo dans une approche plus globale de territoire intelligent,
l'OCDE,
DAMA France avec le référentiel DMBOK (Cadre Fonctionnel De la Gestion des Données)
La Ville et Métropole de Rennes dans le cadre du projet RUDI (Rennes Urban Data Interface)...
Des ressources précieuses pour co-construire une gouvernance de la donnée.
#modernisation #transformation #coopération #innovation #ouverture #RH #attractivite #talent
Transformation et Open Data en synthèse :
L'Open Data est un vecteur de transformation essentiel : ouvrir les données, c'est ouvrir la réflexion pour faire mieux dans de meilleures conditions pour une plus grande satisfaction.
L'ouverture de la donnée est l'opportunité de faire entrer dans des processus à (ré)inventer des acteurs tiers qui sauront avoir un oeil neuf sur ce qui est fait ou pourrait être mis en oeuvre, c'est aussi intégrer dans la démarche de transformation en premier lieu les bénéficiaires-usagers, qu'ils soient citoyens ou agents du service public ou encore les acteurs économiques, académiques...
La transformation ne peut s'opérer sans données - sans indicateurs - car elle induit une situation initiale qu'il faut révéler et un objectif dont il faut faire la preuve qu'il soit atteint.
La transformation ne peut advenir sans les talents qu'il s'agit de faire monter en compétence, de fidéliser dans les équipes, de mobiliser au service de l'accès et de la valorisation des données.
Pour les acteurs publics, une démarche d’ouverture constitue un levier de transformation de leur action. Elle permet de libérer l’énergie publique, de placer le.a citoyen.ne au coeur des projets d'intérêt général, de co-construire et d'animer les politiques publiques.
L'Open Data répond à trois enjeux qui sont trois arguments en sa faveur : l'ambition démocratique, la modernisation de l’action publique et le développement de l'innovation.
L'ouverture des données permet au Peuple ("dêmos") de se réapproprier des données créées grâce à lui - l'argent public a permis leur production - pour lui - le fonctionnement et la gestion des services publics sont rendus possibles grâce aux données - et il peut se les réapproprier librement et les gouverner ("kratos").
Les démarches de concertation, de consultation, de co-construction, de participation citoyenne offrent aux collectivités et acteurs publics les moyens d'impliquer leurs habitants dans les projets de territoires. Elles vont de concert avec une démarche d'ouverture des données. En effet, pour que les décideurs recueillent les besoins, attentes et avis des citoyens en amont de la prise décision, il est nécessaire de mettre à disposition du public tous les supports d'information, et en premier lieu les données qui vont alimenter l'échange objectivement. Plus riches seront les contributions, plus éclairée sera la décision et plus objective est la justification des choix finaux.
Dans cet esprit, l'Open Data est un des axes forts développés dans le cadre du Partenariat pour un Gouvernement Ouvert (PGO). C'est une structure internationale - 78 pays dont la France depuis 2014 - ayant pour enjeu d'améliorer les relations entre les citoyens et leur gouvernement en permettant à l’Etat d’être plus accessible, plus réactif mais aussi plus responsable envers les citoyens.
La mise en œuvre d'une démarche d'ouverture de données est l’occasion pour les administrations de mettre en place de nouvelles méthodes et outils au sein de leurs services. L’expérience montre qu’une telle démarche réussit lorsqu’elle constitue un vecteur de décloisonnement et qu’elle est une source de réflexion sur les données produites et collectées.
Pour les acteurs publics, l'Open Data permet de mieux connaître et gérer voire de se réapproprier son propre patrimoine de données, d’en révéler le potentiel au bénéfice de la collectivité comme de son territoire, de sa souveraineté numérique.
Le principe de "désilotage", conséquence de l'Open Data, permet d'instaurer un dialogue entre métiers de la fonction publique, à partir de données dont les agents n’ont peut-être pas connaissance ou même créent faute de savoir qu’elles existent déjà.
Une démarche d'ouverture de données est également l'occasion de mettre en œuvre de nouvelles formes de collaboration en interne comme en externe. L’État et les collectivités ouvrent aux citoyens, aux partenaires du secteur public comme privé, un "champ des possibles" par l'exploitation des données qu'ils rendent accessibles.
Parmi les exemples où l'Open Data nourrit l'efficience du service public, on peut souligner l'apport dans le domaine de la gestion des déchets. L'ouverture des données (emplacements des silos à verre, des bornes à compost, des déchetteries, recycleries mais aussi liste des réseaux associatifs et des entreprises de l’économie circulaire, données de signalement de dépôts sauvages, les consignes de tri, de modes et calendrier de collecte... ) permet :
D'améliorer les conditions de travail des agents des services urbains en rationnalisant les circuits des collectes (calcul du meilleur itinéraire), en identifiant les bacs ou silos à vider via des capteurs qui surveillent les taux de remplissage, en diminuant les efforts induits par la gestion des erreurs de tri...
De favoriser et simplifier le tri pour l'usager-citoyen, avec le dévelopement rendu possible d'applications par les collectivités ("Mieux trier à Nantes", "Bordeaux dans ma poche", "TriLib" à Paris, "Toodego" pour la Métropole de Lyon... ) ou par des acteurs du marché ("GoWaste" qui met en relation une personne souhaitant se débarrasser de déchets - verts, encombrants - et un "débarrasseur", "Mon service déchets" par Suez...)
De diminuer l'impact environnemental en établissant des observatoires de la gestion des déchets ("Observatoire régional des déchets en Île-de-France" ou "Organisation territoriale des compétences collecte et traitement des déchets en Pays de la Loire" par exemple) alimentés en continu par des données, dont peuvent s'emparer également et en appui des politiques publiques, experts, chercheurs, scientifiques et journalistes. Ainsi, les étudiants de l’école de journalisme de Bordeaux ont croisé en 2013 des données des équipements de propreté comme les sanisettes, cendriers... avec celles des plaintes anonymisées de riverains pour apporter une contribution à l'amélioration de la propreté en ville.
La transformation par la donnée inclut généralement un processus d'innovation (voir l'enjeu "Valorisation").
Par l'organisation de rencontres, d'ateliers, d'événements (hackathon, datacamp, challenge), il est davantage possible de révéler collectivement la valeur de la donnée au bénéfice de l'intérêt général.
C'est la multiplicité des profils et des parcours de chaque participant.e qui permet de voir l'action publique sous un nouveau jour, voire d'identifier des données qu'il serait utile d'ouvrir pour alimenter un service émergent. Ces moments de collaboration entre acteurs publics, société civile, monde académique, économique sont des temps d'idéation, de création, de co-production et d'échanges riches en enseignements.
Via ces travaux collectifs, l'Open Data permet de repenser la mise en oeuvre du service public en garantissant la place de l'usager, tout comme elle peut générer de nouveaux services dans le secteur marchand avec à la clef, la création d'emplois locaux, facteur de développement des territoires.
Si la démarche d'innovation est souvent développée grâce à la mobilisation d'interlocuteurs qui gravitent hors de la sphère interne du producteur et "ouvreur" de données, les démarches de valorisation internes aux collectivités, aux services de l'Etat, comme aux entreprises, gènèrent également des créations de valeurs inattendues. Souvent rassemblées sous le vocable d'"intrapreneurs", ce sont des agents ou des salariés qui vont être accompagnés par leur employeur pour mener à bien un projet servant l'intérêt général dans le secteur public ou les objectifs de l'entreprise dans le secteur privé.
Parmi les exemples d'innovation par l'Open Data, Pôle-Emploi a développé une stratégie d'innovation et d'ouverture de données au travers de sa "Grande Fabrique" avec l'objectif de faciliter le retour à l’emploi souhaité et durable. Des projets proposés en interne par des "agents-intrapreneurs" sont sélectionnés chaque année et parmi eux, "La bonne boîte" offre la possibilité aux personnes en situation de chômage d'identifier des entreprises au fort potentiel d'embauche, pour leur profil et leur région. Des millions de données sont analysées pour déterminer ces entreprises susceptibles de recruter.
Dans cet esprit, beta.gouv a été lancé par la Direction Interministérielle du Numérique. C'est un programme d’incubation qui aide les administrations publiques à construire des services numériques utiles, simples, faciles à utiliser, répondant concrètement aux besoins des citoyens.
Il existe également le programme "Entrepreneurs d’Intérêt Général" lancé en 2016 par la Présidence de la République. Il organise l'intégration durant plusieurs mois de profils numériques d’exception dans les administrations pour relever des défis d’amélioration du service public à l’aide du numérique et des données.
Enfin, le Ministère de la Transformation et de la Fonction publiques a lancé en décembre 2021, l’Accélérateur d’initiatives citoyennes qui vise à promouvoir les initiatives d’intérêt général portées par la société civile, à en accélérer le déploiement, à faciliter l’accès aux ressources - entre autres les données - et expertises que l’administration est susceptible de fournir.
Engager une démarche de transformation est une opportunité pour les administrations de monter en compétence sur le domaine de la donnée, partie intégrante du numérique.
L'ouverture des données et leur exploitation pour améliorer les services publics délivrés s'accompagnent d'une reflexion sur les ressources humaines.
Pour aborder efficacement l'Open Data et la valorisation des données, les services des collectivités territoriales et de l'Etat s'appuient sur l'engagement de femmes et d'hommes dont les compétences devront évoluer au même rythme que celui des méthodologies et technologies associées au domaine de la donnée et du numérique.
Aussi, si dans un premier temps, l'ouverture de la donnée peut être réalisée avec des moyens modestes, elle nécessite sur le moyen-long terme d'identifier les besoins en expertises et ressources humaines dédiées ainsi qu'une organisation ad hoc.
En 2021, un rapport de la DINUM et de INSEE propose 12 recommandations pour dynamiser la gestion et la valorisation des compétences data.
L'acculturation à la donnée est un enjeu majeur pour les acteurs du service public, qu'ils soient élus, agents ou encore médiateur avec un rôle fondamental auprès des citoyens dans leur montée en compétences numériques. De nombreuses initiatives ont été lancées en matière de médiation numérique (apport majeur de la MedNum), d'évaluation et de certification des compétences (Pix) ou de data literacy (concept de la DataLiteracyConference par exemple).
OpenDataFrance a souhaité contribuer plus activement encore à cette culture de la donnée en initiant un programme ouvert et partenarial dédié à la Culture de la Donnée - Culture D - et destiné aux élus, agents publics, citoyens, médiateurs du numérique... Il a pour enjeu de développer les compétences sur la donnée en France et l’agentivité des différents publics (esprit critique, capacité d’agir, de décider et de transformer). Il poursuit 3 objectifs :
Inventorier les ressources dédiées à la donnée, qualifier ces différents supports et fédérer un écosystème d’acteurs producteurs de ressources (chercheurs, décideurs, élus, agents, activistes, citoyens)
Construire des parcours d'apprentissage adaptés à chaque profil
Diffuser ces cursus, accompagner leur mise en pratique, initier des événements, pour communiquer sur ces offres d'acculturation à la donnée.
#Innovation #creationdevaleur #design #creation #intelligencecollective
Valorisation et Open Data en synthèse
Le cahier de réutilisations des données ouvertes édité en 2019 par OpenDataFrance sélectionne les cas exemplaires de création de valeur en France : et la plateforme ouverte des données publiques françaises data.gouv.fr propose un . Preuves que l'Open Data est facteur de création de valeur, l'ouverture est un révélateur du potentiel de la donnée.
En matière de valorisation, la plus évidente et première valorisation de la donnée ouverte, une fois croisée avec d'autres données et interprétée, c'est un bien essentiel à tout citoyen : l'information. Puis intégrée à un contexte, comprise et assimilée, elle génère alors de la connaissance, socle de toute démarche de valorisation.
L'Open Data crèe de la valeur économique, environnementale, sociale et sanitaire. Elle est un catalyseur de développement responsable.
"La valeur de la donnée se décuple dans le flux et dans l'échange plutôt que dans le stock et l'accumulation"
"" - Louis-David Benyayer - 2014
La valeur économique créée par les données ouvertes en Europe est estimée - selon le - à 184 milliards d'euros. Ce montant du marché potentiel recouvrant le nombre d'emplois créés, les gains d'efficacité, les vies potentiellement sauvées, le temps gagné, les avantages environnementaux, l'amélioration de services ainsi que les économies de coûts rendues possibles.
L'Open Data est en effet source d'alimentation de projets, d'études d'aménagement, de travaux de recherche, de démarches de pilotage, de services de proximité et numériques, d'applications... Elle accélère leur création, développement, production et leur mise à disposition des usagers puisque les données sont accessibles, disponibles, ouvertes.
Deux enjeux sont majeurs pour accélérer encore la valorisation des données ouvertes :
leur qualité (utilisabilité)
et leur interopérabilité (standardisation)
Complétés par le dialogue essentiel entre producteurs de données (les acteurs de l'Open Data) et usagers-réutilisateurs de ces données (les créateurs de valeur).
Le facteur humain est décisif pour valoriser la donnée, il est nécessaire d'"évangéliser", d'animer et de susciter les réutilisations, voire d'identifier les usages potentiels pour concentrer les moyens sur des ouvertures de données stratégiques pour chaque territoire et/ou domaine d'activité.
L'Open Data est intrinsèquement lié au processus d'innovation puisque son enjeu est de simplifier l’accès aux données et d'en favoriser l'usage. La réutilisation à d'autres fins que celles pour lesquelles la donnée a été produite est encouragée, grâce entre autres à la licence qui lui est appliquée et à son format ouvert : ils permettent le traitement, la reproduction, le croisement, la redistribution, la modification... de la donnée, son exploitation commerciale également (selon la licence appliquée et les droits attachés). L'Open Data peut ainsi être à l'origine de l'innovation car stimulante pour ses acteurs, ou être la conséquence de l'innovation : l'ouverture de la donnée est rendue nécessaire pour faire aboutir un processus d'innovation.
"L'innovation est la recherche constante d'améliorations de l'existant, par contraste avec l'invention, qui vise à créer du nouveau. Dans le domaine économique, l'innovation se traduit par la conception d'un nouveau produit, service, processus de fabrication ou d'organisation pouvant être directement mis en œuvre dans l'appareil productif et répondant aux besoins du consommateur" Souce :
Et selon l'Office Parlementaire d'Evaluation des Choix Scientifiques et Technologiques du Sénat (OPECST), l'innovation est :
"L’art d’intégrer le meilleur état des connaissances à un moment donné dans un produit ou un service, et ce afin de répondre à un besoin exprimé par les citoyens ou la société"
Il existe deux grandes formes d'innovation,
dans le cadre d'un marché concurrentiel ou dans une optique prioritaire d'optimisation : innovation de produits, procédés, services, marketing, d’organisation,
à visée collective : innovation sociale, sociétale, territoriale, souvent rassemblées sous le terme d'innovation publique.
Les données ouvertes sont des sources d’inspiration pour les citoyens et l’ensemble des acteurs qui s'investissent dans la co-construction de leur cadre de vie. La circulation et l’exploitation des données permettent d'alimenter au sens propre et figuré un processus d'innovation et :
de concevoir, mettre en œuvre, d'évaluer des services numériques,
d'imaginer, de concrétiser des projets au bénéfice des habitants, des entreprises, des étudiants, des professeurs, des chercheurs… des services publics eux-mêmes,
d'améliorer l'organisation en simplifiant les circuits de prise de décision et en éclairant le pilotage d’activité ou de politiques publiques,
de découvrir, observer et analyser l’environnement naturel et urbain pour élaborer des solutions de préservation, de développement responsable, d'économie circulaire...
d'expérimenter, faire la preuve d’un concept, comparer et partager des résultats avec d’autres territoires, des acteurs de multiples domaines, en France, en Europe...
L'ouverture des données donne les moyens à chacun.e de s'emparer de leur potentiel.
Les données ouvertes, lorsqu'elles sont utilisées pour créer un service, ont trois bénéfices simultanés :
La satisfaction de l'usager-bénéficiaire du service développé (trouver le moyen de transport adapté à ses contraintes ou son mode de déplacement, consommer plus local, trouver un lieu frais lors de canicule, identifier un interlocuteur pour un service spécifique, etc),
Le retour sur investissement du créateur-initiateur du service qui au travers de son modèle économique, pourra créer des emplois locaux, générer de la valeur, envisager la croissance de son activité,
Le financement du service public car la création de richesse sur un territoire gènère de l'imposition qui viendra alimenter les services publics, fournisseurs de données... donnant des moyens pour accélérer l'ouverture de données et améliorer encore leur qualité.
C'est le cercle vertueux de l'Open Data : un (nouveau) service au citoyen, de l'employablité locale, de la création de richesse territoriale.
Faciliter la mise à disposition des données publiques contribue ainsi à soutenir le développement économique local et national, voire européen pour les solutions scalables à l'international. Les données servent l’innovation publique comme privée.
Les données ouvertes sont un catalyseur de coopération entre acteurs investis dans l'innovation sociale et environnementale qui par essence nécessite l'implication d'acteurs aux profils multiples et la convocation de disciplines variées.
C'est le croisement qui crée la richesse de ces domaines, la donnée ouverte est donc un vecteur tout indiqué pour imaginer collectivement des démarches d'accompagnement de publics spécifiques, d'amélioration de l'accueil dans tel secteur médical, des conditions pour mieux orienter, d'établissement d'inventaires, de réalisation d'états des lieux, de comptages d'espèces, de lancement d'un projet de préservation d'une flore particulière, d'un service numérique permettant la coordination d'acteurs pour mener à bien telle campagne de comptage d'espèces, etc.
De nombreux espaces physiques (laboratoires d'innovation locale, tiers-lieux...) ou en ligne ont été créés avec comme socle, l'accès à des données pour imaginer et co-construire le cadre de vie local.
Ces lieux encouragent le croisement de compétences les plus diverses possible autour de projets basés sur l'intelligence collective, le mentorat, l'appui de réseaux, l'accompagnement au développement... C'est au travers du foisonnement de ces initiatives que peut être mesurée la richesse des talents présents sur les territoires.
Parmi les exemples de lieux ou espaces de ressources souvent structurants économiquement et socialement, et pour certains promoteurs de l'Open Data, on trouve :
Les données ouvertes sont la source, voire l'origine de la création, de services numériques et d'applications. Garantir l'accessibilité des données favorise ainsi le développement par des acteurs privés ou par la société civile - par l'administration même - de l'offre de services disponible sur un territoire.
Elle réutilise les données issues des services de la voirie, de l'urbanisme (hauteur des trottoirs, places de parking pour les personnes en situation de handicap... ) pour développer son calculateur d'itinéraire pour personnes à mobilité réduite.
Cette application française qui élargit chaque année les territoires couverts et le nombre de cyclistes conquis, exploite les données ouvertes d'OpenStreetMap ainsi que celles concernant les services relatifs aux vélos en libre-service, fournies par des entreprises et certaines collectivités.
Lancée par une startup canadienne, cette application est présente sur plusieurs territoires en France et offre une alternative aux offres d'optimisation des déplacements urbains. Elle exploite les données du domaine des transports ouvertes par les autorités en charge de la Mobilité dont de nombreuses collectivités et syndicats.
Développée grâce à l'accès aux multiples bases de données mobilité ouvertes du "Point d’Accès National de Transport, l'API (interface permettant d'alimenter en données un service) offre des fonctionnalités avancées dédiées à la mobilité telles que la recherche d’itinéraire multimodal et intermodal, la consultation de l’info trafic, l’affichage des horaires de passage, une autocomplétion performante ainsi que la fonctionnalité isochrone.
L'application initialement lancée à Toulouse est alimentée par les données ouvertes des menus des cantines. Elle évolue dorénavant vers un modèle économique basé sur la diminution du gaspillage alimentaire grâce à l'apport de l'intelligence artificielle pour anticiper et adapter les approvisionnements.
...
#numeriqueresponsable #sobriété #frugalite #responsabilite #impacts #empreinteenvironnementale #greenIT #data4good
Transition et Open Data en synthèse
L'Open Data est indissociable des démarches de transition d'un territoire car l'accès aux données, leur partage et leur exploitation sont les sources pour développer collectivement les réponses au changement climatique, déterminer l'ensemble de ses causes comme évaluer ses effets.
L'impact même de l'ouverture des données doit être traité et maitrisé comme un axe de la transition environnementale des territoires.
Le numérique est porteur de nombreuses promesses dont on sait qu'elles ont aussi un coût environnemental non négligeable. Le numérique est le 3ème "consommateur" d'électricité au monde après la Chine et les Etats-Unis, soit près de 100 réacteurs nucléaires nécessaires à son fonctionnement global.
Françoise Berthoud, ingénieure de recherche en informatique au , dans un article du site traitant des impacts environnementaux spécifiques aux données, indique que le volume de données estimé pour 2030, c'est à dire 612 zettaoctets, correspond à "plus de 15% du total des Gaz à Effet de Serre que l’on pourra émettre en 2030 pour rester sous la barre des 2°C, à technologie numérique égale".
Aussi, la stratégie de la donnée de toute administration, territoire, doit traiter deux aspects en matière d'impact environnemental :
Le développement de l'accès aux données utiles et nécessaires à la transition du territoire, qu'elles décrivent le domaine de l'environnement ou de tout autre secteur qu'il est nécessaire d'adresser dans cette démarche de transformation (social, économique, sanitaire, géographique...)
La maitrise des conséquences écologiques de l'ouverture des données pour éviter ou réduire les coût environnementaux de la création, gestion, diffusion et utilisation des données ouvertes, soit une attention portée tout au long de leur cycle de vie.
C'est l'objet d'un programme partenarial porté par OpenDataFrance, associant des collectivités, des Ministères et services de l'Etat, des experts et chercheurs, dédié à la transition environnementale. Il a pour objectifs :
de rechercher les meilleures conditions pour mettre la donnée au service de la transition écologique
d'identifier les externalités négatives de la publication des données (collecte, traitement et mise à disposition), de proposer des recommandations pour les réduire ("greendata"), de formuler des arguments objectifs pour alimenter la dynamique d'ouverture des données en France dans un contexte de crise climatique
Cette démarche vient compléter, sur le volet exclusif des données, les guides et référentiels dédiés au numérique responsable édités par de nombreux acteurs publics et privés :
de l'
et
de la la
conçu par un collectif, acteurs de l’opération GreenConcept et financé par l'ADEME Occitanie et la Région Occitanie
...
Les données ont un poids environnemental estimé à 15% de l'empreinte totale du numérique : consommation d'énergie pour le fonctionnement des serveurs, matières premières pour les espaces de stockage, consommation d'eau pour le refroidissement, etc.
Il est donc important d'avoir conscience des externalités négatives de la publication des données (collecte, traitement, mise à disposition) afin d'engager des actions pour en maitriser les impacts.
L'ouverture des données touche à des moyens matériels (infrastructure informatique, serveurs, locaux...), des flux (énergie, eau, logistique... et données), une organisation avec des process et des méthodologies... et il est recommandé à chaque décision d'opter pour la solution la plus sobre possible. C'est un exercice exigeant déjà pratiqué par de nombreuses collectivités.
La transition environnementale et notamment énergétique est un défi majeur pour les territoires, notre pays et pour notre lieu commun de vie, la Terre. Pour comprendre et agir, il est primordial de pouvoir mobiliser autant la donnée que les forces vives pour les exploiter.
Aussi, pour mettre la donnée au service de la transition, l'ouverture des données doit s'accélerer sur tous les territoires : les "zones blanches" empêchent le traitement de toutes les informations nécessaires à la compréhension de l'ensemble des phénomènes, notamment locaux qui sont autant de "signaux faibles" synonymes parfois de pistes de solutions aux défis climatiques.
La transition oblige à la mise en oeuvre de dispositifs de recherche et de traduction opérationnels interdisciplinaires. Aussi, l'ouverture de la donnée doit toucher à de multiples thématiques : environnementale en premier lieu mais aussi sociale, sanitaire, etc. C'est le croisement de données issues de multiples domaines, sur un temps et un espace les plus étendus possible, qui permettent la modélisation, l'exploitation de l'intelligence artificielle, etc.
La qualité des données et leur interopérabilité sont des clés pour mettre en oeuvre la transition.
#pilotage #decision #impact #systemedecisionnel #managementdurisque
Pilotage et Open Data en synthèse
La décision politique et stratégique nécessite d'être appuyée sur un socle robuste de faits, sur une observation fine d'informations structurelles et conjoncturelles. L'Open Data en rendant accessibles les données - celles existantes et qui ne sont pas forcément connues des élus et décisionnaires - révèlent toute la richesse mais aussi les éventuelles difficultés d'un territoire.
Le partage et l'ouverture des données objectivent une situation, leur croisement permet d'identifier des signaux faibles permettant une anticipation des actions à mener, ou peut conforter des situations à traiter urgemment.
L'accompagnement du pilotage d'un territoire par la donnée est un accélérateur de résultats pour les politiques publiques.
"Piloter son entreprise avec un tableau de bord présentant ses principaux indicateurs, c’est ce que permet une stratégie fondée sur l’utilisation des données. Cette approche, qui facilite le suivi de l’évolution de ses résultats en continu, constitue un outil d’aide à la décision utile et présente un réel avantage concurrentiel"
Souligné par "" (initiative gouvernementale pour la transformation numérique des très petites, petites et moyennes entreprises), l'intérêt de la démarche "data driven" ou pilotage par les données est bien réel pour les acteurs privés comme publics.
Les données sont la base des informations qui permettent aux décideurs d'opérer des choix éclairés. Meilleure est la qualité des données, plus objectives seront les informations sur lesquelles les décisions seront prises.
Les territoires ont toujours exploité des données pour piloter les politiques publiques, en premier lieu les finances, du simple tableau de suivi au système d'information décisionnel, voire aux hyperviseurs.
Aujourd'hui, il s'agit davantage d'avoir une approche plus systémique et ouverte dans la prise de décision. En partageant les données issues de l'ensemble des compétences au sein de chaque collectivité voire entre collectivités, le pilotage est d'emblée plus robuste car nourri de données dont la quantité, la diversité et la qualité sont améliorées par leur accès et/ou ouverture.
Le département de Saône-et-Loire alimente en données ouvertes de manière automatisée son système d'information décisionnel. Services et élus accèdent à des données au travers d'interfaces permettant d'obtenir des informations concrètes et régulièrement mises à jour pour agir.
La Métropole de Lyon a conçu en partenariat avec l'Université de Lyon un pour accompagner la prise de décision politique, économique ou sociale en s'appuyant sur des données traitées dans une approche interdisciplinaire.
Nous présentons ici une synthése et un document imprimables reprenant les éléments détaillés dans ce chapitre "Enjeux politiques et stratégiques de la donnée" (ed .v1.0 juin 2023).
Source : OpenDataFrance - Licence : CC-BY-SA
Version : v2.0, date : mai 2022
Les données occupent une place non négligeable dans notre monde contemporain. Big, small, smart, open, froide, chaude, nombreux sont les qualificatifs qui viennent préciser la nature et le statut de la donnée. Prenons le temps de bien comprendre ce qu’est une donnée, quand elle est numérique, publique, sensible, personnelle...
Une donnée est un élément défini et isolable : elle est constituée à partir de règles ou de catégories communément admises (mesure, classification…). Par exemple, les distances en France sont établies en kilomètres alors qu’en Angleterre, ce sont les miles. La donnée peut être relevée dans notre environnement grâce à l’observation et peut être produite à partir de capteurs (un thermomètre) ou de formulaires de saisie dans une application (feuille d’impôt). Une donnée sert de base à une analyse ou permet de réaliser une recherche.
L'information est le résultat de l’interprétation de la donnée par une personne. Elle est une donnée interprétée dans un contexte précis. Un ciel bleu au Pôle Nord et aux Caraïbes ne sera pas interprété de la même manière.
Un document est un objet matériel conçu pour transmettre des informations de façon pérenne. Il suppose une organisation pour représenter l’information et faciliter sa transmission.
Un document administratif est un document produit ou reçu par une administration qui agit dans le cadre d’une mission de service public. Les documents administratifs sont communicables. Ce principe vaut pour tous les documents, quels que soient leur date, leur lieu de conservation, leur forme, leur support, le caractère public ou privé de l’acteur détenteur. Juridiquement, la loi pour une République numérique (article 4) ne définit pas l’obligation de mise à disposition des données, mais uniquement des documents administratifs et ce qu’ils recouvrent.
Une donnée n’est pas toujours numérique, loin de là ! Mais le nombre de données numériques enregistrées et stockées est croissant depuis la naissance du web. Une donnée est numérique quand elle peut être lue et traitée par un ordinateur. Les outils comme les tableurs permettent de visualiser les données numériques dans des tableaux et de voir comment elles sont organisées. En règle général elles sont regroupées en ensembles cohérents, les sets de données.
Les données sont publiques à partir du moment où elles ont été produites ou reçues dans le cadre d’une mission de service public. Les données publiques peuvent être le fruit du travail d’enquête d’une administration, comme le recensement. Et elles peuvent aussi être créées par des délégataires de service public, comme par exemple dans les transports, le service d’eau et le traitement des déchets. Les prestataires ont avec la loi pour une République numérique l’obligation de restituer à la collectivité les données collectées et établies dans le cadre de leur activité.
En matière d'innovation, on peut souligner l'apport important du "design thinking", la pensée design est une approche de l’innovation centrée sur l’humain. C’est une méthode de conception globale, en vue de réaliser des services ou produits innovants en lien constant avec les besoins de l'usager. Dans le cadre de l'Open Data, elle sert aussi bien le processus d'ouverture de la donnée ("comment faire en sorte que la donnée que j'ai ouverte soit utilisable simplement ?") que celui de sa valorisation ("de quelles données j'ai besoin pour développer le service qui répond aux attentes de ses bénéficiaires ?"). Pour en savoir plus sur cette démarche, un document fait référence, il s'agit de "" (en français).
Voir également l'enjeu "".
Les (endroits qui hybrident des activités pour répondre à un besoin de territoire, fablabs, espaces de coworking, incubateur, friches culturelles... )
Les laboratoire d'innovation et parmi eux, les , les laboratoires d'innovation locaux (, ... ) ou centrés sur la transformation de l'administration () ou sur des domaines spécifiques comme la mobilité (), l'environnement (EcoLab du Ministère de la transition écologique et de la cohésion des territoires),
Les emblématiques sélectionnés annuellement par la Banque des Territoires, France urbaine, le groupe Patriarche et le consultant JLM Conseil.
Les espaces de médiation numérique (physiques et en ligne) qui mettent au service des citoyens - souvent les plus éloignés - des techniques permettant de comprendre et de s’approprier le numérique, ses enjeux et ses usages. On peut souligner l'engagement fort de la , ...
Et parmi les services de mobilité exploitant des données ouvertes, on trouve Moovit (croisement avec des données collectées par ses utilisateurs), CityMapper... Et plus localement "ouestmonbus.com" (carte interactive de consultation des passages des bus de Rennes Métropole à leurs arrêts, de visualisation des lignes et position des bus en temps réel), pour se déplacer en Bretagne, dans le Grand Est ou sur le territoire de la Métropole de Lyon... Ou encore un service multimodal et transfrontalier pour se déplacer en eurorégion Aquitaine-Euskadi-Navarre avec .
est un site participatif issu du dialogue citoyen et de l'imagination d'un collectif nantais qui permet à chacun d'enrichir des informations sur les services de proximité et de transition écologique de son quartier. Les citoyens, les associations et Nantes Métropole alimentent en données ouvertes ce service numérique et cartographique (OpenStreetMap) de proximité.
est une plateforme de services numériques de l'agglomération lyonnaise qui rassemble l'accès aux services, démarches et informations utiles de la Métropole de Lyon et de nombreuses communes. Toutes les données alimentant les services en ligne sont ouvertes par défaut.
L'Open Data peut être un axe majeur de mise en oeuvre de la en France, pour les communes et intercommunalités de plus de 50 000 habitants, dans l'élaboration de leur stratégie numérique responsable.
Des exemples de sont rassemblées dans le guide GreenData d'OpenDataFrance ainsi que dans nombre de supports qui pourront accompagner les politiques dédiées au numérique responsable.
Les Ministères de la Transition écologique et de la Cohésion des territoires et de la Transition énergétique ont rédigé une "" ambitieuse pour alimenter la transition. Ses objectifs peuvent inspirer une stratégie territoriale. Le lancement du Laboratoire d'innovation par les données "" dans le cadre de l'Ecolab par le (CGDD) va dans ce même sens.
De nombreux exemples de collectivités ayant intégré la question de la donnée et de son partage dans leur stratégie numérique responsable et plus globalement dans leur trajectoire de transition, sont accessibles en ligne. Par exemple, la , la , le projet Climate Data Hub de la Région Centre Val de Loire et sa dimension européen ("Loire Valley Data Hub for well-being and sustainability")... ou encore les territoires démonstrateurs engagés dans le programme "" porté par l'ADEME.
OpenDataFrance porte le projet partenarial "Données et transition" qui vise à répondre à l’écart entre l’offre de données disponibles et la concrète utilisation de ces ressources au service des transitions des territoires. Il est soutenu par le , il implique de nombreux contributeurs.
Nantes Métropole a développé un outil numérique pour aider les agents de la restauration scolaire à anticiper le nombre d’enfants présents au déjeuner. sont mises au service de l'intérêt général avec pour objectif d'anticiper les commandes aux fournisseurs et d'adapter la production de la cuisine centrale, de réduire in fine le gaspillage alimentaire.
L'Association des Directeurs Généraux des Communautés de France et la société Manty ont publié en 2021 "" tandis que le donne accès à de nombreuses données et tableaux de bord de pilotage essentiels aux collectivités territoriales.
Le projet "" ambitionne la création d'un unique poste de commandement permettant la gestion centralisée de l'espace public et de l'ensemble des équipements urbains connectés des 24 communes, grâce à une alimentation en données issues entre autres de multiples capteurs (IOT).
Source : OpenDataFrance - Licence : CC-BY-SA
Version : v2.0, date : juin 2022
Pour les acteurs publics, la démarche d’ouverture, en plus de répondre à des obligations légales, constitue un levier d'action et d'animation des politiques publiques. Regardons ici celui de l'innovation économique.
Faciliter la mise à disposition des données publiques contribue à soutenir le développement économique des acteurs locaux et nationaux. Internet des objets, territoires intelligents, transition énergétique, big data, French Tech : les données servent l’innovation publique comme privée. L'ouverture des données doit ainsi atteindre une certaine massification tout en garantissant un haut niveau de qualité pour être un levier d'innovation. Le développement de Hubs de données sectoriels ou territoriaux visent à structurer ce passage à l'échelle dans l'accès aux données.
De nombreux exemples de réutilisations de données publiques au service d'une innovation existent.
Citons-en quelques uns :
L'application Handimap réutilise les données voirie/urbanisme (hauteur des trottoirs, places de parking handicapés, etc) pour développer son calculateur d'itinéraire pour personnes à mobilité réduite.
L'application Meilleurs Agents propose notamment un outil en ligne d’estimation des prix des biens, en réutilisant les données de demandes de valeurs foncières. À partir de l’exploitation des données ouvertes, l’entreprise propose désormais une carte interactive représentant l’ensemble des transactions passées en fonction du lieu et du type de bien.
Source : OpenDataFrance - Licence : CC-BY-SA
Version : v2.0, date : mai 2022
Un algorithme est une méthode de traitement des données.
La CNIL en donne cette définition : une suite finie et non ambigüe d’étapes pour obtenir un résultat à partir d’éléments fournis en entrée. Un algorithme est en général automatisé mais sa définition peut également s'appliquer à une suite de séquences non informatisées.
La loi pour une République numérique impose un certain nombre d'obligations aux collectivités utilisant un algorithme :
Expliquer le système utilisé, ce qui suppose de publier au préalable un inventaire
Apposer dans la décision une mention qui rend visible l'utilisation d'un algorithme
En cas de demande, fournir une explication individuelle, détaillée
C’est une interface de dialogue, technique et normalisée, qui permet d’échanger des informations et des services entre machines. Une API permet à un service de fournir des données de façon standardisée. Exemple : une API peut renvoyer les coordonnées GPS d'une adresse postale donnée par la Base d’Adresse Nationale Ouverte.
C’est un ensemble structuré de données. Une base de données permet de stocker des information de manière cohérente pour opérer des traitements, fournir des services dans le but de faciliter leur usage.
En règle générale, les données dans une base sont dites "structurées". En effet, pour que l’ordinateur puisse correctement traiter les données numériques, il est important d’établir des règles détaillées et précises lors de leur enregistrement, de bien définir les valeurs des champs, d’établir une structure fonctionnelle claire. C'est l'interprétation et la représentation de données numériques qui donnera lieu à la création d'informations intelligibles.
Cette expression désigne un ensemble de données caractérisé par du Volume, de la Variété (texte, son, image) et une Vélocité (données chaudes). Ces dernières, pour être exploitées, implique d'utiliser des outils spécifiques. Le Big Data peut d'ailleurs désigner aussi bien les données que les infrastructures permettant de les exploiter.
C’est l'utilisation de la créativité, de l'intelligence et du savoir-faire d'un grand nombre de personnes, en sous-traitance, pour réaliser certaines tâches traditionnellement effectuées par un employé ou un entrepreneur (Wikipédia juillet 2017 : https://fr.wikipedia.org/wiki/Production_participative). Par exemple, les contenus de Wikipédia et d’Open Street Map sont réalisés en crowdsourcing.
Le csv est un nom d’un format de fichier contenant des données textuelles. Les données sont lisibles par un très grand nombre d’outils : les tableurs, les éditeurs de texte... L’organisation du fichier étant répandue et simple, elle peut être plus facilement traitée par un programme.
On appelle web sémantique l’extension du web traditionnel pour permettre à toute donnée d’être publiée et documentée de façon standard. Les données liées, c’est la possibilité d’attribuer une URL à un objet et de pouvoir pointer vers elle de façon fixe. Par exemple, Wikidata permet de donner accès à des données de base (dates de naissance, capitale d’un pays...).
Toute donnée faisant directement ou indirectement référence à un lieu spécifique ou une zone géographique est considérée comme une donnée géographique (article L127-1 du code de l’environnement). Certaines données géographiques sont géolocalisées : elles utilisent des coordonnées pour localiser des faits ou d’autres données. D’autres sont géolocalisables lorsqu’elles utilisent des références de localisation indirectes : une adresse, un code postal, un nom de lieu par exemple. Les données géographiques sont d’un intérêt majeur dans le domaine de l’open data, principalement pour les raisons suivantes :
La localisation de l’information est le critère de croisement de bases de données le plus courant, car elles permettent une représentation des données sous forme de cartes géographiques.
Leur contribution à la connaissance des territoires les rend indispensables à l’action publique en particulier pour l’ensemble des politiques touchant à l’aménagement.
Les données géographiques publiques font l’objet de règles et de recommandations de diffusion à l’échelle nationale et européenne, notamment suite à la directive européenne INSPIRE.
Dans le cadre du Service Public de la Donnée, les données de référence sont précisées par l’article 14 de la Loi Pour une République Numérique. Ce sont des informations publiques qui satisfont les conditions suivantes :
Elles constituent une référence commune pour nommer ou identifier des produits, des services, des territoires ou des personnes ;
Elles sont réutilisées fréquemment par des personnes publiques ou privées autres que l'administration qui les détient ;
Leur réutilisation nécessite qu'elles soient mises à disposition avec un niveau élevé de qualité.
Un décret dresse la liste des données de références, ainsi que l'administration responsable de leurs conditions de production et de publication. La Base Adresse Nationale, la base Siren, le Répertoire Opérationnel des Métiers et des Emplois (code ROME produit par Pôle Emploi) sont des données de référence.
Il s’agit d’une catégorie de données protégées, en France par la Loi Informatique et Libertés et en Europe, par le Règlement Général sur la Protection des Données (RGPD). Cette loi définit une donnée à caractère personnel comme “une donnée qui permet d’identifier, directement ou indirectement, une personne physique” (art. 2). Cela correspond donc à des éléments directement identifiants tels que le nom, l’adresse, le numéro de téléphone, l’identifiant personnel ou les identifiants par croisement avec d’autres données (géolocalisation, statut familial, etc). Les données à caractère personnel d’une personne appartiennent à sa vie privée. Les fichiers dits “clients”, “fournisseurs”, “usagers” contiennent des données à caractère personnel qui rendent techniquement possible l’identification précise d’une personne.
Il n’existe pas, au sens juridique, de “données personnelles” ; c’est souvent un abus de langage qui désigne des données à caractère personnel.
Les données sont qualifiées de « publiques » lorsqu’elles sont produites ou collectées ou reçues par l’Etat, une collectivité territoriale, un organe parapublic ou un délégataire dans le cadre de leurs activités de service public. Ces différents acteurs publics ou privés rassemblent et structurent des données qui leur servent à mener leurs missions de service public. Les données publiques sont de natures extrêmement hétérogènes :
données temporelles comme les horaires d’ouverture,
données financières comme les montants d’un budget,
données géographiques comme les codes postaux ou la localisation des accidents de la route sur une commune ...
Les données publiques servent à la mise en place de politiques publiques. Elles sont des éléments essentiels à la prise de décision dans l’action publique et à la réalisation de celle-ci. Leur communication et leur mise à disposition garantissent aux citoyens un accès et un usage différent de celui prévu initialement.
Une donnée sensible est également une notion juridique française issue de la Loi Informatique et Liberté (article 8). C’est une donnée à caractère personnel qui concerne l’intimité d’une personne physique. Ce type de données est particulièrement protégé par la loi Informatique et Libertés. Cela comprend les données sur les origines raciales ou ethniques, les opinions politiques, philosophiques ou religieuses, l’appartenance syndicale, la santé ou la vie sexuelle. Les données sensibles ne peuvent être recueillies et exploitées qu’avec le consentement explicite des personnes. Elles appartiennent également à la catégorie des données personnelles.
La fouille de données consiste en l’exploration de masse de données issues de documents ou base de données pour les analyser à partir de méthodes comme la statistique, le traitement automatisé/algorithmique, les systèmes d'intelligence artificielle. L’objectif de cette analyse est de comprendre, résoudre ou encore prévoir des actions.
Il s’agit de représentation graphique de données. Quelques formes simples et connues de visualisation de données sont le “camembert”, l’histogramme, le nuage de points. La visualisation de données peut s’appuyer sur différentes sources de données. Elle a pour objectif de rendre les données plus lisibles et compréhensibles.
(voir Pour Comprendre Fiche 1 - Définition : les données)
Le terme "interopérable" désigne le fait que deux systèmes techniques peuvent échanger aisément des données. Plus les systèmes respectent les normes et les standards ouverts, plus ils sont interopérables.
Un jeu de données est un ensemble de données formant un tout cohérent. Le jeu de données est composé de plusieurs variables et observations associées à ces variables. En règle général, un jeu de données comprend une variable clé unique (identifiant ou clé primaire) qui permet de relier le jeu de données à un autre, afin d'augmenter et compléter l'information initiale.
Exemple : la liste de présence des conseillers municipaux lors des assemblées en 2012, est un jeu de données.
C’est l’abréviation de Google, Amazon, Facebook, Apple, Microsoft : il s’agit des entreprises les plus puissantes de l’internet et accessoirement celles qui détiennent et/ou manipulent le plus de données. On les dénomme également "Big Tech".
Une licence est un contrat qui précise les conditions de réutilisation d’un jeu de données. Par exemple, des données sous licence ODBL ou Licence Ouverte sont appliquées à l'open data.
Les administrations sont tenues de publier en ligne ou de communiquer les documents administratifs qu'elles détiennent aux personnes qui en font la demande. Cela ne s'applique qu'à des documents achevés et ne concerne pas les documents préparatoires à une décision administrative tant qu'elle est en cours d'élaboration. Dans le cas où la demande permet de bénéficier d'une décision individuelle créatrice de droits, les documents sont communicables à l'auteur de cette demande dès leur envoi à l'autorité compétente pour statuer sur la demande. Le droit de communication perdure, même si le document est déposé aux archives. Le droit de communication cesse lorsque les documents font l'objet d'une diffusion publique.
Une métadonnée est une information descriptive liée à une donnée. Par exemple, la date de production de la donnée, son producteur, son format, sa licence constituent des métadonnées. Pour qu’un jeu de données soit facilement accessible et réutilisable, la qualité des métadonnées joue un rôle déterminant.
Une mission de service public est une action menée par une administration pour satisfaire l’intérêt général. Il peut s’agir de service public administratif ou d’un service public industriel et commercial. La jurisprudence a établi un faisceau d’indices permettant de déterminer si l’on est en présence d’un service public :
une activité d’intérêt général,
la présence directe ou indirecte d’une administration,
la présence de prérogatives de puissance publique,
les modalités de financement public.
Pour approfondir la notion, le wiki du CNFPT : https://frama.link/Def-servicepublic-cnfpt
C’est un mouvement qui regroupe les outils, les principes et les méthodes permettant à chacun de mesurer ses données personnelles, de les analyser et éventuellement de les partager. Les outils du quantified self peuvent être des objets connectés, des applications mobiles ou des applications Web (Wikipédia juillet 2017 : https://fr.wikipedia.org/wiki/Quantified_self). Le fait de mesurer le nombre de pas effectués par jour constitue une pratique de quantified self.
Le self data désigne la production, l’exploitation et le partage de données personnelles par les individus, sous leur contrôle et à leurs propres fins : pour mieux se connaître, prendre de meilleurs décisions, se faciliter la vie, etc. "Si j'ai une donnée sur vous, vous l'avez aussi et faites-en ce que bon vous semble !"
Le service public de la donnée créé par l’Article 14 de la loi pour une République numérique vise à mettre à disposition, en vue de faciliter leur réutilisation, les jeux de données de référence qui présentent le plus fort impact économique et social. Il s’adresse principalement aux entreprises et aux administrations pour qui la disponibilité d’une donnée de qualité est critique. Les producteurs et les diffuseurs prennent des engagements auprès de ces utilisateurs. La mission Etalab est chargée de la mise en oeuvre et de la gouvernance de ce nouveau service public. Elle référence l’ensemble des données concernées (Extrait : https://www.data.gouv.fr/fr/reference).
Source : OpenDataFrance - Licence : CC-BY-SA
Version : v2.0, date : juin 2022
Les fiches métiers présentées ci-dessous ont été écrites à partir des informations disponibles sur les sites de l’Onisep et du CIDJ. Toutefois, certains métiers très récents ne disposent pour l’heure d’aucune fiche et ont donc été rédigées à partir d’informations collectées auprès d’autres sources.
Il ou elle est le véritable chef d'orchestre de la définition et de la mise en œuvre de la politique des données au sein de l'organisation en ayant en charge :
l'acquisition d'une sémantique commune : dictionnaires de données, métadonnées...
la définition et l'animation de la gouvernance de la donnée, notamment sur la politique opendata mais plus largement de production de "communs"
la gestion des logiciels d’hébergements des données
le choix des outils pour exploiter les données
la définition des droits d'accès aux données, en prenant appui sur des "ambassadeurs" par domaine thématique
le conseil aux différentes parties prenantes pour rendre la donnée accessible et l'exploiter
la veille réglementaire et technologique sur les données
Son rôle est de faciliter la circulation et l’accès aux données dans son entreprise. Il/elle doit être capable d’effectuer le tri de toutes les données pour repérer les plus pertinentes et les plus importantes, afin de faciliter la prise de décisions aux dirigeants de l’entreprise.
Il/elle doit très bien connaître les services, les métiers et les processus qui composent et régissent l’entreprise. Il/elle doit également s’assurer de la qualité des données et informations récoltées, que leur source soit interne ou externe à l’entreprise.
L’administrateur ou l’administratrice des données travaille avec d’autres spécialistes que sont les data scientist, les programmeurs et les analystes du web.
Il/elle a pour mission de déployer un projet d’ouverture des données de la collectivité ou de l’organisation : il/elle peut s’appuyer sur une plate-forme de publications des données propre à sa structure ou mutualisée.
Il/elle doit savoir conduire un projet d’ouverture des données et être un bon communicant au vue des nombreuses prises de contacts avec les élus, des représentants de communes ayant déjà ouvert leurs données, de syndicats mixtes faisant de l’open data, etc.).
Le chef ou la cheffe de projet open data doit être à l’écoute des besoins des divers services qui composent l’organisme pour leur proposer des solutions adaptées. Il/elle doit aussi faciliter la production de nouvelles données et favoriser la réutilisation de celles mises à disposition par la collectivité ou l’entreprise. Il contribue à la cartographie des données dans sa démarche de publication.
L’archiviste collecte, classe et répertorie les documents en possession de l’administration ou de l’entreprise pour laquelle il travaille. Avec la digitalisation des supports, son expertise concerne aussi les données.
La collecte de ces archives s’effectue auprès de services de collectivités, d’associations, de syndicats ou de fonds privés pouvant être aussi bien des entreprises que des particuliers. Il est le garant de ce qui doit être conservé pour des finalités patrimoniales (recherches et connaissances)
L’archiviste trie et classe les documents acquis en conservant les sources. Il maîtrise non seulement les cycles de conservation, mais également la méthodologie d'indexation. Il est ainsi un véritable partenaire dans tous projets de dématérialisation.
Enfin, l’archiviste assiste les différents publics dans leurs recherches et les aide à décrypter les documents conservés. Il/elle organise des événements visant à la promotion de ce patrimoine au travers d’expositions, d’ateliers pédagogiques, de conférences, etc. mais peut aussi devenir un partenaire sur des actions de sensibilisation en matière d'archivage numérique.
L’éditeur ou l’éditrice de données a pour mission principale l’animation et la valorisation de l’offre de données sur le portail opendata de l'organisation. Pour cela, il ou elle favorise la mise en avant de données thématiques, valorise les réutilisations connues et contribue à développer la notoriété du portail. L’éditeur ou éditrice de données a un rôle de gestion et d’évolution du site web. Il ou elle met en place des dispositifs techniques et humains pour favoriser le débat, la production d’idées et de connaissances à partir de données et joue un rôle important auprès des réutilisateurs, notamment en se positionnant en animateur ou animatrice de communautés.
Le ou la journaliste de données doit savoir effectuer comme tout autre journaliste, une veille informationnelle et une recherche d’informations, mais sur internet et dans des bases de données. Il ou elle doit aussi vérifier la validité et le sérieux des informations recueillies et assurer la protection des sources.
Il ou elle doit être capable de questionner les données, c’est-à-dire d’évaluer leur pertinence et leur fiabilité avant de les utiliser, d’extraire des données depuis divers types de documents et fichiers (un tableur, un PDF, une image…) et de nettoyer des données brutes par la création d’un tableur pour le croisement de sources.
Le ou la journaliste des données doit savoir rédiger des consignes destinées à un infographiste ou maîtriser les outils de visualisation de données. Il ou elle peut savoir lire et produire une cartographie à partir de méthodes et outils géographiques.
Plusieurs journaux se sont spécialisés dans la production de travaux d’analyse journalistique fondés sur les données : Le Temps (en Suisse), The Guardian (En Grande-Bretagne).
“Job le plus sexy du 21ème siècle” selon la Harvard Review, le data scientist possède des compétences en statistiques, traitement de données et en programmation informatique. Il ou elle met en œuvre un ensemble de techniques d’analyse, dont les algorithmes et le machine learning. Il est possible d’utiliser le terme d’“analyste de données”.
Data scientist et data analyst ont pour mission le croisement et le traitement de données qu’elles soient produites par l’entreprise, achetées ou collectées sur des services tiers. Tous deux extraient les données et doivent savoir les interpréter pour les transformer en informations utilisables par l’organisation pour l’aider dans sa prise de décisions opérationnelles et stratégiques. Pour assurer la collecte, le traitement, le stockage et la restitution des données, ils/elles conçoivent les modèles et algorithmes nécessaires à ce travail et sont par cette fonction considérés comme n’étant pas de simples statisticiens. Ils/elles sont capables d’imaginer et de concevoir de nouveaux modèles d’analyses de traitement des données brutes et qui ne peuvent pas l’être par les outils de gestion de bases de données existants.
Les data scientist et data analyst recherchent des données pertinentes pour l’entreprise, proposent des modifications à apporter aux bases de données, conçoivent des “entrepôts des données”, les évaluent, les traitent et les restituent dans le système d’information cible. Ils ou elles travaillent en règle général sous la coordination de l'administrateur/administratrice des données.
Là où le ou la data analyst travaille le plus souvent sur une unique source de données (thématique métier), le ou la data scientist œuvre sur un plan bien plus large en croisant des données issues de sources multiples, dans des formats diversifiés.
Ces deux profils possèdent une triple compétence
d’expertise statistique et informatique,
de connaissances en bases des données et en l’informatique,
d’expertise métier dans le secteur d’activités pour lequel ils ou elles travaillent.
Toute administration publique a l'obligation de désigner un Délégué à la protection des données depuis le 25 mai 2018, date d'entrée en application du règlement européen sur la protection des données.
Il ou elle est le référent sur la question de la protection des données personnelles et assure une veille sur la publication de nouveaux décrets ou de nouvelles lois en liens avec la protection de ces données. Il est l'interlocuteur de la CNIL.
Son expertise lui permet de conseiller l’organisme public ou privé pour lequel il travaille sur les décisions à prendre concernant la récolte, le traitement et l’archivage des données, les conditions dans lesquelles ce travail peut-être fait et les limites. Sa présence au sein de l’organisme est un gage de sécurité et rassure les acteurs externes et internes sur les usages que seront fait de leurs données. Enfin, sa capacité à trier les données en fonction de leur pertinence, de leur finalité, de leur sécurité et de leur conservation limitée permet à l’organisation d’avoir des jeux de données fiables et donc d’envisager leur utilisation sereinement.
Le géomaticien est un expert de la donnée géographique numérique : de sa création, de sa gestion, de sa valorisation et de sa diffusion. Il est en capacité de spécifier, créer, administrer et opérer un SIG. Il est souvent l'un des métiers très acculturé à la donnée au sein d'une organisation et constitue ainsi un contributeur utile à la mise en œuvre d'une gouvernance des données.
La nécessité d’interconnecter le SIG à d’autres systèmes d’information transversaux ou métiers conduit les géomaticiens à maîtriser :
les outils et concepts de la « qualité » des données (métadonnées, réutilisation dans d’autres applications informatiques….),
les modalités techniques de diffusion (dont les normes et standards).
Pour assurer ses missions, le géomaticien s’appuie sur une formation scientifique et technique comprenant, dans des proportions variables, des bases en géographie, en informatique et topographie ainsi que des compétences thématiques.
Il ou elle assure également des fonctions d’accompagnement, d’animation et de gestion reposant sur une dimension humaine forte, consistant par exemple à former des utilisateurs à l’usage de l’information géographique, contractualiser des partenariats avec des organismes extérieurs et animer un réseau d’acteurs s’ouvrant, de plus en plus, au grand public.
Définition extraite du « Petit guide pratique de la géomatique à destination des employeurs, des candidats et des formateurs », AFIGEO – 2013
Les missions de la médiation numérique portent sur trois grands axes :
Donner accès aux outils du numérique à tous : Il ou elle fournit l’accès à un ordinateur et une connexion internet aux personnes qui n’en possèdent pas, mais aussi à une imprimante.
Accompagner les usagers du numérique dans leur pratique quotidienne en ligne : Le médiateur ou la médiatrice explique et montre comment écrire et envoyer un courriel, comment effectuer une démarche en ligne pour faire une demande auprès d’une administration ou d’une entreprise, comment acheter un livre ou un billet de spectacle sur internet, comment télécharger une application et s’en servir, etc.
Développer une culture numérique : Cela passe par l’enseignement des bons gestes (comment se comporter sur internet auprès des autres utilisateurs, comment éviter les pièges tels que des tentatives d’escroqueries, comment protéger ses données personnelles, etc.)
Même si son rôle est orienté sur la sensibilisation aux outils numériques, il est de ce fait un partenaire à solliciter à toute politique de la donnée qui inclut des briques de sensibilisation et d'accompagnement.
Un producteur ou une productrice de données est une personne responsable des données, de leur création à leur validation au sein d’un service. Il ou elle contrôle la qualité et la fiabilité des données. Il ou elle peut être également en charge de la phase de mise à disposition. Dans les métadonnées d’un jeu de données ouvert, le producteur de données désigne l’entité qui pilote la collecte, le stockage et la mise à disposition des données. Il connaît parfaitement la thématique et les processus métiers dans lesquels il intervient.
Le ou la statisticien(ne) collecte les informations et les chiffres qu’il doit étudier. Pour mener à bien cette mission, il ou elle prépare un questionnaire ou une grille d’évaluation. Ce travail porte sur des domaines aussi larges que des enquêtes d’opinion, des études qualitatives, des essais thérapeutiques, etc. Il lui échoit de fixer la méthodologie d’enquête à adopter ; celle-ci peut se faire par téléphone, par courrier ou par internet. Il s’entoure d’assistants et d’enquêteurs pour mener à bien ce travail.
Une fois l’enquête terminée, il traite les résultats obtenus en vue de leur analyse. Pour ce faire, il utilise des logiciels qui décortiquent chaque donnée, qui résultent sous la forme de tableaux et de graphiques, que le statisticien devra synthétiser. Les résultats seront ensuite présentés à l’organisme ou la personne ayant passée la commande de l’enquête qui pourra agir en fonction de ces résultats.
Source : OpenDataFrance - Licence : CC-BY-SA
Version : v2.0, date : mai 2022
Plusieurs droits existent en France : le droit de communication, d’accès et de réutilisation.
Le droit de communication correspond au “droit des administrés à l'information”. Ce droit découle de l'article 15 de la Déclaration des Droits de l'Homme et du Citoyen de 1789 : “La Société a le droit de demander compte à tout Agent public de son administration.” Les acteurs publics ont diverses obligations de communication auprès de leurs publics.
Le droit d’accès concerne les documents administratifs produits ou reçus dans l’exercice de missions de service public. Les citoyens peuvent les demander et en obtenir une version personnelle sous forme d’un document papier ou électronique, sur clé usb…
Le droit de réutilisation s’applique aux informations contenues dans les documents publics. Les citoyens peuvent utiliser ces informations dans une de leur production. Ils doivent citer leur source et respecter la licence de réutilisation.
D’après le Code des Relations entre le Public et l'Administration (CRPA), tout document ayant fait l’objet d’une communication ou d’une diffusion en ligne est soumis au principe de libre réutilisation (article L321-1) et de gratuité (article L. 324-1). Ce changement s’est opéré récemment fin 2015 par la loi relative à la gratuité et aux modalités de la réutilisation des informations du secteur public (loi Valter - n° 2015-1779 du 28 décembre 2015) dont nombre d’articles sont abrogés et versés dans le CRPA.
Les administrations ont ainsi le devoir :
de répondre aux demandes de documents administratifs. Lorsqu'une demande est adressée à une administration et porte sur un document administratif qu’elle ne détient pas, car détenu par une autre administration, elle transmet la demande à l'administration concernée et en avise le demandeur.
de publier tous les documents administratifs qui font l'objet d'une obligation de publication (répertoire d'informations publiques, données essentielles des marchés publics et des subventions, budget...)
de publier les documents administratifs sous forme électronique dans un standard ouvert, aisément réutilisable et exploitable par un système de traitement automatisé.
Pour les administrations de plus de 50 agents (équivalent temps plein) et de plus de 3500 habitants, les administration ont, en outre, le devoir de publier les documents administratifs lorsqu'ils sont communicables à tous et qu'ils existent sous forme électronique.
En particulier :
les documents qui sont communiqués aux demandeurs et leurs mises à jour.
les documents qui figurent dans le répertoire d'informations publiques.
les données mises à jour de façon régulière et dont la publication présente un intérêt économique, social, sanitaire ou environnemental.
les bases de données que les administrations produisent ou reçoivent et qui ne font pas l'objet d'une diffusion publique par ailleurs.
les règles définissant les principaux traitements algorithmiques utilisés dans l'accomplissement de leurs missions lorsqu'ils fondent des décisions individuelles.
Une administration a le droit de produire une décision défavorable à la réutilisation d'informations publiques. Pour ce faire, elle doit notifier au demandeur sous la forme d'une décision écrite motivée comportant l'indication des voies et délais de recours.
En résumé, les citoyens ont droit:
à la liberté d'accès aux documents administratifs (CRPA),
à la liberté d'accès :
des documents administratifs dont les conclusions concernent le demandeur (Loi Cnil),
aux règles qui définissent le traitement algorithmique ayant pour objectif une décision individuelle (LPRN) (sauf s'il y a un secret protégé par la loi
de choisir la forme que doit prendre la communication (dans la limite des possibilités techniques de l'administration) : consultation gratuite sur place, délivrance d'une copie (si cela n'altère pas l'original), par courrier électronique (sans frais si le document existe originellement dans une version électronique), par une publication en ligne. Le demandeur peut être amené à payer le cout de production de cette copie, affranchissement compris.
de recourir à la Cada dans un délai de 2 mois, s'il n'a pas obtenu de réponse pendant un mois après sa demande.
à la réutilisation gratuite (il existe quelques exceptions) les données publiques tout en respectant la licence.
Par exemple, les données qui ont des droits de propriété intellectuelle détenus par des tiers, ne peuvent pas être réutilisées directement. Dans ce cas, c'est à l'administration d'indiquer au réutilisateur l'identité du titulaire de ces droits ou, si celle-ci n'est pas connue, l'identité de la personne auprès de laquelle l'information en cause a été obtenue. Ce point est non applicable aux bibliothèques, musées et archives. La licence précisera en particulier les conditions de réutilisation. A minima : les informations ne doivent pas être altérées, leur sens ne doit pas être dénaturé; leurs sources et la date de leur dernière mise à jour doivent être mentionnées. Si la réutilisation d'informations publiques contient des données à caractère personnel le réutilisateur devra respecter de la loi Informatique et Liberté.
L'ouverture des données est une démarche qui vise à définir des modalités de publication et de mise à disposition des données : l’enjeu est de simplifier l’accès aux données et de favoriser leur usage. Cette approche est résumée par l'acronyme FAIR : des données Faciles à trouver, Accessibles, Interopérables et Réutilisables. En ce sens cette démarche est souvent à l'origine de la structuration d'une politique des données, plus large.
La démarche d’ouverture offre un accès aux données et un cadre de réutilisation grâce à l’utilisation de licences et de formats qui permettent le traitement, la reproduction, la modification et la redistribution.
Pour les acteurs publics, la démarche d’ouverture, en plus de répondre à des obligations légales, constitue un levier d'action et d'animation des politiques publiques. Trois volets thématiques constituent des motifs pour valoriser et développer l’ouverture des données : l'ambition démocratique, la modernisation de l’action publique et le développement de l'innovation.
Source : OpenDataFrance - Licence : CC-BY-SA
Version : v2.0, date : juin 2022
Pour les acteurs publics, la démarche d’ouverture, en plus de répondre à des obligations légales, constitue un levier d'action et d'animation des politiques publiques. Regardons ici celui de l'ambition démocratique.
L'accès aux informations publiques est un droit fondamental inscrit dans l’article 15 de la Déclaration des Droits de l'Homme et du Citoyen : “La Société a le droit de demander compte à tout Agent public de son administration”.
Rendre des comptes, cela signifie que l’administration, dans sa mission de service public, doit être en mesure d’expliquer et de partager les éléments qui lui ont permis de réaliser ce service public. Ce droit est rappelé dans le Code des Relations entre le Public et l'Administration (CRPA) et garantit l'accès et la réutilisation des informations publiques par défaut en France. Historique, il a dû revêtir de nouvelles modalités à l'heure du digital qui ont été clarifiées par la Loi pour une République Numérique, du 7 octobre 2016.
La notion d'action publique recouvre toute les actions menées pour répondre à des besoins de la société. Les politiques publiques correspondent la structuration de plusieurs actions publiques par une administration qui les organise et les structure.
L'action publique détermine un cadre social et politique. Elle repose sur des principes, ceux du service public, égalité, adaptabilité et continuité mais également sur des lois et règlements qui s'incarnent notamment dans plusieurs codes (code des relations entre le public et l'administration, code général des collectivités territoriales...).
Ouvrir les données permet d’assurer l'accessibilité des informations produites et mobilisées au sein de politiques publiques. Les données peuvent être analysées, comparées et ainsi être source de débat et de décisions. L’objectif est de favoriser la confiance des citoyens et usagers envers les administrations qui non seulement produisent des services mais peuvent parfois également lever des financements (impôts, taxes) pour produire cette action publique.
Selon une étude du Piew Internet Research de mars 2011, les citoyens vivant sur un territoire ayant ouvert ses données sont 3 fois plus satisfaits de leur action publique.
Publier des données ouvertes peut s'inscrire dans la perspective de renforcer le dialogue entre le citoyen et l’administration. Les données peuvent ainsi contribuer à la mise en place d’un modèle participatif qui favorise l'implication citoyenne, en concourant au développement de la participation et la coproduction.
L’exemple de la métropole de Nantes : un groupe de citoyens, appartenant au projet OpenStreetMap reprit le fichier des bases adresses, publié par la collectivité en 2012 et proposa des modifications améliorant des informations locales utiles à tous, grâce à une coproduction.
Les démarches d’ouverture visent à donner aux citoyens des ressources auxquelles ils n’avaient pas accès auparavant : elles rendent opérationnels et effectifs non seulement le droit d’accès aux informations publiques par leur mise en ligne sur des portails dédiés, mais surtout le droit de manipuler, traiter et exploiter ces informations.
Source : OpenDataFrance - Licence : CC-BY-SA
Version : v2.0, date : juin 2022
Pour les acteurs publics, la démarche d’ouverture, en plus de répondre à des obligations légales, constitue un levier d'action et d'animation des politiques publiques. Regardons ici celui de la modernisation de l’action publique.
La mise en œuvre d'une démarche d'ouverture de données est l’occasion pour les administrations de mettre en place de nouvelles méthodes et outils au sein de leurs services. L’expérience montre qu’une telle démarche réussit lorsqu’elle constitue un vecteur de décloisonnement et qu’elle est une source de réflexion sur les données produites et collectées.
Une démarche d'ouverture de données est l'occasion de monter en compétences pour les agents et collaborateurs sur la gestion et la qualification des données : savoir les trouver, les utiliser, les croiser, les représenter.
Une démarche d'ouverture de données est l'occasion de mettre en œuvre de nouvelles formes de collaboration en interne comme en externe.
L’État et les collectivités organisent des événements qui visent à favoriser la collaboration à partir de l’utilisation des données : hackathons, datacamp, ateliers, etc. Ces évènements sont des moments de créations de services qui mobilisent aussi bien des équipes internes que des acteurs de la société civile. Ce sont des moments de coproduction et d'échanges riches en enseignements et qui vise l’amélioration des services, qu’ils soient publics ou privés. Le simple fait de faire l’inventaire des données avec les partenaires est souvent productif.
Mais au delà des productions événementielles, la gestion de projets incluant une exploitation des données suppose de développer de nouveaux savoir-être d'ouverture, de collaboration, d'expérimentation qui sont tous des leviers de transformation.
Les données sont la base des informations qui permettent aux décideurs de faire des choix éclairés. Améliorer la qualité des données contribue à fournir des éléments concrets, fiables, pour prendre des décisions et mettre les services publics en cycle d'amélioration continue. Certaines collectivités, comme le département de Saône-et-Loire relie ses données publiques de manière automatisée à son système décisionnel. Services et élus accèdent à des données à travers de nouvelles interfaces et s’appuient ainsi sur des éléments concrets et régulièrement mis à jour pour agir.
Source : OpenDataFrance - Licence : CC-BY-SA
Version : v2.0, date : mai 2022
D’une façon générale, l’expression “open data” est souvent employée pour désigner à la fois les politiques ou stratégies d’ouverture des données, et les données ouvertes à proprement parler. Mais que signifie “ouverture des données” ? La notion d’ouverture fait référence de manière métaphorique à la volonté de favoriser la publication d’informations sans restriction d’accès et d’utilisation. La publication en open data suppose la possibilité pour un tiers de traiter et manipuler les données.
L’ouverture des données est une politique publique qui développe des portails de mise à disposition de données et favorise la mobilisation et la réutilisation de données dans l’action publique. Cela s’appuie sur la pratique de médiations : il s’agit non seulement de publier en ligne et mettre à disposition des données dans un format ouvert, mais aussi de proposer des dispositifs d’accompagnement et d’animation de la publication.
Tous les acteurs peuvent ouvrir des données : des associations, des personnes, des entreprises...
Différents aspects limitent la diffusion des données : par exemple, les secrets légaux, les coûts importants de mise à disposition, les formats de fichiers propriétaires ou les conditions restrictives dans les clauses des marchés...
Une donnée ouverte est une donnée numérique caractérisée, à minima, par plusieurs propriétés :
elle est librement accessible,
elle est compréhensible,
elle est dans un format suffisamment répandu pour être exploitable par une machine,
elle est réutilisable par tous, ses conditions de réutilisation sont précisées dans une licence.
Une donnée ouverte n’est pas forcément une donnée publique. Associations, citoyens ou entreprises peuvent mettre des données à disposition, sans que celles-ci soient produites dans le cadre d’une mission de service public.
L’ouverture des données se réalise par la publication des données sur des sites web, des portails ou via des API (Interface pour l’accès Programmé aux Applications). Les données sont mise à disposition sous différents formats de fichiers qui permettent la manipulation et le traitement des données.
Tableau de synthèse des textes règlementaires qui encadrent l'ouverture des données publiques.
Source : OpenDataFrance - Licence : CC-BY-SA
Version : v2.0, date : juillet 2022
La publication et la protection des données publiques sont très encadrées.
La base ci-après référence la liste des principaux textes en droit français et européen qui régissent la publication des données.
Produit par la CNIL pour accompagner les collectivités territoriales
Source : OpenDataFrance - Licence : CC-BY-SA
Version : v2.0, date : juin 2022
Le guide revient sur les principales actions que les collectivités doivent mettre en œuvre (depuis mai 2018) pour être en conformité avec le RGPD :
désigner un délégué à la protection des données (DPO - Data Protection Officer), qui peut être mutualisé avec d’autres collectivités territoriales sous certaines conditions (voir ) ;
recenser les traitements de données et tenir à jour un registre de ceux-ci (voir ) ;
fonder le traitement de toute données à caractère personnel sur l’une des bases légales (voir ) ;
gérer la sous-traitance des traitements (voir ) ;
garantir la sécurité des données (voir ) ;
organiser la réponse aux demandes d’exercice des droits venant des administrés (voir ) ;
notifier à la CNIL, voire aux personnes concernées, les violations éventuelles de données à caractère personnel (par exemple les failles de sécurité) (voir ) ;
effectuer, dans certains cas, des analyses d’impact sur la vie privée et les libertés pour certains traitements à risques (voir ).
Source : OpenDataFrance - Licence : CC-BY-SA
Version : v2.0, date : juillet 2022
Certains acteurs économiques ont joué un rôle majeur dans le développement de l’open data en France. Ils ont contribué notamment à l'émergence de communautés d’acteurs des données ou ont créé des offres de services structurantes qui ont permis aux acteurs publics de démarrer des démarches d'ouverture des données.
Le Groupement Français des Industries de l’Information est un think tank spécialiste du marché de l’information et de la connaissance. Le GFII a pour vocation de rassembler les acteurs de l’information professionnelle - producteurs d’informations, prestataires de solutions, éditeurs, diffuseurs, bibliothèques universitaires, centres de documentation, etc. Le GFII organise des rencontres pour que les acteurs de l’information puissent échanger leurs points de vues sur des sujets aussi larges que l’économie, la législation et les aspects techniques du secteur. Le GFII organise également des groupes de travail autour de sujets stratégiques que l’open et le big data, veille et traitement avancée des données, open access, etc.
La Fédération SYNTEC a été créée le 1er janvier 1991.
Devenue Numeum, fusion de Syntec Numérique et de TECH IN France, elle regroupe les entreprises de services du numérique (ESN), les éditeurs de logiciels, les plateformes et les sociétés d’Ingénierie et de Conseil en Technologies (ICT).
La Fédération apporte son expertise sur plusieurs points : la négociation et la conclusion de conventions et accords collectifs de travail ; la représentation commune de ses unions de syndicats et de ses syndicats auprès des Pouvoirs Publics ; l’étude de questions économiques, techniques, juridiques, etc. d’intérêt commun aux unions de syndicats adhérents.
Les cabinets de conseil CIVITEO, DATACTIVIST, INNOPUBLICA et le cabinet d’avocats PARME Avocats forment une alliance d’entreprises et créent une marque commune pour offrir leurs services aux acteurs de la sphère publique confrontés à l’explosion des problématiques de gestion des données. Transparence, ouverture des données publiques et loi sur l’open data, villes intelligentes et projets de smart city, big data des territoires, recours aux algorithmes et à l’intelligence artificielle, protection des données personnelles des habitants… les enjeux de la gestion des données sont de plus en plus présents dans la sphère publique.
La société OpenDataSoft a été créée en 2011 avec pour volonté de développer une plate-forme en ligne servant à la transformation rapide des données en informations et en services (API, visualisation de données, etc). L’objectif est de faciliter la publication des données par les collectivités territoriales et les entreprises et dans le même temps faciliter le partage de ces données en vue de leur réutilisation par les usagers.
Cityzen Data propose d’aider les villes à installer des capteurs aux endroits clefs pouvant contribuer à l’amélioration des services urbains à destinations des habitants. La société propose également de mettre à disposition de ses clients une plate-forme, des outils d’analyse, des API et des outils de visualisation.
L’infrastructure Ozwillo a été créée suite à un projet européen par des utilisateurs, des développeurs, des fournisseurs de services. Regroupés en association créée le 5 février 2016, avec pour dessein une utilisation neutre et loyale de l’infrastructure Ozwillo et des données. Elle vise aussi à valoriser les données par la maîtrise et l’exploitation de ces dernières ; à promouvoir les applications par une meilleure visibilité et un plus large accès en mobilité de celles-ci ; et la dynamisation des projets, de leur idée à leur commercialisation.
MGDIS édite des logiciels d’aide à la décision et au pilotage depuis 1983, à destination des collectivités locales, des hôpitaux, des EHPAD, des organismes d’État et des établissements publics et parapublics. Ces logiciels de gestion et de pilotage ont plus précisément pour vocation à : aider à la direction financière et à la maîtrise des cycles financiers ; aider et éclairer les directions générales et financières à la prise de décisions stratégiques ; accompagner les élus pour le déploiement des politiques publiques ; organiser et piloter la gestion des dossiers et procédures administratives ; etc.
Isogeo est l’éditeur de la plate-forme web (SaaS) du même nom, créée en 2009 avec l'objectif d’aider les organismes publics et privés à optimiser l’utilisation, le partage et la valorisation de leurs données géographiques.
Depuis, elle permet le recensement et la diffusion de tout type de données via ses outils de catalogage et son API RESTful, permettant de gérer plusieurs niveaux de consultation orientés usages professionnels, semi-professionnels et publics.
#association #opendata #datacollectif
Source : OpenDataFrance - Licence : CC-BY-SA
Version : v2.0, date : juillet 2022
L’AFIGEO est l’Association Française pour l’Information Géographique créée en 1986. Elle a pour objet d’accompagner le développement du secteur de l’information géographique en France et à l’international. Elle fédère près de 200 organismes (producteurs et utilisateurs, collectivités territoriales et services de l’État, grands groupes et TPE, universités et organismes de formation...), qui échangent et partagent sur les questions clefs du marché de l’information géographique, des services associés, de ses usages et des évolutions des formations à la géomatique. Elle anime des groupes de travail dont un dédié à l’ouverture des données, participe à des actions internationales (ENERGIC OD…), produit des ressources documentaires (“L’information géographique et l’open data” en 2017) et organise des événements d’envergure.
La Fondation Internet Nouvelle Génération est un think tank créé en 2000 par Daniel Kaplan et Jacques-François Marchandise. Il s’intéresse à toutes les transformations numériques, réunit des acteurs des organisations publiques et privés et favorise le dialogue avec les acteurs de la recherche. Dès 2010, la FING engage des expérimentations sur l’open data dans deux territoires pilotes et anime au niveau national la réflexion sur la réutilisation des données publiques par des événements (Open Data Garage). En 2013, la question du public des données se pose de façon abrupte : or, sans public, comment faire de l’innovation sociale? La campagne Infolab est lancée, une expérimentation sur le Self Data également. L’objectif est de définir la culture des données et produire des médiations qui peuvent faciliter l’accès à cette culture. L'association a cessé son activité en 2022 mais certains de ses chantiers, comme le programme "Culture D" (acculturation à la donnée) sont repris par l'association Opendata France.
Créée en 2009, LiberTIC est une association nantaise de loi 1901 qui a favorisé le développement des démarches d’ouverture sur l’ensemble du territoire français. Grâce à la rédaction d’une lettre ouverte signée par 200 personnes, elle est à l’origine de l’engagement de la ville de Nantes dans l’open data en février 2011. Elle participe à la veille en produisant une carte de France de l’open data et à la création d’outils de sensibilisation (vidéos, ressources documentaires...). L’association est co-organisatrice de la première Opération Libre (et des suivantes) et des éditions de l’Open Data Week (Marseille 2013, Rennes 2015).
L’association Opendata France a été en octobre 2013 et réunit les collectivités engagées dans des démarches d’ouverture des données publiques. Elle a pour objectif de promouvoir l’open data à toutes les échelles territoriales et de faciliter sa mise en œuvre par les échanges avec les différents acteurs économiques et politiques. Elle émet une veille et édite des guides de sensibilisation, organise des formations et événements. Des groupes de travail sont animés sur des thématiques structurantes (standardisation, cadre légal, indicateurs…) et contribuent à la création de référentiels nationaux.
Open Knowledge International est une organisation non-gouvernementale qui milite pour le développement de l’open data en encourageant les initiatives gouvernementales et les réutilisations par la société civile. Elle fournit la solution CKAN, solution technique open source qui permet la publication de données. Elle est à l’origine du projet School of data qui propose des cours en ligne et assure des formations (Ecole des données pour la version française). Elle réalise aussi l’Open Data Index, classement international des pays engagés dans les démarches d’ouverture.
Le projet OpenStreetMap est né en 2004 au Royaume-Uni et se fonde sur la contribution des usagers pour la production de données géographiques. La base de données est sous Open Database Licence cartes (ODbL). En 2006, est créée la fondation OpenStreetMap. En France, l’association a participé à la création de la Base Adresse Nationale (Ban : adresse.data.gouv.fr) aux côtés de l’Etat Français, du Groupe La Poste, de l’IGN. Cette base référence l’ensemble des adresses du territoire français et vise à fournir des données de référence aux acteurs de la sécurité, de la santé et des services.
Regards Citoyens est un collectif qui s’est formé en juillet 2009 et qui s’est constitué en association en juin 2010. L’association travaille à la promotion de la mise à disposition des données publiques par la création et le développement d’outils. Elle met au cœur de ses préoccupations l’éducation et la citoyenneté. Elle produit des dispositifs qui permettent aux citoyens de participer à la vie publique (Crowdsourcing de l'analyse de la consultation Égalité Femmes/Hommes en 2016, numérisation des déclarations d’intérêts en 2013).
Thème
Format
Représentation
Tableur
.ods , .csv
Sémantique
.rdf
Géographique
.kml, .shp
Image
.png, .gif, .jpeg
3D
X3D
Données complexes
.xlm, .json
Source : OpenDataFrance - Licence : CC-BY-SA
Version : v2.0, date : juillet 2022
La mission Etalab, créée en février 2011, est chargée de stimuler et coordonner la politique d’ouverture et de partage des données publiques (« open data ») et de coordonner la représentation française au sein du Partenariat pour un gouvernement ouvert (« Open Government Partnership »). Rattachée aux services du Premier ministre, la mission Etalab fait partie de la direction interministérielle du numérique de l’Etat (DINUM). La mission Etalab a 3 principales missions :
accompagnement des administrations dans l’ouverture des données publiques, gestion de la plateforme data.gouv.fr et mise en place du service public de la donnée (SPD) ;
circulation et exploitation (exemple Lab IA) des données au sein de l’administration en œuvrant pour des politiques publiques pilotées par la donnée ;
ouverture du gouvernement et représentation de la France au sein du Partenariat pour un gouvernement ouvert.
La Commission Nationale de l’Informatique et des Libertés (CNIL) est une autorité administrative indépendante créée en janvier 1978. Elle est en charge de la protection de la vie privée et des libertés dans l’usage de l’informatique. La CNIL a trois grandes missions :
l’information et le conseil,
le contrôle
les sanctions.
En France, tout traitement de données à caractère personnel doit faire l’objet de protections particulières précisées par la loi pour une République numérique et le Règlement Général pour la Protection des Données. A partir d’avril 2018, le Délégué à la Protection des Données (DPO) remplace le Correspondant Informatique et Libertés (CIL). Ses fonctions et responsabilités sont élargies pour protéger les données à caractère personnel.
La Commission d’Accès aux Documents Administratifs (CADA) a été créée en 1978 et est une autorité administrative indépendante. Elle a pour vocation de garantir à tout citoyen l’accès aux documents administratifs, dans une logique de transparence et de redevabilité des administrations; elle garantit également le droit à la réutilisation des informations publiques. Depuis 1978, ce droit d’accès est assuré, quel que soit le format d’origine du document. La CADA peut être saisie par tout citoyen en cas de refus de communication ou de réutilisation. Ses missions sont définies par la loi “CADA” de 1978, codifiée dans le livre III du Code des Relations entre le Public et l’Administration (CRPA).
Les collectivités territoriales ont l’obligation de désigner un correspondant CADA qui a pour missions de :
Réceptionner les demandes d'accès aux documents administratifs et de licence de réutilisation des informations publiques ainsi que les éventuelles réclamations et de veiller à leur instruction
Assurer la liaison entre l'autorité auprès de laquelle elle est désignée et la commission d'accès aux documents administratifs.
Il peut être également chargée d'établir un bilan annuel des demandes d'accès aux documents administratifs et de licence de réutilisation des informations publiques qu'elle présente à l'autorité qui l'a désignée et dont elle adresse copie à la commission d'accès aux documents administratifs.
La Haute Autorité pour la Transparence de la Vie Publique est une autorité administrative indépendante qui succède à la Commission pour la Transparence Financière de la Vie Politique suite à la loi relative à transparence de la vie publique du 11 octobre 2013. Elle est en charge de la publication des déclarations de situation patrimoniale et des déclarations d’intérêts de certains élus et des membres du gouvernement. Elle a pour mission la publication des données des déclarations sous la licence ouverte promue par Etalab (LO) et la tenue du registre des représentants d’intérêts.
Le COEPIA est le Conseil d’Orientation de l'Édition Publique de l’Information Administrative. Ce conseil a été créé en janvier 2010 et traite des questions relatives à l’édition publique, à l’information et au renseignement administratif, ainsi qu’à la publication des données publiques. En octobre 2015, la composition du conseil a été renouvelée pour renforcer son analyse et son expertise dans le domaine de l’ouverture des données et du gouvernement.
Le Conseil National du Numérique est un organisme consultatif créé en 2011 afin de produire une réflexion sur les enjeux sociaux, culturels et économiques du numérique. Il a mis en place une vaste consultation qui a donnée lieu au rapport “Ambition numérique”, base à la rédaction de la loi pour une République numérique. En avril 2017, le conseil émet un avis sur “la libre circulation des données en Europe”.
Il publie régulièrement des études. Pour accéder à ses travaux :
Les collectivités territoriales ont joué un rôle déterminant en France dans le développement de la culture de l’ouverture et dans les actions de mise à disposition des données publiques. Elaborée dans le cadre de l'Observatoire de l'open data, la carte ci-dessous présente les acteurs ayant engagés une démarche d’ouverture de leurs données.
Quelle(s) licence(s) choisir pour publier ses données publiques ? Le point sur le concept de licence et les préconisations actuelles pour faciliter l'accès aux données publiques.
Source : OpenDataFrance - Licence : CC-BY-SA
Version : v2.0, date : juillet 2022
Pour toute diffusion d’information, il est nécessaire de fixer un cadre juridique dans lequel se fait la mise à disposition des données ouvertes. On utilise pour cela une “licence” qui est attachée à chaque jeu de données.
Au carrefour du droit et de l’économie, les licences sont directement liées à la notion de propriété intellectuelle. Une licence est un document qui précise les droits et les devoirs des producteurs et des réutilisateurs de données. Elle présente la nature des engagements des parties prenantes dans le cas d’une collaboration ponctuelle ou récurrente. Elle crée ainsi un cadre qui assure la pérennité et la collaboration.
La démarche d’ouverture vise à faciliter la diffusion et la réutilisation des données publiques, sans faire de discrimination dans les possibles réutilisations. Le choix de la licence est donc fondamental. Un nombre réduit de licences sont aujourd’hui utilisées et recommandées par l’état.
Une licence ne s’applique pas à un portail open data, mais à un jeu de données. Par facilité, certains portails affichent une licence qui s’applique par défaut aux données publiées. Il est nécessaire de vérifier si certaines d’entres-elles ne sont pas régies par une licence spécifique (héritée par exemple de son régime initial de publication par un tiers).
Dans , le magistrat de la cour des comptes Trojette souligne l’importance de ne pas noyer les utilisateurs dans les méandres de licences spécifiques : « dans un contexte de concurrence avec des données produites hors du service public, les contraintes ainsi imposées aux réutilisateurs doivent être aussi simples à appréhender et à accepter que possible : une jeune pousse du secteur des Big data, désireuse de réutiliser les données publiques de différentes administrations (et dans des pays différents) ne consentira pas à faire appel à un avocat pour étudier toutes les licences types non standards de l’administration.
Dès lors, l’administration devrait privilégier des licences-types auxquelles d’éventuelles licences spécifiques seraient automatiquement compatibles. Ces licences pourraient avoir l’avantage d’une formulation compatible avec les standards internationaux – pour la définition desquels la France a un rôle à jouer – et faire l’objet d’une traduction pour accroître l’attractivité des plateformes hors de France. »
Les licences libres sont apparues au milieu des années 1980, lorsque le a été adapté et étendu aux logiciels.
C'est une qui s'applique à une par laquelle l'auteur concède tout ou partie des droits que lui confère le , en laissant au minimum quatre droits considérés fondamentaux aux utilisateurs :
usage de l'œuvre ;
étude de l'œuvre pour comprendre son fonctionnement ou l'adapter à ses besoins ;
modification (amélioration, extension et transformation) ou incorporation de l'œuvre en une ;
redistribution de l'œuvre, c'est-à-dire sa diffusion à d'autres usagers, y compris commercialement.
Les licences libres sont donc :
des contrats de licence non exclusive,
de droits de propriété intellectuelle
consentis pour le monde entier,
par lesquels un titulaire de droits autorise un licencié à copier, modifier, utiliser et distribuer des données (et plus généralement une création)
la notion de gratuité n’est pas directement liée à la licence, l’accès peut être gratuit ou pas.
Le succès d’une licence est rattaché à ses qualités intrinsèques, mais aussi à de multiples facteurs externes (ses “supporters” industriels ou communautaires, sa langue, les projets leaders, etc.).
Dans les faits, sauf cas exceptionnels, les collectivités choisiront leurs licences parmi celles homologuées par l’état.
A ce jour (déc.2018), il s’agit essentiellement de :
Licence Ouverte v2.0
ODbL
Dans la majorité des cas, la collectivité produit par elle-même, ou par un prestataire, les données qu’elle publie en open data. La règle générale recommandée par l’état est l’utilisation de la Licence Ouverte, qui est une licence simple et dite “permissive” car les réutilisations engendrent peu de contraintes.
Lorsque les données ont été produites dans le cadre d’une collaboration forte avec la société civile (contribution citoyenne) ou lorsque les données sont considérées comme un “bien commun informationnel”, il peut être légitime de protéger cette ressources en imposant un partage à l’identique, c’est à dire la contribution des réutilisateurs à l’enrichissement de ces données. C’est le sens général des licences de type “copy-left” et particulièrement de la licence ODbL.
Attention : la licence ODBL est plus restrictive, elle freine la réutilisation des données et elle peut engendrer des situations de blocages. Elle ne doit être utilisée qu'après une analyse approfondie du sens de la protection des données publiées sous un tel régime.
On distingue deux classes : les licences copyleft et les licences “permissives”.
Au sein d’une licence copyleft, ou Contributive, les contributions et modifications doivent être reversées sous la même licence (« obligation de réciprocité »).
Les licences permissives autorisent la diffusion de la création finale ou des contributions sous n’importe quelle autre licence tant que sont conservées certaines obligations généralement peu contraignantes (garder a minima le texte de la licence et indiquer le nom de l’auteur).
Il est nécessaire préciser clairement sous quelle licence les données utilisées et/ou mises à disposition sont utilisées et utilisables sur une plateforme.
Pour cela il faut donner le nom complet de la licence choisie (et si on le souhaite, son acronyme) ainsi qu’un résumé des droits et restrictions qu’elle suppose. Il est également nécessaire de donner accès au texte complet de la licence (via un lien hypertexte ou un document à télécharger / à consulter en ligne).
Il peut être utile de préciser à l’utilisateur de quelle manière il devra créditer la plateforme. On peut également mettre à disposition du code informatique permettant d’établir un lien et d’associer des métadonnées à l’œuvre ou aux données d’origine.
Lorsqu’ aucune licence prévue dans le décret ne répond aux besoins d’une administration et qu’elle souhaiterait recourir à une licence spécifique, cette licence devra être homologuée par l’Etat, en l’occurrence la DINSIC, selon les critères fixés par le décret.
Dans le cadre de la politique du Gouvernement en faveur de l’ouverture des données publiques, Etalab a conçu la « Licence Ouverte / Open Licence ». Cette licence, élaborée en concertation avec l’ensemble des acteurs concernés, facilite et encourage la réutilisation des données publiques mises à disposition gratuitement.
La « Licence Ouverte / Open Licence » présente les caractéristiques suivantes :
Une licence ouverte, libre et gratuite, qui apporte la sécurité juridique nécessaire aux producteurs et aux réutilisateurs des données publiques ;
Une licence qui promeut la réutilisation la plus large en autorisant la reproduction, la redistribution, l’adaptation et l’exploitation commerciale des données ;
Une licence qui s’inscrit dans un contexte international en étant compatible avec les standards des licences Open Data développées à l’étranger et notamment celles du gouvernement britannique (Open Government Licence) ainsi que les autres standards internationaux (ODC-BY, CC-BY 2.0).
Une exigence forte de transparence de la donnée et de qualité des sources en rendant obligatoire la mention de la paternité.
Une opportunité de mutualisation pour les autres données publiques en mettant en place un standard réutilisable par les collectivités territoriales qui souhaiteraient se lancer dans l’ouverture des données publiques.
Pour l’essentiel, cette licence indique :
Le « Concédant » concède au « Réutilisateur » un droit non exclusif et gratuit de libre « Réutilisation » de l’« Information » objet de la présente licence, à des fins commerciales ou non, dans le monde entier et pour une durée illimitée, dans les conditions exprimées ci-dessous.Le « Réutilisateur » est libre de réutiliser l‘ « Information » :
de la reproduire, la copier,
de l‘adapter, la modifier, l‘extraire et la transformer, pour créer des « Informations dérivées », des produits ou des services,
de la communiquer, la diffuser, la redistribuer, la publier et la transmettre,
de l’exploiter à titre commercial, par exemple en la combinant avec d’autres informations, ou en l’incluant dans son propre produit ou application.
Sous réserve de :
mentionner la paternité de l’ « Information » : sa source (au moins le nom du « Concédant ») et la date de dernière mise à jour de l’ « Information » réutilisée.
Suivi de paragraphes relatifs :
aux données à caractère personnel,
aux droits de propriété intellectuelle,
à la responsabilité des producteurs et des réutilisateurs
à la compatibilité avec d’autres licences existantes
au droit applicable (français)
ODbL est comparable à Licence Ouverte sur les points :
pas de responsabilité pour le producteur,
possibilité de complète réutilisation y compris à des fins commerciale,
sous réserve de respecter l'intégrité des données (ne pas les modifier, ne pas les détourner) et de citer la source (notion de paternité)
Elle ajoute cependant une notion très importante : Partage à l'identique (ou Share-Alike)
Elle est proche de la licence CC-BY-SA (BY pour paternité et SA pour Share-Alike), qui elle n'est pas homologuée puisque assez redondante avec OBdL. Certains continuent cependant à utiliser CC-BY-SA car elle inclut plus facilement la protection de ressources numériques qui ne sont à proprement parler des données : support multimédia (image, sons, vidéos, ..)
De nombreuses considérations et questions ont été précisées dans le document suivant :
Ces libertés peuvent être soumises à conditions, notamment l'application systématique de la même licence, ou d'une licence prodiguant les mêmes droits aux utilisateurs, aux copies de l'œuvre et aux œuvres dérivées : un principe nommé .
Afin d’éviter la prolifération des licences, la a prévu la création d’une liste, fixée par décret, de licences qui peuvent être utilisées par les administrations pour la réutilisation à titre gratuit de leurs informations publiques, qu’il s’agisse de données ou de code source d’un logiciel ().
Source Etalab >
La prévu par l’article L 323-2 du CRPA fait de la LO 2.0 la licence de référence pour les administrations pour la publication de données publiques, aux côtés de l’ODbL, et permet ainsi son utilisation par l’ensemble des administrations.
Le logo de la « Licence Ouverte / Open Licence » est également librement réutilisable :
Le texte de la licence :
L'Open Database License (ODbL) est un contrat de favorisant la circulation des . Elle est issue du projet opendatacommons.org de l'.
Source originale :
Traduction française :
dans le champ de la donnée
OpenDataFrance propose une version synthétique et pragmatique de la conduite de projet en abordant :
Agir en "mode projet" permet d'atteindre un objectif fixé en s'appuyant sur des méthodologies éprouvées et d'entrer dans un cadre qui facilite l'obtention du résultat visé, notamment quand il s'agit d'innovation.
Quelle que soit l'ambition initiale, il est recommandé d'appliquer une méthodologie de gestion de projet, qu'il s'agisse :
De l'ouverture de données, du développement d'une plateforme de diffusion de données, d'un projet global de mise en œuvre de l'open data dans une structure publique ou privée (traduction opérationnelle d'une politique, d'une stratégie de la donnée), de la circulation des données (API, élaboration de standard, partage entre acteurs identifiés…),
De l'usage, de l'exploitation des données (création ou amélioration d'un service numérique, pilotage, alimentation de la transition environnementale, de travaux de recherche, d'un observatoire, d'une concertation)…
En initiant un projet, on s'assure en premier lieu de répondre correctement à un besoin.
En agissant selon une méthodologie projet on vise la réussite, cependant, on peut affronter une situation d'échec. Elle ne devra pas être vécue comme une erreur indépassable - droit à l'erreur - mais au contraire comme une leçon dont tous les acteurs du projet s'inspireront pour améliorer leur façon de procéder. Il est important de capitaliser sur les réussites comme sur les échecs et le projet est un cadre qui le permet.
Un projet, c'est :
Un objectif clairement défini à atteindre
Une liste de tâches précises pour y parvenir
Trois principes à équilibrer :
La qualité de la réponse apportée
La maitrise des couts
Le respect des délais
Une attention continue portée à l'usager-bénéficiaire cible.
Le projet est ponctuel, il a un début et une fin (un planning) et il lui est attaché des moyens humains, techniques, juridiques, administratifs et financiers.
Précision : L'amélioration continue d'un service numérique, un produit, d'une solution, d'un jeu de donnée ouvert… est une démarche qui pourra être initiée à l'issue du projet. Elle est généralement portée par un.e Chef.fe de produit (product owner) ou un Ingénieur d’amélioration continue (commun dans le secteur industriel).
Le projet dans le domaine du numérique et de la donnée a naturellement une dimension d'innovation et par la même intègre la conduite du changement dans son déroulé et l'itération (développement ou résolution par phases successives) dans sa réalisation.
Ressources :
Les notions de bases de la gestion de projet : Blog "Réussir ses projets"
UTILO, kit des facilitateurs d'innovations publiques en Bretagne (susciter l’intelligence collective pour concevoir ou faire avancer un projet) par La communauté des Facilitateurs d’innovation publique de Bretagne UTILO et le Ti Lab
Exemple de conduite de projet partenarial RUDI par Rennes Métropole : plateforme et "réseau social" de donnée
Guide de l'innovation centrée-usager par La FING
Développer de nouveaux services numériques par le CEREMA
Les principes de gestion de projet : QCDA
6 étapes clés de la conduite du changement par le MBA marketing digital & e-commerce de l'Institut Léonard de Vinci
Conduite du changement organisationnel dans l'administration publique -Revue de littérature - FE Nouiker - International Journal of Accounting, - 2021 - ijafame.org
La conduite de projet est une mission à part entière qui peut être menée par des personnes dont c'est la fonction (chef.fe, directeur.trice de projets) ou confiée pour un temps donné à un agent, un.e salarié.e, un.e intrapreneur.euse dans le secteur public ou privé, un.e prestataire… expert.e sur le domaine de la donnée et/ou plus globalement du numérique ou encore, dont l'engagement sur le sujet traité assure le portage du projet.
Une lettre de mission – ou toute démarche similaire - est recommandée car elle permet d'asseoir la légitimité d'un.e chef.fe de projet.
Le.a chef.fe de projet est garant de la réussite du projet, c'est lui.elle qui en porte la responsabilité.Démarche d'ouverture des données ou développement de service numérique, un projet ne peut aboutir positivement que par la désignation d'une personne l'incarnant.
Le.a chef.fe de projet constitue une équipe projet sur laquelle il n'a pas de pouvoirs hiérarchiques mais qu'il fédère (management transversal) afin de faire émerger synergie des compétences et intelligence collective au service du projet. Chaque membre de l'équipe projet a des tâches à mener et des objectifs à atteindre, assignés par le.a chef.fe de projet avec qui la communication doit être fluide et constante.
Le.a chef.fe de projet réalise également un état des lieux de son écosystème local et plus global pour identifier des partenaires potentiels, des homologues travaillant sur les mêmes sujets (mutualisation envisageable), les réseaux existants et les structures pouvant lui apporter ressources et documentation, soutien, animation d'événement en lien avec le projet ou de mobilisation de "testeurs", démarche de médiation (réseaux, associations, monde académique, experts reconnus sur le domaine, laboratoires d'innovation locale, tiers-lieux …).
Le.a chef.fe de projet doit mettre en œuvre une gestion de projet qui s'appuie sur 3 volets :
la planification (calendrier – diagramme de Gantt par exemple- coordination des tâches, jalons)
le suivi (organisation, mesures d'ajustement au contexte)
le contrôle (activités effectuées, objectifs atteints)
Il.elle s'assure en continu de la qualité de la communication au sein de l'équipe projet, avec les personnes ressources sollicitées ponctuellement, les commanditaires (élus, direction, propriétaire du projet…) partenaires le cas échéant et bien entendu avec les usagers finaux. Plus globalement, il met en œuvre un plan de communication tout au long du projet et pas uniquement sur les résultats finaux, même si c'est un point d'orgue de ses actions de communication.
La gouvernance d’un projet, c'est une définition des rôles et responsabilités de chaque acteur du projet, notamment l'équipe projet mais aussi des personnes ressources impliquées, sollicitées ponctuellement. Parmi les outils qui peuvent être exploités pour les préciser : RACI ou matrice de responsabilité.
Sur le sujet spécifique de la gouvernance de la donnée (et de la coopération), un article dédié est en ligne sur l'espace ressources d'OpenDataFrance.
Une gouvernance claire permet un pilotage clair : plusieurs responsables signifie une absence de responsabilité voire un conflit, situation à écarter dans la gestion de projet au profit d'un dialogue constructif et d'une circulation active des informations.
La gouvernance peut se traduire, lorsque les moyens informatiques de la collectivité ou de la structure le permet, par la création d’une plateforme de gestion de ce projet incluant les échanges permettant une transparence sur l'ensemble des actions menées et des résultats obtenus.
La gouvernance d'un projet se traduit aussi dans sa "comitologie". La gestion de projet nécessite de mettre en place des instances qui seront dimensionnées selon l'envergure du projet. Voici une liste d'instances standards qui sera adaptée au contexte et aux enjeux :
Le comité politique (COPOL) : C'est un échange avec les élus dont les délégations sont impactées ou pour qui le projet est une mise en œuvre du plan de mandat et des politiques qu'ils portent, dans le cas des collectivités territoriales. Ce peut-être également une réunion avec les ministres, le Préfet mais aussi le.a Président.e ou CEO dans le secteur privé (selon le contexte, les porteurs de la politique). Il s'agit d'aborder généralement l'initialisation du projet (accord politique sur les objectifs visés et sur le lancement du projet), un bilan intermédiaire et une présentation des résultats.
Le comité stratégique (COSTRA) : Tout projet s'appuie sur une stratégie (enjeux auxquels le projet répond) et un plan d’action visant à établir les charges et à coordonner l’action des intervenants. Sa composition doit permettre d'avoir une vision globale du projet, permettant de dresser un état des lieux du projets à ses différentes phases. C'est une réunion régulière qui a pour vocation de prendre des décisions, de renforcer l’adhésion de tous les acteurs et faire office de "sponsor du projet". Le comité stratégique rassemble les décideurs et garantit la concordance entre les actions menées dans le cadre du projet et la stratégie dans laquelle elle s'inscrit.
Le comité de Pilotage (COPIL) : Le comité de Pilotage figure, parmi les instances de gouvernance, comme celui chargé, d’une part, d’impulser l’intervention du sponsor, afin de s’assurer que la meilleure décision sera prise, et, d’autre part, d’établir l’état d’avancement du projet IT. Il est le garant de la cohérence entre les décisions à prendre et les enjeux de l’opération, notamment au regard des délais et des coûts du projet IT. Sa fonction est multiple. Du suivi global de l’avancement du projet à la prise de décision conformément aux finalités, en passant par l’orientation ou la modification des actions sur proposition du client, le comité de Pilotage a un rôle clé dans la bonne marche du projet. Le COPIL est une instance essentielle qui s'assure que le projet se déroule conformément aux objectifs définis. C'est l'instance qui permet de :
Suivre la progression du projet selon le planning initial
S'assurer de l’avancée des livrables prévus
Suivre le budget, le planning et la qualité des livrables
Identifier les alertes et les risques, définir les solutions
Prendre des décisions sur les sujets bloquants et les ressources à affecter, définir des modes de solutions et prendre des décisions Le COPIL remonte au COSTRAT ou COPOL les problèmes qui relèvent de leur périmètre et donc de décisions majeurs. Pour les organisations plus modestes, le COPIL fait office de COSTRAT et de COPOL.
Le comité de Projet (COPROJ) : C'est la cheville ouvrière du projet, une instance plus opérationnelle qui permet très concrètement de piloter le projet. Le.a chef.fe de projet anime ce comité et s'assure au travers de cette instance du bon déroulé du projet et d'une coordination de ses acteurs comme des tâches affectées, en cours et à venir. Les points de tension sont passés en revue, comme l'est l'application d'un potentiel PAQ (Plan d’Assurance Qualité), une revue des livrables est réalisée avec le degré d'avancement (recette, livraison…). C'est le cadre de décisions opérationnelles en matière de modification ou de conformité des choix fonctionnels ou techniques avec une revue des différents indicateurs (KPI) et adaptation, au regard de ce suivi, des ressources.
Outre ces instances, on peut également avoir le comité de Décision Métier (CODEM), le comité de décision technique (COTEC), le comité de suivi des activités de maintenance (CORUN).
Concevoir un projet c'est identifier le besoin et définir les objectifs pour y répondre.
Il s'agit de formaliser les principales étapes et d'identifier les ressources (humaines en premier lieu) et les parties prenantes pour atteindre les objectifs.
Il peut être utile de faire des études de faisabilité pour estimer l'envergure du projet (coût, mobilisation de compétences internes ou externes, évolution technologique…) afin de mesurer les capacités à le porter.
Dans cette phase de conception, il est nécessaire d'établir des critères de réussites et de suivre les indicateurs tout au long du projet.
L'organisation propre au projet doit être mise en place, en s'assurant que les responsabilités soient établies, chaque domaine de compétences nécessaire soit couvert et que la gouvernance soit installée.
Le calendrier du projet est arrêté. Pour chaque livrable,
les tâches à réaliser sont précisées,
le budget attribué
le temps de leur réalisation déterminé
les ressources nécessaires identifiées
la personne responsable désignée
les dépendances entre tâches bien comprises (doivent-elles être réalisées avant, parallèlement, après.. certaines autres tâches)
Une évaluation des risques (par exemple par la méthode AMDEC - Analyse des Modes de Défaillance, de leurs Effets et de leur Criticité) permet d'anticiper les problèmes et de trouver collectivement des solutions.
C'est l'étape de la réalisation, les tâches sont effectuées selon le plan d'action, sous le pilotage du.de la chef.fe de projet. Une attention particulière est portée aux activités majeures qui garantissent la réussite du projet et des jalons qui leur sont attachés sur lesquels il est nécessaire d'être très attentif.
Il est conseillé de mener un projet, lorsqu'il est complexe, en plusieurs étapes afin de garantir la mobilisation des personnes impliquées sur le long terme, sans épuisement ni démotivation, et de reconnaitre pour chacune des étapes, les réussites acquises. C'est un acte fédérateur qui permet à l'équipe de mesurer concrètement les avancées et de maintenir l'engagement collectif. L'attention portée aux talents participant au projet reste la clé essentielle de son succès.
Les livrables intermédiaires doivent être testés si possible auprès de l'utilisateur-usager final. On privilégiera la méthode agile qui permettra une itération sur chacun de ces résultats afin de réagir au plus tôt en cas d'inadaptation aux besoins et ceci afin de garantir l'atteinte des objectifs comme la satisfaction du client-usager.
L'énergie nécessaire à la réalisation et à l'exécution du projet doit être mobilisable jusqu'au livrables finaux, gages d'atteintes des objectifs.
La valorisation des livrables (donnée ouverte, plateforme de diffusion mise en ligne, service numérique et application déployés…) nécessite un accompagnement au changement (formation, séance de présentation, événement) qui ne s'improvise pas et une stratégie de communication anticipée.
Un bilan du projet doit être établi afin de capitaliser sur les résultats positifs tout comme les problèmes rencontrés afin d'enrichir la conduite de projet à venir.
Une revue des indicateurs créés au moment de la conception est réalisée et permet de mesurer pertinence du dimensionnement des ressources, difficultés et atouts du projet.
Ressources :
Conduite de projet : définition et principes communs (WikiTerritorial – CNFPT)
Diffuser la culture du mode projet dans la fonction publique (Direction Générale de l'Administration de la Fonction Publique - 2019)
La gestion de projet selon l'école EDC Paris Business School
L'impact d'un projet doit être évalué. Il existe plusieurs méthodes pour le mesurer et au préalable, il faut définir des indicateurs – quantitatifs, qualitatifs – qu'il sera nécessaire de suivre pour opérer des actions correctrices ou comprendre le niveau de satisfaction de la cible du projet.
Ressources :
L'outil de définition des indicateurs développé par la Direction Interministérielle de la Transformation de l'État (DITP)
Explorer le DLI, diagramme logique des impacts proposé par la DITP
MOOC "Évaluation et étude d’impact" par Dr Rémy Bachelet, maître de cong-férence à Centrale Lille
Une méthode agile est une approche itérative et incrémentale pour développer une solution (logicielle généralement mais adaptable à tout livrable d'un projet) en s'appuyant sur l'intelligence collective, et répondant le plus efficacement possible aux besoins exprimés par les utilisateurs- usagers-citoyens.
Parmi les modes de gestion de projet, la méthode agile est celle plébiscitée car dans ses principes, on trouve celui qui guide son exécution : " Les utilisateurs ou leurs représentants et les développeurs doivent travailler ensemble quotidiennement tout au long du projet".
Il s'agit donc de placer l'usager-bénéficiaire cible (le citoyen in fine dans le cas de projets d'intérêt général) au cœur du projet, tout au long de son déroulé, quitte à opérer des changements dans les fonctionnalités, même tardivement dans l'avancée du projet, et d'exploiter ces modifications pour mieux répondre au besoin exprimé, pour "satisfaire le client (usager) en livrant rapidement et régulièrement des fonctionnalités à grande valeur ajoutée" (principe n°1 du "Manifeste pour le développement agile de solution").
Il existe plusieurs méthodes agiles sur lesquelles il est nécessaire de se former avant de l'appliquer. Parmi elles, on trouve :
Le Scrum qui est cadre de développement itératif de produits ou solution, de projets, complexes. C'est une méthode pour livrer "de manière productive et créative des produits de la plus grande valeur possible ». Scrum s'appuie sur le découpage d'un projet en "sprints" d'une durée de quelques heures à un mois. Chaque sprint débute par une estimation du besoin suivie d'une planification opérationnelle puis se termine par une démonstration de ce qui a été achevé. Le projet est ainsi découpé en "boîtes". Une des notion-clés est le “scénario utilisateur” : c'est une synthèse des spécificités de la tâche à réaliser ou de la fonctionnalité à développer.
Plus ancien et "base" de la méthode agile, le RAD (Rapid Application Development) débute par une formalisation des besoins exprimés ("cadrage"), une définition globale de l'architecture technique ("design") et une "construction" qui consiste en la réalisation à proprement parlé avec une validation immédiate et permanente via des tests (d'une application, d'une solution et pourquoi pas d'une donnée en cours de publication pour s'assurer de son utilisabilité) impliquant le porteur du besoin (l'utilisateur final) en mode itératif-incrémental-adaptatif.
Adaptation en continu et sécurité doivent aller de pair et l'un ne se fait pas au détriment de l'autre. Agilité et sécurité concourent au développement des projets où la gestion du risque numérique a été prise en compte. Un guide en ligne éditée par l'ANSSI permet de bien intégrer la sécurité informatique au projet agile. De même, la protection des données personnelles devra être prise en compte dans tout développement et donc by design, afin de respecter le Règlement Général sur la protection des Données Personnelles (RGPD).
Ressource :
"Synthèse des synergies entre écoconception, cybersécurité et protection des données" par la Mission Numérique Eco-Responsable
C'est dans cet esprit d'agilité qu'a été lancé beta.gouv. Il est possible de trouver ressources et accompagnement dans le cadre de ce programme d’incubation "qui aide les administrations publiques à construire des services numériques utiles, simples, faciles à utiliser et qui répondent vraiment aux besoins des gens."
Il existe d'autre modes de gestion de projet traditionnelle par cycle en V ou en cascade qui comporte plusieurs phases se déroulant linéairement. Il comporte un risque d’écart entre le besoin exprimé, traduit dans un cahier des charges fonctionnel (sans modification possible), et le besoin réel au moment de la "livraison".
Ressources :
MOOC "Gestion de projet agile avec scrum" par Dr Rémy Bachelet, maître de conférence à Centrale Lille
"Entrez dans le monde des méthodologies agiles" sur OpenClassRooms
MOOC Découvrez comment créer des services publics innovants par beta.gouv
En matière de conduite de projet d'innovation, le "design thinking", la pensée design, est une approche de l’innovation centrée sur l’humain qui peut nourrir la phase de conception comme d'exécution (voire de clôture) du projet.
C’est une méthode de conception globale, en vue de réaliser des services ou produits innovants en lien constant avec les besoins de l'usager.
Dans le cadre de l'Open Data, elle sert aussi bien le processus d'ouverture de la donnée ("comment faire en sorte que la donnée que j'ai ouverte soit utilisable simplement ?") que celui de sa valorisation ("de quelles données j'ai besoin pour développer le service qui répond aux attentes de ses bénéficiaires ?").
Il comporte 4 phases qui correspondent fortement à celles de la méthode agile Scrum et on voit le parallèle qui peut être opéré :
Identifier la problématique pour mieux définir le problème en s'immergeant dans le contexte de l'utilisateur-usager final ("être en empathie" avec ce dernier)
Rechercher des idées (idéation) par différents processus de créativité
Prototyper grâce à des brouillons, des maquettes, des schémas, toit processus qui aide à la visualisation, la compréhension de la solution… pour recevoir un premier retour de l'usager-bénéficiaire
Tester les solutions pour les affiner tout en en apprenant encore davantage sur les utilisateurs finaux et implémenter avec l'enjeu d'une amélioration en continu
Pour en savoir plus sur cette démarche, un document fait référence, il s'agit de "La boîte à outils Design Thinking de la d.school de Stanford" (en français).
Le.a chef.fe de projet doit mener régulièrement un exercice de présentation de son projet, que ce soit dans le cadre de l'initialisation pour obtenir l'aval des élus, décideurs comme l'adhésion de l'équipe projet au moment de sa constitution ou encore bien entendu obtenir des financements (de sa propre structure, de partenaires potentiel) ou encore dans le cadre d'appels à projets ou de différents challenges (trophées de l'innovation, etc).
Il s'agit de mettre en récit son projet par la construction et mise en œuvre de pitchs qui devront être adaptés à chaque défis rencontrés (cible, contexte, besoins des auditeurs métiers par exemple).
Parmi les ressources recommandées :
Intervention de Stéphane Schultz (Agence d'innivation 15marches.fr) à Rennes : "Pitch & Love (mon weekend en Startupie)"
"How to pitch" et "L'art du pitch" par l'agence NOD-A - Makestorming
La conduite de projet se doit d'intégrer les grands enjeux de société et d'être porteuse d'inclusion et d'impact positif sur le cadre de vie.
Pour mener à bien un projet d'innovation, il est essentiel de prendre en compte :
L'accessibilité : pour faciliter la mise en accessibilité des sites et services numériques, la direction interministérielle du numérique(DINUM) édite le Référentiel Général d’Amélioration de l’Accessibilité(RGAA) constitué de 2 parties que sont les obligations légales et la méthode d'implémentation
L'éco-conception grâce au Référentiel général d'écoconception de services numériques (RGESN)
L'impact environnemental de l'ouverture des données, pour le maitriser en intégrant les bonnes pratiques dans le cadre de son projet d'ouverture : guide GreenData d'OpenDataFrance
Les enjeux de la transition par la donnée grâce aux ressources des programmes "Données et transitions" (OpenDataFrance), Green Data for Health, EcoSphères…
Le numérique comme facteur de transition et de dynamique territoriale avec le "Kit Agir Local - Le numérique au service des démarches environnementales de nos territoires" (FING - 2017)
L'inclusion numérique notamment dans la conduite du changement. Gérer un projet c'est veiller à inclure tous les acteurs de sa chaine de valeur, à toutes les étapes du projet comme à l'usage du ou des livrables. Pour bien intégrer tous les aspects de l'inclusion, la MedNum propose ressources et réseaux.
Les conseils ci-après sont ouverts à toute suggestion d'enrichissement et retours d'expérience via contact@opendatafrance.email et réseaux OpenDataFrance !
Si votre projet a pour objectif de créer un service numérique (au sein même d'une structure publique ou si vous êtes un.e citoyen.ne, un acteur privé) une des phases clés au-delà des développements, est d'accéder aux données qui vont permettre à ce service de délivrer les fonctionnalités attendues.
De manière générale, il s'agit d'identifier (de quelles données ai-je besoin ?), de rechercher (est-ce que parmi ces données, certaines sont ouvertes ou pourraient être rendues accessibles ?), de créer des données (lorsqu'il est certain que l'accès est impossible, qu'elles ne sont générées par aucun producteur public ou privé). N'est pas abordée dans ce point méthodologique la question des données personnelles qui pourrait être exploitées par un service numérique et qui doit faire l'objet d'une démarche ad hoc, exigeante et encadrée par le RGPD).
Pour mener à bien le projet de mise en œuvre d'un nouveau service numérique, Il faut donc en garantir l'alimentation :
en données jugées nécessaires à son développement,
en donnée dont la qualité est suffisante pour répondre aux exigences de fiabilité du service,
en données dont la production, actualisation, qualité, diffusion, accès sont pérennes pour assurer la permanence du service (sa continuité s'il s'agit d'un service public numérique)
en données accessible via des API pour mettre en œuvre un flux direct et plus efficient pour la sécurisation du service
en données locales (dans la phase de test) dont on s'assure qu'elles sont également disponibles sur un périmètre géographique plus large (phase de montée à l'échelle du service dans un objectif de déploiement national et/ou international) et selon un standard ou schéma reconnu, adopté, si possible (le jeu de données peut être accessible mais structuré différemment ce qui oblige à un "nettoyage" et à une remodélisation de la donnée pour qu'elle puisse être intégrée au service déjà développé).
Il existe de nombreux usages de la donnée qui permettent de s'inspirer des méthodes d'appréhension de la donnée, ils sont décrits dans les espaces dédiés aux utilisations des données ouvertes sur la plateforme nationale data.gouv et sur le site OpenDataFrance.
Pour accéder aux données nécessaires au service numérique à venir, il est nécessaire d'avoir une double approche : thématique et géographique, et d'appliquer la formule définissant le développement durable : "Penser global, agir local". Enfin, on jugera de la qualité de la donnée rendue accessible.
Plutôt que penser "données", il est conseillé de découvrir les acteurs en lien avec les thématiques qui sont celles de votre service numérique. Ils seront précieux dans la fourniture de données mais également comme potentiels partenaires ou sponsors de votre projet, voire même à l'origine d'évolution de vos objectifs par de nouvelles idées émergentes à leurs contacts. Par exemple, vous imaginez une application qui alerte les personnes, selon les allergies dont elles souffrent, de la présence des allergènes qui les concernent. Il est utile de dresser, sous forme de séance de créativité collective, une liste, ou plus efficace, une carte mentale (dénommée également "des idées", heuristique) globale des acteurs de cette thématique (pour la santé on imaginera de prime abord le Ministère de la Santé, l'Agence Régionale de Santé, le Département pour ses compétences sociales, les médecins, les pharmaciens, les hôpitaux, les départements, etc et pour les allergies, on pourra penser au Réseau National de Surveillance Aérobiologique, aux allergologues, au Ministère de la transition écologique et de la cohésion des territoires, au réseau des associations agréées de surveillance de la qualité de l'air, etc)
Cette recherche permet de se familiariser avec la sémantique des domaines explorés : une acquisition des termes usuels des sujets que vous allez traités via votre servuce numérique, permet le dialogue avec les experts que vous allez solliciter et d'affiner ainsi votre demande de données
Après cet exercice, il s'agit d'établir une priorisation des acteurs qui vous semblent les plus pertinents comme producteurs des données attendues, vérifier s'ils disposent ou non d'une plateforme de données.
Sur la recherche de données,
La démarche initiale est de consulter la plateforme nationale https://www.data.gouv.fr/fr/ pour savoir si les acteurs que vous avez identifiés ont publié des données via cette infrastructure de référence. Data.gouv.fr est aussi le socle du service public de la donnée avec des jeux de référence et de grande utilité et qualité, généralement essentielles pour tout service numérique (la Base Adresse Nationale par exemple)
Une recherche classique sur cette même plateforme sera réalisée sur les domaines des données attendues (la basique recherche du terme "allergie" renvoie à plus de 40 jeux de données)
Des plateformes et des écosystèmes propres à la donnée sont opérés également par les différents services de l'État qui peuvent apporter une vision des données disponibles par grands domaines : Recherche.data.gouv, Green Data For Health, EcoSphères (à venir)…
Pour élargir encore le champ d'appréhension du potentiel de données, une recherche thématique peut être faire sur https://data.europa.eu/fr (pour "allergie", on a plus de 3000 jeux de données dont la qualité est évidemment assez inégale), ce qui ouvre le champ d'investigation
Sur l'accès concret aux données,
Enfin, une fois cette vision globale de la cartographie des acteurs et des données opérées, il est nécessaire de sélectionner quelques producteurs clés qu'il est utile de contacter :
pour vous aider dans votre recherche (ne pas hésiter à solliciter une aide notamment auprès des acteurs publics)
pour vous donner les liens directs vers des données ouvertes qui vous sont nécessaires et qu'on ne trouve pas (encore) forcément facilement,
pour étudier l'ouverture de données dont vous avez besoin, ce qui peut être vécu comme une opportunité par un acteur public ou privé contrairement aux idées reçues pour la mise en visibilité des compétences de ces producteurs qu'elle permet, mais aussi pour repérer les processus de création de valeur permis par ces données et auxquels ces producteurs n'auraient pas forcément pensé.
Il existe également un inventaire des organisations et de leur plateforme de données actualisée en continu par OpenDataFrance ou une cartographie des portails opérés par OpenDataSoft https://opendatainception.io
Ils sont les premiers alliés du.de la créateur.trice de service numérique par la valorisation des données ouvertes qu'il.elle rend tangible : les collectivités territoriales, les établissements publics, les syndicats ou opérateurs locaux traitant du numérique, les services de l'État en local… Il est conseillé également de contacter les acteurs du secteur privé (entreprises, association…) qui peuvent vous apporter un soutien et vous donner accès potentiellement aux données dont vous avez besoin (un cadre contractuel est généralement mais pas systématiquement proposé pour obtenir un accès).
En développant votre service sur un périmètre géographique restreint vous pouvez entamer un test dans un cadre maitrisé pour le monter à l'échelle dans un second temps (périmètre géographique et/ou cible élargis) voire viser un lancement national en vous appuyant sur votre réseau initial pour élargir, et la cible de votre service, et vos ambitions. Il est utile de :
Repérer sur votre territoire d'atterrissage (votre domicile, le lieu d'implantation de votre startup, entreprise, le périmètre de votre collectivité si vous êtes agent public, etc) et donc en proximité, les laboratoires d'innovation publics ou non qui pourraient accompagner votre projet (atelier de co-création, de co-identification de données) ou les agences ou structures d'accompagnement de entrepreneurs, du développement économique local, etc
En sollicitant les acteurs publics, vous leur permettez un retour sur les usages des données ouvertes et d'améliorer la qualité de ces données pour les rendre plus exploitables grâce au cas d'usage que vous leur soumettez
En rentrant en relation avec les écoles, enseignants, chercheur, monde académique plus généralement pour échanger,; comprendre des travaux qui pourraient alimenter en données ou en fonctionnalités votre projet et réciproquement, faire de votre projet un input pour des études, recherches, etc
Pour chaque donnée identifiée, on pourra avoir une première estimation de sa qualité en explorant les métadonnées pour connaitre les conditions de leur production, le producteur (et vérifier sa fiabilité), la fréquence d'actualisation… etc. La qualité d'une donnée se jud-ge en premier lieu par les métadonnées mises à disposition du réutilisateur potentiel.
La qualité de la donnée doit être analysée afin de décider si elle peut être intégrée au service et garantir sa fiabilité. On observera plusieurs critères qui caractérisent cette qualité de la donnée (data quality) :
Les métadonnées : "les données sur la donnée" doivent être accessibles et apportent des informations essentielles sur la fiabilité de la donnée. On évitera d'exploiter une donnée sans métadonnées. Il existe des normes pour ces métadonnées par exemple l'ISO 19115 (entre autres) pour les métadonnées propres à l'information géographique. Les métadonnées apportent un éclairage sur les sources de ce jeu de données, qui les produit et dans quel contexte, comment, quel niveau d'exactitude (une marge d'erreur peut être précisée), qui les diffuse…
La fréquence d'actualisation : il est nécessaire de connaître la fréquence de mise à jour (temps réel, mensuel, annuel, etc) voire l'engagement sur cette fréquence d'actualisation (souvent précisée dans les métadonnées) et une vérification régulière est nécessaire pour s'assurer de sa mise en œuvre
La complétude : difficile à juger quand on ne connait pas dans un premier temps le jeu de données, on s'assure que les attributs sont complétés de façon suffisante pour pouvoir être exploités
L’homogénéité : en lien avec la complétude, on peut vérifier si pour chaque item proposé, les attributs sont complétés de façon cohérente (parmi les contre-exemples, des dates apparaissant sous différents formats ou des adresses saisies mais pas de géolocalisation précise, etc),
La conformité : cela apparait comme une évidence et cependant il est toujours utile, lorsqu'un jeu de données est rendu accessible (partagé ponctuellement ou en open data) de vérifier s'il respecte bien toutes les obligations légales (par exemple le respect de toutes les obligations du RGPD dans le cas d'un jeu de données anonymisées constitué à partir de données initialement personnelles)
La normalisation : le respect d'un standard de données ou d'un schéma est gage de qualité du jeu de données. En favorisant l'interopérabilité des données on facilite évidemment l'usage de cette donnée. La normalisation est un catalyseur de scalabité pour un service numérique puisqu'on peut supposer qu'il sera possible de retrouver sur un autre territoire, voire au niveau national, international, ce même jeu de données publié sous cette même structure.
Enfin, l'expertise d'un.e ingénieur données, d'un.e data scientist, d'un.e expert.e data, même ponctuellement si le budget du projet ne permet pas de les intégrer à l'équipe, permettra de solidifier l'approche de la donnée et est une garantie pour la réussite de votre projet de service numérique.
Créer un service numérique est un projet collaboratif par excellence qui peut se traduire par l'ouverture de nouvelles données (celles qui vous étaient nécessaires) ou d'amélioration de la qualité des données déjà accessibles, c'est aussi une opportunité d'établir des dialogues entre structures sollicitées au travers du projet, de replacer le.a citoyen.ne au coeur du numérique. Créer un service numérique est donc facteur de création de valeur autant économique que sociale et environnementale.
Source : OpenDataFrance - Licence : CC-BY-SA
Version : v2.0, date : juillet 2022
Il n’y a pas une feuille de route unique pour engager une démarche d’ouverture de données au sein d’une collectivité ou d’une organisation. Les cheminements suivis ne sont jamais identiques et dépendront du contexte : organisation, forces en présence, stratégie institutionnelle...
Une constante incontournable reste l'engagement des politiques et des décideurs dans le processus. En ce sens, si la loi pour une République numérique introduit l’ouverture “par défaut” des données administratives déjà disponibles au format électronique, une délibération de principe prise par l’instance délibérante semble indispensable pour acter la démarche.
Les grandes étapes sont ensuite de déterminer la gouvernance de cette politique d'ouverture en répondant aux questions : quoi (inventaire des données et choix d'ouverture), qui (instances stratégiques et opérationnelles), où (sur quelle plate-forme de données, en privilégiant les démarches de mutualisation) et comment (licence retenue, fréquence de mise à jour…).
Avant toute démarche il apparaît incontournable de consulter les élus, les décideurs, les directions et services et éventuellement la société civile (représentants, réutilisateurs potentiels…). Cela afin de lister les attentes de l’institution dont découle une éventuelle stratégie open data. Cette phase reste consultative. Elle gagne à être animée avec des techniques issues de l'intelligence collective.
Au sein de l’organisation, il sera également nécessaire d'initier la démarche en mode projet (gouvernance, moyens, calendrier prévisionnel…). Notamment en nommant un élu référent (soutien et légitimité de la démarche), un chef de projet (facilitateur, animateur et communicant), un éventuel comité de pilotage (pour prendre les décisions et diffuser largement l'information au sein de la collectivité) et des éventuels référents par direction ou service (pour décentraliser la démarche et impliquer les métiers).
Il est également important de s’entourer de différentes compétences au sein de la culture des données : CIL/DPO, PRADA, informaticien, géographe, documentaliste, archiviste. Ils constituent des atouts incontournables à ce type de projet, apportant chacun des expertises dans la chaîne de valeurs.
Selon la nature du projet, d'autres expertises peuvent être sollicitées : conduite au changement, animation et concertation, communication et éditorialisation, datavisualisation...
Présenter pourquoi la collectivité engage une démarche d’ouverture de données, préciser son ambition première (Transparence de l’action publique ? Innovation ? Développement économique ? Bien vivre ensemble ?...), spécifier la plateforme de données retenue pour la publication, présenter son organisation en mode projet, préciser la/les licences retenues…
Définir le périmètre des données publiques à ouvrir pour la première mise en ligne. Un simple tableur permet de recenser les jeux de données identifiés comme "ouvrables". On s'attachera à décrire chaque jeu de données aussi précisément que possible, en produisant les métadonnées associées : titre, descriptif, propriétaire, date de création, date de mise à jour, format, licence choisie, contact référent, contient un (ou plusieurs) risque juridique (des données à caractère personnel, des secrets, touche à la sécurité informatique…), remarques...
Pour identifier les premiers jeux de données la collectivité pourra s'intéresser aux données de référence, aux données associées à ses compétences, au Socle Commun des Données Locales, aux recommandations d'Opendata France et surtout au dialogue avec les directions et services pour recenser l'existant.
Pour être compréhensibles et utiles à tous, les producteurs de données vont opérer plus ou moins d’interventions sur les données : les rendre intelligibles pour des personnes extérieurs, supprimer les doublons, s’approcher des standards de publication, géolocaliser les données, anonymiser éventuellement le fichier, documenter les données...
OpenDataFrance propose des outils de validation des données comme Validata.
Une fois recensés, les jeux de données peuvent être publiés directement sur le site web de la collectivité avec le répertoire des documents administratifs (dont le catalogue des données publiées). La publication sur une plate-forme de données permet une gestion plus fine pour la production de données (gestion des versions, du téléchargement, des statistiques, mise en place d’API...). Cette forme de publication apporte aussi des fonctionnalités avancées pour les réutilisateurs (géolocalisation, recherche par métadonnées, déclaration des usages, datavisualisations). L’objectif d’une plate-forme est de développer la visibilité et d’éditorialiser les données publiées.
Il est important, dans cette phase, d'avoir une démarche centrée "réutilisateurs" afin de mettre à disposition les fonctionnalités pertinentes pour favoriser la réutilisation des données. Cela passe notamment par de l'éditorialisation, des vues ou métadonnées sur le contenu, des facilités de téléchargement, la mise en place d'API, voire des Datavisualisations.
A minima, la collectivité devrait recenser systématiquement ses données sur http://www.data.gouv.fr/fr/ ou sur une plate-forme locale.
L’animation et la médiation aux données doit constituer un axe fort de la démarche. La constitution et l’animation d’une communauté de réutilisateurs existants et potentiels, internes (les directions métiers) et externes, reste l’un des meilleurs moyen pour développer les usages. Il convient d’acculturer les agents, les citoyens, les associations et les entreprises aux données. Cet axe de la démarche participe très directement à la transformation numérique du territoire concerné.
Le Laboratoire de la valorisation des données publiques en Occitanie, OpenDataLab, propose un test d’une liste de 48 prérequis pour se lancer dans une démarche d’ouverture des données (http://www.opendatalab.fr/images/Tableurs/Check-list-prerequis-V1.xlsx)
OpenDataLab propose une variante de six étapes pour initier une démarche d’ouverture des données :
Quelques conseils pour rédiger une fiche métadonnée associée au jeu de données et la tenir à jour.
Source : OpenDataFrance - Licence : CC-BY-SA
Version : v2.0, date : juillet 2022
Les métadonnées sont de l’information structurée qui décrit, explique, localise ou facilite l’obtention, l’utilisation ou la gestion d’une ressource d’information.
Les métadonnées fournissent des informations permettant de comprendre des données. Par exemple, dans les achats de tous les jours, une étiquette fournit des informations sur un produit (composition, origine, date limite de consommation), c’est une métadonnée. Les métadonnées sont des “données sur les données”. Ce sont plus précisement une description normalisée du contenu des jeux de données publiées, c’est donc un élément essentiel dans le processus de publication des données.
Il est important de s’appuyer sur des formats de métadonnées reconnus pour s’assurer de leur pertinence (les données nécessaires) et de leur format (la façon dont on les a structuré et codifié). Les métadonnées ainsi homogénéisées permettent le fonctionnement des plateformes d’échange de métadonnées, qui peuvent à leur tour réduire les barrières d'accès aux ressources, conduisant à une meilleure visibilité, et donc augmentent leur potentiel de réutilisation. Dans de nombreux cas, c’est le portail qui héberge les données qui propose un format pour les métadonnées. Ceux-ci sont généralement en conformité avec les standards internationaux.
Il est important de s’appuyer sur des standards internationaux pour rendre les métadonnées cohérentes et exploitables. Il en existe de nombreuses (c’est un défaut...) mais elles ont des points communs et sont assez structurantes :
Normes et spécifications à usage général : ● Dublin Core pour les documents publiés (textes, images), http://dublincore.org/documents/dcmi-terms
Norme spécifique pour les ensembles de données : ● Vocabulaire pour les Catalogue de Données DCAT, http://www.w3.org/TR/vocab-dcat/
Usage spécifique de DCAT et d’autres vocabulaires pour soutenir l'interopérabilité des portails de données à travers l'Europe: ● Profil applicatif DCAT pour les portails de données en Europe, http://joinup.ec.europa.eu/asset/dcat_application_profile/description
Dans le cadre du projet OpenDataLocale, la norme DCAT, la plus courante et adaptée à l’open data, a été utilisée et légèrement simplifiée pour un usage courant. Le contenu et le format de métadonnées est décrit dans la spécification du jeu de donnée CATALOGUE du Socle Commun des Données Locales.
Les données d'un catalogue sont essentiellement :
Titre du jeu de données
Description libre de l'objet et du contenu de la donnée
Thème du jeu de données
Nom de la structure qui diffuse la donnée
Nom de la structure qui crée produit la donnée
Nom de la structure qui gère la donnée
Couverture spatiale sur lequel s'appliquent les données
Début/Fin de la Plage temporelle couverte par les données
Fin de la Plage temporelle couverte par les données
Date de la première publication
Fréquence de la mise à jour
Date de la dernière mise à jour publiée
Mots-clés permettant des recherches libres
Licence appliquée sur le jeu de données
Liste des formats dans lesquels sont publiées les données
Code de la projection géographique quand cela s’applique
Langue du jeu de données
Liens vers les ressources accessibles
Les thèmes peuvent être choisis et codifiés librement par les collectivités (voirie, transport, ...). Il est cependant souhaitable de les normaliser pour faciliter des recherches croisées et des sélections dans les gisements de données publiées au niveau national. Un projet de normalisation des thèmes est en cours d’élaboration. Il est recommandé de l’appliquer.
Ce champ permet de désigner le service ou l’organisme qui produit la donnée.
Ce champ permet d’attribuer des tags (ou mots-clés) pour faciliter la recherche des données. Les mots-clés sont totalement libres pour les collectivités. (par ex : “jardins”, “points d’eau”, “mobilité”).
C’est une donnée indispensable qui attribue une licence à un jeu de données. La pratique d’attribution d’une licence à un portail est abusive, même si elle permet de simplifier les déclarations des licences de chaque jeu de données qui héritent ainsi de la licence indiqué sur le portail. Les Licences décrivent le droits et devoirs des Producteurs et des Réutilisateurs du jeu de données concerné.
En pratique, dans le cas des données publiées à titre gratuit, et en vertu du décret publié par l’état sur les licences homologuées, le choix se porte sur deux licences :
Licence Ouverte
ODBL (OpenDataBaseLicence)
Décret n° 2017-638 du 27 avril 2017 relatif aux licences de réutilisation à titre gratuit des informations publiques et aux modalités de leur homologation.
https://www.legifrance.gouv.fr/loda/id/JORFTEXT000034502557/
Un document produit dans le cadre d’OpenDataLocale présente les licences, leur portée et les avantages/inconvénients. Dans la majorité des cas, la Licence Ouverte, LO v2, répond très bien aux besoins des collectivités. L'usage d'ODBL doit être fait avec prudence en raison des restrictions qu'elle engendre.
Les métadonnées doivent être gérées pour assurer leur :
Disponibilité : les métadonnées doivent être stockées où elles peuvent être consultées et indexées afin de pouvoir être trouvées
Qualité : les métadonnées doivent être de qualité constante afin que les utilisateurs sachent qu'ils peuvent y faire confiance
Persistance : les métadonnées doivent être entretenues au fil du temps
Licence ouverte : les métadonnées devraient être disponibles sous une licence du domaine public pour permettre leur réutilisation
Le cycle de vie de métadonnées est plus grand que le cycle de vie des données :
Les métadonnées peuvent être créées avant que les données ne soient créées ou capturées, par exemple, pour informer sur les données qui seront disponibles dans le futur.
Les métadonnées doivent être conservées après que les données ont été supprimées, par exemple, pour informer sur les données qui ont été déclassées ou retirées.
La création de métadonnées peut être prise en charge par des processus (semi)automatiques :
Les propriétés de documents générées par des outils bureautiques, par exemple la date de création d’un document.
Informations spatiales et temporelles capturées par des caméras, des capteurs
Informations issues du processus de publication, par exemple l'emplacement de fichier ou l'URL.
Cependant, d'autres caractéristiques requièrent une intervention humaine :
L'objet de la ressource (par exemple un lien vers le vocabulaire d’un sujet)?
L'utilisation de la ressource (par exemple un lien vers une licence)?
L'information sur la ressource (par exemple un lien vers un site Web ou de la documentation qui décrit la ressource)?
Comment de l'information de qualité peut être incluse?
En fonction des exigences opérationnelles, les métadonnées peuvent être intégrées avec les données ou stockées séparément des données.
Intégrer les métadonnées dans les données (par ex. onglet d’un fichier tabulaire) facilite l'échange de données.
La séparation des métadonnées et des données avec des liens vers des fichiers de données correspondants rend la gestion plus facile. C’est le cas le plus courant que l’on retrouve dans la plupart des portails open data
La qualité et l'exhaustivité des métadonnées de description des données influent directement sur leur visibilité et leur réutilisation.
La précision des métadonnées : est-ce que les caractéristiques de la ressource suffisamment éditorialisées (par ex. indiquer le bon titre, une licence explicite)
L‘exhaustivité des métadonnées : est-ce que toutes les caractéristiques pertinentes de la ressource sont documentées ? (par ex. la fréquence de mise à jour permet de s’assurer de la fraicheur de la donnée)
La conformité des métadonnées aux normes acceptées : est ce que les métadonnées sont conformes à une norme spécifique de métadonnées ? (par ex. la description d’un ensemble de données doit être conforme à la normalisation du Socle Commun des Données Locales ou le référentiel international DCAT).
La cohérence et la provenance des métadonnées : sont-elles basées sur des sources fiables (en général le Producteur) ?
La capacité de traitement des métadonnées : les métadonnées sont-elles correctement lisibles par machine? (par ex. en rendant disponible les métadonnées en RDF et/ou XML, et non en texte libre).
Les grandes fonctionnalités d’un portail open data, les critères de sélection et diverses solutions disponibles
Source : OpenDataFrance - Licence : CC-BY-SA
Version : v2.0, date : juillet 2022
Lorsqu'une collectivité souhaite publier les données qu'elle possède, le choix de l'espace de publication est une étape importante. Les données publiées sont extraites des bases-métiers, nettoyées et formatées en vue de leur publication sous la forme de fichiers (le cas le plus général) ou d'interface applications (API ou WebService).
Deux services sont nécessaires : le stockage des données open data et le site de consultation des données publiées.
C'est surtout le site de consultation qui correspond à la terminologie "Portail open data". Le stockage des données est un point important, surtout sur les aspects de la Disponibilité, de la Performance et de la Sécurité, mais il n'est pas spécifique à l'open data (il s’agit d’un “entrepôt de données”).
Un portail open data est donc un espace de présentation des données publiques ouvertes avec les grandes fonctions suivantes :
recherche des jeux de données,
présentation détaillée des jeux de données,
accès aux données brutes open data, sous différents formats, y compris API,
présentation graphique des données quand cela est possible,
outils d'extraction ou de transfert des données,
dispositifs éditoriaux pour animer le projet open data.
Une liste de critères utiles pour choisir un portail open data a été établie.
Ces critères ne sont pas absolus : ils peuvent être complétés ou amendés par chaque collectivité au regard de leurs objectifs et de leurs priorités.
Il existe plusieurs solutions techniques ou offres d’hébergement de portail en France, citons quelques exemples qui ne sont pas exhaustifs :
...
Les acteurs publics peuvent offrir des solutions d’hébergement (gratuites) pour les collectivités :
Les portails des collectivités :
Régions
Départements
Les Syndicats Mixtes (périmètre généralement départemental)
SICTIAM (06)
Les portails de métropole :
Il est bien entendu possible de faire réaliser un portail “à la demande” avec son service informatique ou un prestataire de service.
Les prix de mise en œuvre varient de 10 à 80 Keuro selon les fonctionnalités et le prestataire retenu. Les coûts de Maintenance doivent être pris en compte. Si l’application a un seul client (la collectivité qui a passé le marché), les coûts de maintenance et d’évolution ne seront pas mutualisés avec d’autres clients ce qui peut devenir un poste relativement important dans la durée.
Les prix de mise en œuvre et de maintenance sont connus assez précisément lors de la négociation. L’ensemble des coûts de développement et de maintenance sont mutualisés entre les différents clients, ce qui entraîne des coûts plus faibles pour chaque client. Normalement, cette optimisation devrait se retrouver dans le prix payé par les clients…
Les prix du marché sont assez variables, ils dépendent grandement des fonctionnalités retenues, des volumes, du trafic et de la négociation. Cela varie entre quelques Keuro et plusieurs dizaines de Keuro par an.
A voir avec les différents prestataires.
Dans le cas d’une offre d’hébergement des données par un acteur public de niveau supérieur (EPCI, Département ou Région) les coûts d’utilisation de la plateforme sont généralement nuls. C’est aussi le cas de l’hébergement sur le site de l’état data.gouv.fr
Dans le cas d’une offre mutualisée hébergée par un acteur public (ou privé), par exemple un Syndicat Mixte, un modèle économique peut être proposé, il est généralement beaucoup plus avantageux qu’une commande individuelle auprès d’un prestataire.
Données publiées par la collectivité
Réponses aux questions communément posées aux membres d’OpenData France à propos de la Licence OdBL.
Source : OpenDataFrance - Licence : CC-BY-SA
Version : v2.0, date : juillet 2022
Le concédant désigne la personne qui met à disposition la base de données initiale et cède les droits dont il dispose sur celle-ci. Par ailleurs, une plateforme de diffusion peut publier des données de plusieurs producteurs. De ce fait, le terme de « concédant » peut désigner tant le producteur de la base de données, que le diffuseur (voire les deux en présence de bases de données modifiées).
Cette licence ne se substitue pas aux dispositions législatives, elle peut donc être utilisée pour des bases de données qui contiendraient des données à caractère personnel, sous réserve du respect de ces dernières. Chaque réutilisateur est responsable au regard de l’usage et des finalités de ses traitements.
La licence ODbL est une licence internationale. Elle fait donc état de cas d’usage internationaux. Concernant la France, le régime de gratuité par défaut des données publiques est prévu par l’article L324.1 du code des relations entre le public et l’administration, nonobstant quelques cas d’exception encadrés par les articles R324-4-1 et suivants du même code. C’est donc l’article 3.2 alinéa c) qui s’applique.
Non. Si je suis une personne publique, je ne peux pas faire payer cette distribution.
Oui. Si je ne suis pas une personne publique, alors l’ODbL n’empêche en aucun cas leur commercialisation, néanmoins celle-ci ne peut être directement liée à la revente de la base de données initiale ou de ses enrichissements. D’autres réutilisateurs pourront ultérieurement ré-utiliser et rediffuser la base de données sans contrepartie financière.
Lorsque vous réutilisez une base de données soumise à la licence ODbL, ou une partie de cette base, vous devez mentionner les noms des différents concédants (c’est-à-dire toutes les personnes ayant contribué à ladite base) ainsi que le fait que la base de donnée est soumise à la licence ODBL. Il est possible de créer une page web dédiée « mentions légales » ou « sources des données » référençant la liste des concédants avec les liens vers leurs portails open data. La source devra être mentionnée de la façon suivante : « [Nom de la base de données], [Producteur de la base de données], [date], sous licence ODbL. » (par exemple, « Éclairage public — Mairie de Paris, sous licence ODbL »).
Vous n’êtes obligé de redistribuer la base de données enrichie (base de données initiale à laquelle s’ajoutent vos propres données) qu’à partir du moment où vous en faites une réutilisation publique. C’est-à-dire que vous utilisez ces données dans un produit ou un service mis à disposition du public, ou encore que vous distribuez une Création produite grâce à cette base de données.
A contrario, dans le cas d’un usage privé (pour vous) ou privatif (pour un cercle restreint d’utilisateur sur lesquels vous détenez un pouvoir décisionnaire) vous n’avez pas d’obligation de repartage des données enrichies sous les mêmes conditions de licence.
Même s’il s’agit d’un usage interne, repartager vos données modifiées, dans la plupart des cas, est pour vous un investissement source d’efficacité et de pérennité. Vous vous donnez ainsi une chance de ne pas être obligé de corriger à nouveau vos données lorsque la base originale sera mise à jour. Abonder la qualité de la base de référence est une bonne pratique pour vous et tout votre écosystème.
Les données enrichies doivent être rendues disponibles à partir d’un lien ou d’une API facilement accessibles depuis le service proposé. Cette mise à disposition doit être immédiate et mise à jour à chaque nouvelle version de la base de données enrichie et au minimum avec la même périodicité que la base de données initiale. Elle doit être gratuite en cas de distribution en ligne ou à un coût raisonnable en cas de distribution physique.
La licence ODbL est souvent dite propageante ou contaminante ou encore « à réciprocité ». Elle s’applique et se généralise à l’ensemble de la base de données enrichie par une base de données soumise à la licence ODbL. Les mots « contamination » ou « propagation » et « viralité » sont communément utilisés pour expliquer les effets des licences de ce type. Il existe d’autres termes comme « héritage » plutôt que « viralité » et « généralisation » pour « contamination ». Néanmoins, nous resterons sur la notion la plus généralement utilisée de « partage dans les mêmes conditions. »
La licence doit être étendue aux bases de données dérivées. L’enjeu pour les collectivités est donc de savoir jusqu’où elles considèrent que la licence d’un jeu de données en ODbL peut raisonnablement s’étendre au reste de la base de données du réutilisateur. Il est ainsi précisé que pour les collectivités la clause de « partage dans les mêmes conditions » figurant à l’article 4.4 concerne les informations de même nature, de même granularité, de mêmes conditions temporelles et de même emprise géographique.
La thématique est notamment définie en fonction des méta-tags de la base de données. Cela ne concerne que les données qui sont, soit de même nature que les données existantes, soit intimement liées et qui, à ce titre, enrichissent la base de données initiale. Cette extension est subordonnée à deux conditions cumulatives :
identité de thème (notamment exprimée à travers les métadonnées c’est-à-dire les « mots clés » de la base de données),
et identité de secteur géographique de la base de données initiale.
Exemple 1 : Pour une base de données fictive sur les boulangeries d’une ville dont les mots-clés sont : pain, viennoiseries, pâtisserie, commerce de proximité.
L'utilisation de la base de données initiale des boulangeries entraine l’extension de l’ODbL à toutes les données relatives aux boulangeries (prix, horaires, etc.) présentes dans le service proposé par le réutilisateur pour les données relevant d’une « emprise géographique » équivalente. Il en va de même pour toute donnée se raccrochant aux mots-clés définissant la base de données publique mise à disposition.
Exemple 2 : Pour une base de données des emplacements des stations d’un service de vélos partagés sur le territoire d’une ville dont les mots-clés sont : vélo, station, borne, piste, mode doux, location.
L’utilisation des données de la base de données initiale des stations de vélos partagés entraîne le passage sous ODbL de toute données relatives à des services de vélo partagés sur le territoire concerné.
Cette obligation de réciprocité doit être vue comme un cadre minimal de diffusion des données : les données initialement non ODbL peuvent toujours parallèlement être « licenciées » sous d’autres termes par leur producteur originel.
Prenons pour exemple une base de données dérivée construite par le croisement d’une base de données A sous ODbL et d’une base de données B sous Licence Ouverte. L’extension de la licence est toujours descendante, c’est-à-dire qu’elle se fait depuis la base de données A vers la base de données dérivée. Elle ne s’étend pas à l’autre base de données utilisée.
Dans le cas où l’emprise géographique de la base de données A est plus petite que celle de la base de données B (soit territoire A < territoire B), seules les données de la base de données dérivée correspondant à l’emprise géographique de la base initiale A passent sous licence ODbL.
Cas concret : Les horaires de bus de l’opérateur de transport de Toulouse (Base de données A sous licence ODbL) sont croisés avec les horaires de bus interurbain publiés par le Conseil Départemental 31 (Base de données B)
Certains points de départ ou d’arrivée situés à Toulouse se superposent. Pour la base de données dérivée, seuls les horaires des bus circulant dans le périmètre de la base de données A passent en ODbL
En cas de litige, les tribunaux compétents et le droit applicable sont ceux du ressort dans lequel le concédant a son siège ou son domicile. C’est-à-dire que pour un concédant basé en France, une base de données sous licence ODbL est soumise au droit français.
Lorsqu’il s’agit d’une administration, la juridiction compétente est le tribunal administratif
Lorsqu’il s’agit d’une entreprise (personne morale) basée en France, la juridiction compétente est le tribunal de commerce.
Lorsqu’il s’agit d’un citoyen basé en France, la juridiction compétente est le tribunal d’instance.
Il n'est pas possible de changer la licence (article 4.8), sauf pour utiliser une version ultérieure ou compatible de la licence (article 4.4). En revanche, il faut distinguer les données du produit ou service utilisant ces données dans la mesure où le produit ou le service constitue une création produite.
Lorsque deux bases de données sont soumises à des termes contradictoires (par exemple si l’une impose le repartage du tout et l’autre l’interdit ; ou les deux imposant l’utilisation de leurs termes sur leurs uniques termes), il peut être impossible de les combiner si l’une au moins des licences ne contient pas une clause expresse de compatibilité au bénéfice de l’autre.
À cet égard, il est très important de lire chacune des licences et de veiller à les respecter toutes, au risque sinon d’engager votre responsabilité. La licence ODbL est par principe incompatible avec la majorité des autres licences à réciprocité (telle que la CC By-SA 4.0), sauf mention expresse du concédant, et totalement incompatible avec les licences qui ne sont pas conformes à la définition de l’Open Data. Elle est en revanche parfaitement compatible avec la Licence Ouverte (version 1 et 2).
Il est possible de comparer les jeux de données, mais vous ne pouvez pas mettre à jour de façon automatique vos données, à moins que vous ne placiez votre base de données sous licence ODbL.
Néanmoins, vous pouvez apporter des corrections ponctuelles manuellement sans être tenu de placer votre base de données sous la licence ODbL (tout en ne dépassant pas l’usage normal qui pourrait être fait de la base de données initiale).
Vous pouvez saisir Open Data France concernant la lecture de la licence ODbL qui en est faite par ses membres (collectivités) ou l’usage de certains jeux de données sous cette licence. Les membres d’Open Data France s’engagent à vous répondre pour vous aider dans vos réutilisations des données sous cette licence.
Votre nom : Votre mail : Le ou les jeu(x) de données concernés (préciser l’URL) Votre questionnement
à envoyer à contact@opendatafrance.email
Recueil des bonnes pratiques et rappel des standards
Source originale : FING, juin 2017, v1.1, Licence : Creative Commons 3.0 Attribution France.
Version : v2.0, OpenDataFrance - Licence : CC-BY-SA, date : juillet 2022
Le format CSV est le standard le plus simple et le plus répandu pour échanger des données numériques organisées en tableau. Que ce soit pour un projet open data ou pour tout autre projet d’échange de données, sa connaissance est primordiale. Pour réaliser un fichier de qualité, ce document propose 3 modes de lecture. ➔ Pour le lecteur averti
Aguerri aux données ? Ce simple encart devrait vous suffire.
Aguerri aux données ? Ce simple encart devrait vous suffire.
Un fichier CSV de qualité :
est encodé en UTF-8,
utilise CRLF pour chaque fin de ligne,
utilise la virgule comme délimiteur,
encapsule entre guillemets les champs dont le contenu possède une ou plusieurs virgules, par exemple : Jean,Martin,”lundi, mardi, jeudi”
possède un en-tête (la première ligne du fichier) où chaque champ est décrit par un libellé,
est validé par l’outil en ligne CSVLint : http://csvlint.io/,
est documenté.
Mise en oeuvre simple : un tableur, comme Excel ou LibreOffice, peut suffire à produire un fichier de qualité. Les éventuelles erreurs de syntaxe peuvent être traitées à la main à la suite du rapport de CSV Lint.
Aller plus loin et industrialiser : l’outil csvclean, du package csvkit, permet de nettoyer un fichier de manière automatique (y compris de très gros fichiers) : https://csvkit.readthedocs.io/ (il est détaillé en page 6)
➔ Pour le lecteur curieux
Le reste de ce document explique le pourquoi et le comment de la norme ainsi que les bonnes pratiques pour produire un CSV.
➔ Pour le lecteur néophyte mais pressé
En annexe (2 dernières pages), nous avons détaillé chaque étape pratique à partir des deux tableurs les plus répandus, Excel et LibreOffice Calc.
Le format CSV est le standard le plus simple et le plus répandu pour échanger des données numériques organisées en tableau. Il se présente sous une forme simple à interpréter par un logiciel ou toute autre forme de programme informatique. Mais il est également lisible par un humain car sa forme et sa syntaxe sont rudimentaires : il s’agit d’un fichier texte contenant des valeurs séparées par un caractère spécial — en anglais, CSV signifie Comma Separated Values soit littéralement “valeurs séparées par des virgules”. Voici comment se présente, dans un éditeur de texte, un fichier CSV simple :
Prénom,Nom,Age Marie,Durand,37 Bernard,Martin,29
Dans un tableur, ce fichier donnera le résultat suivant :
Si votre fichier est correctement produit, il sera lisible sans effort par des logiciels et/ou programmes informatiques usuels : tableurs, logiciels de statistique, logiciels de traitement de données spécialisés, etc. Autrement dit, si vous souhaitez partager correctement vos données, il est important de les publier sous forme d’un fichier CSV de bonne qualité.
La norme CSV
Du fait de sa simplicité, le format CSV est utilisé depuis des temps immémoriaux. À tel point qu’il était très utilisé bien avant sa normalisation, sous de nombreuses variantes (on parle de “dialectes”, ces derniers sont encore répandus). En octobre 2005, il est finalement spécifié à travers la RFC 4180 intitulée Common Format and MIME Type for Comma-Separated Values (CSV) Files (https://tools.ietf.org/html/rfc4180). À l’origine, la RFC 4180 n’avait pas la prétention de devenir un standard : cette dernière évoquait seulement le fait de décrire la forme de CSV la plus courante. Avec le temps, et pour gagner en interopérabilité, la RFC est cependant devenu le standard de facto. Les outils dédiés au CSV respectent souvent et de plus en plus la RFC : la suivre est donc un gage de meilleure réutilisabilité des données.
Son aspect rudimentaire fait du CSV un format très simple à réutiliser. Ce côté rudimentaire à d’autres conséquences pratiques : il ne mémorise pas les couleurs, les onglets, les cellules fusionnées, les tailles de caractère... Il n’est adapté qu’à des tableaux simples où tous les enregistrements, c’est-à-dire toutes les lignes, ont la même forme. C’est strictement un format de données qui ne peut pas accepter de mise en forme. Certains tableaux, pensés comme des documents autant que des données devront faire l’objet d’une préparation pour être exporté en CSV.
Dans votre tableur préféré, si vous pratiquez des mises en forme de votre fichier CSV, elles seront perdues au moment de l’enregistrement.
Il n’existe aucune norme pour nommer un fichier mais rappelons quelques points de bon sens :
un nom trop générique, comme “liste.csv”, risque d’entraîner des confusions
un nom trop long sera difficile à manipuler
un nom contenant des caractères spéciaux ou accentués risque de poser des problèmes d’interopérabilité
L’idéal est de vous fixer deux ou trois règles simples et de vous y tenir. Une bonne pratique consiste à composer ce nom avec une partie qui vous identifie (code INSEE ou SIREN). La présence d’une date peut aider. Par exemple : 34172_Geoloc_ArbresRemarquables_2014.csv renseigne sur le contenu sans avoir à ouvrir le fichier.
L’encodage d’un fichier c’est la norme utilisée pour coder chaque caractère par une suite de 0 et de 1 compréhensible par une machine. L’US-ASCII, l’ISO-Latin-1 et l’UTF-8 sont les plus répandus en France. L’encodage est le premier facteur de difficulté d’usage : il oblige les réutilisateurs à des opérations de conversion laborieuses ; certains outils ne comprennent pas certains encodages ; etc.
Au début de l’informatique le code dominant était l’ASCII américain. Mais ce dernier ne permettait pas d’encoder les caractères accentués des alphabets latins (français, allemand, etc.) et a fortiori les caractères extra-latins. Après de longues années passées à créer et utiliser des encodages “locaux” — comme l’ISO-Latin-1 spécifique au français —, l’encodage UTF-8 a été créé pour coder “l’ensemble des caractères du « répertoire universel de caractères codés »” (source Wikipédia, article UTF-8). Ce dernier est compatible avec l’ASCII et permet d’encoder tous les alphabets extra-latins, comme par exemple l’alphabet grec, le cyrillique, les alphabets japonais, chinois, arabe, hébreux, etc.
L’UTF-8 est en passe de devenir le standard de référence universel. En janvier 2017 le site W3Techs recense que 88,4% des sites web analysés utilisent l’UTF-8. Pour toutes ces raisons, un fichier CSV de qualité est donc encodé en UTF-8.
Un fichier CSV est constitué de lignes représentant chacune un enregistrement. Par exemple, le code suivant contient 3 enregistrements (la première ligne, l’en-tête, n’est pas comptée) :
“Prénom”,”Nom”,”Note” “Marie”,”Durand”,”13,4” “Bernard”,”Martin”,”12” “Célestin”,”Lampion”,”9”
Chaque ligne est séparée de la précédente par un ou plusieurs caractères invisibles : la fin de ligne. Les différents systèmes d’exploitation (Windows, Mac OS, Linux) utilisent cependant un code différent pour la fin de ligne. La norme préconise l’emploi de la combinaison [CR]+[LF] correspondant à l’usage standard sous Windows. De nos jours, la plupart des outils savent traiter des fichiers quelque soit leur caractère de fin de ligne. Ce n’est cependant pas le cas du programme “Notepad”, utilisé par défaut sous Windows pour ouvrir les fichiers .txt ou les fichiers .csv. L’usage de la combinaison [CR]+[LF] reste donc préférable dans tous les cas pour maximiser le potentiel de réutilisation des données.
Il existe de très nombreuses façons de faire. Une des plus simples consiste à utiliser un éditeur de texte. Les éditeurs suivants (logiciels libres, non limitatif) gèrent plutôt bien les caractères de fin de ligne et l’encodage :
Notepad++ (Windows) ; https://notepad-plus-plus.org/
Geany (Windows, Mac OSX, Linux) ; http://www.geany.org/
Atom (Windows, Mac OSX, Linux), en installant le plug-in adéquat ; https://atom.io/
Geany, en particulier, affiche l’encodage en bas de l’écran et possède un menu spécial pour changer l’encodage et les caractères de fin de ligne. Voici les étapes nécessaires :
Ouvrir le fichier concerné avec Geany.
Observer au bas de la fenêtre le “mode” de fins de ligne et le “codage” du fichier
Si le “mode” et le “codage” ne correspondent pas à “CRLF” et “UTF-8” :
Menu Document > Définir les fins de lignes > Convertir en CRLF (Windows)
Menu Document > Définir l’encodage > Unicode > Unicode (UTF-8)
Menu Fichier > Enregistrer. Et voilà !
Le séparateur, ou délimiteur, est le caractère qui permet à un programme de distinguer les cellules les unes des autres. Dans le cas suivant le séparateur est la virgule : Prénom,Nom,Note Marie,Durand,13,4 Bernard,Martin,12 Célestin,Lampion,9
Le séparateur est aussi fréquemment un point-virgule, une tabulation [⭾] ou le caractère | (dit barre verticale ou tube en français, ou “pipe” en anglais). Le délimiteur peut encore être n’importe quel caractère du moment qu’il permette de séparer les champs sans ambiguïté.
L’article Wikipedia est bien documenté et indique comment le produire selon les différents clavier : Barre verticale, https://fr.wikipedia.org/wiki/Barre_verticale
Cependant, la norme CSV désigne la virgule comme le caractère à utiliser.
Cet usage peut nous poser problème à nous autres français, car cette dernière est notamment utilisée comme séparateur décimal… Un “3,5” caché au milieu de nombres entiers pourra passer inaperçu et provoquera des erreurs de lecture. Pour autant de nombreux outils de traitement du format CSV attendent par défaut l’usage de la virgule. Le séparateur idéal reste donc la virgule mais il faut alors encapsuler chaque champ entre des guillemets (au moins ceux qui contiennent une virgule) :
“Prénom”,”Nom”,”Note” “Martin”,”Durand”,”13,4”
Pas de panique ! en utilisant un tableur comme Excel ou OpenOffice Calc, ces derniers réaliseront automatiquement l’encapsulation des champs entre guillemets.
La première ligne peut être utilisée pour nommer chaque colonne, on l’appelle alors l’en-tête (comme dans l’exemple ci-contre). Prénom,Nom,Date_naissance Marie,Durand,1972 Bernard,Martin,1978
L’en-tête n’est pas obligatoire mais il augmente sensiblement la qualité du jeu de données puisqu’il permet d’identifier chaque colonne et donc de lever d’éventuelles ambiguïtés. Il est plus approprié de nommer une colonne “Age” que de la désigner par “la quatrième colonne” cela permet au lecteur de comprendre rapidement le sens du champ concerné. De plus, au fur et à mesure de l’évolution du jeu de données, “la quatrième colonne” pourrait se trouver à une autre place. Bien nommer les colonnes rend le fichier et sa documentation plus compréhensibles et faciles à utiliser, comme le fait un index. Enfin, ce procédé est très facile à mettre en oeuvre. Il est dommage de s’en priver !
Il est très difficile de contrôler à la main des centaines de lignes d’un fichier CSV. Une erreur, quelle qu’elle soit, a pu se glisser dans les étapes successives de production des données. Un contrôle syntaxique automatique doit permettre de garantir qu’un fichier pourra être exploité par n’importe quel outil, logiciel ou programme informatique.
Pour ce faire, nous présentons ici CSV Lint, solution simple à mettre en oeuvre. Nous proposons également plus bas une autre solution pour les utilisateurs avancés, csvclean.
CSV Lint CSV Lint est un service en ligne — hélas anglophone — qui établit un rapport signalant les problèmes élémentaires de votre jeu de données (encodage, délimiteur, syntaxe, etc.). Son usage est relativement simple. Il suffit de téléverser (uploader) le fichier CSV désiré et lancer la validation : l’outil affiche alors un rapport d’analyse complet signalant tous les problèmes identifiés (voir copie d’écran ci-dessous).
csvclean est un outil pour utilisateurs avancés qui savent manier la ligne de commande. Il est plus frustre à utiliser mais permet de traiter des fichiers de TRÈS grande taille (testé avec succès sur le CSV de la base SIRENE de plus de 8 Go !). Le logiciel fonctionne sous Windows, Mac OS X et Unix/Linux. Nous renvoyons à la documentation de l’outil pour son installation : https://csvkit.readthedocs.io
L’usage de csvclean est extrêmement simple. Pour contrôler le fichier :
$ csvclean fichier.csv --dry-run
Si nécessaire les options -e et -d spécifient l’encodage du fichier et le délimiteur :
$ csvclean -e iso-8859-1 -d ";" fichier.csv --dry-run
csvclean va au-delà du contrôle et permet de corriger le fichier :$ csvclean fichier.csv
À l’heure où nous écrivons ces lignes (14/02/2017), csvclean possède la fâcheuse “fonctionnalité” de convertir les fins de ligne en [LF] et non [CR]+[LF] comme le préconise la norme. Une fois le traitement de csvclean effectué, il faut donc convertir les fins de ligne, à l’aide de l’outil csvformat, issu du même “toolkit” :$ csvformat -M $'\r\n' fichier_out.csv > tmp && mv tmp fichier_out.csv
Sans documentation, un jeu de données quel qu’il soit, est très compliqué à utiliser. Les futurs utilisateurs ont besoin de comprendre ce qu’il contient, à quoi correspondent les différentes composantes du fichier, comment les données ont été collectées, etc. Document spécifique publié à part, il devrait idéalement contenir les rubriques suivantes :
Le titre du jeu de données.
La description du jeu : il s’agit de quelques paragraphes décrivant le jeu de données : son usage, son contexte et son mode de production, ses producteurs.
La fréquence de mise à jour des données.
La date de création du jeu.
La date de dernière mise à jour du jeu.
La couverture temporelle (ex. année 2014, période 2009-2016...).
La granularité de la couverture temporelle (tous les 2 ans, annuelle, trimestrielle…)
La granularité de la couverture territoriale.
La license appliquée au jeu de données.
La description de chaque champ du jeu de données :
le libellé du champ (le nom que vous avez retenu pour la colonne)
sa position (colonne 1 ou colonne 2 ou …)
sa description “sémantique” : que signifie-t-il ?
mais aussi sa syntaxe : sa longueur maximum, son type de contenu (chaîne de caractère ? nombre ? booléen ? date ?...), son format
Comme vous pourrez le constater dans l’exemple suivant, il est facile de bien documenter : http://www.hatvp.fr/consulter-les-declarations/#open-data
Ce document n’épuise pas ce sujet mais, nous l’espérons, vous aura permis de trouver les bases d’un fichier CSV de qualité. Pour un public averti, il est possible d’aller plus loin et de mettre en œuvre une solution très puissante de contrôle qualité et de documentation : le schéma de données. Il s’agit de décrire les données de telle manière qu’un outil de contrôle comme CSV Lint, sera capable de valider automatiquement, pour partie, la qualité des données. Cette technique fera l’objet d’une documentation ultérieure, mais pour les impatients vous pouvez consulter la norme Table Schema : http://specs.frictionlessdata.io/table-schema/
Nous vous recommandons d'aller consulter la page suivante sur les recommandations pour favoriser l'interopérabilité des données
Nous avons utilisé Excel 2016 pour rédiger ce court tutoriel.
J’ouvre avec Excel mon fichier à convertir
Je clique sur le menu “Fichier” en haut à gauche
J’ai une interface spécifique qui s’affiche, où je peux sélectionner “Enregistrer sous…” (colonne de gauche)
Dans la partie principale centrale haute de l’écran je peux alors sélectionner, à l’aide d’un menu déroulant, les différents formats de fichier dont “CSV UTF-8 (délimité par des virgules) (*.csv)”
Si je veux changer le fichier d’emplacement, je clique sur le menu “Parcourir” grâce auquel j’obtiens une nouvelle fenêtre dans laquelle je peux préciser l’emplacement, mais aussi le type que je sélectionne dans un menu déroulant comme précédemment : “CSV UTF-8 (délimité par des virgules) (*.csv)”
Une fois enregistré, je n’oublie pas de tester mon fichier avec CSV Lint, afin d’ajuster d’éventuels petits problèmes : http://csvlint.io
Mon fichier est prêt ! Je peux le publier avec sa documentation.
Nous avons utilisé LibreOffice 6.4 (2022) pour rédiger ce court tutoriel.
J’ouvre avec LibreOffice Calc (ou OpenOffice Calc) mon fichier à convertir
Je sélectionne le menu “Fichier > Enregistrer sous...”
Je sélectionne “[x] Éditer les paramètres du filtre” et “Texte CSV (.csv)” dans le menu déroulant des formats.
S’ouvre alors la boîte de dialogue suivante qui permet de choisir l’encodage et le séparateur : je choisi comme indiqué ci-dessous
Une fois enregistré, je n’oublie pas de tester mon fichier avec CSV Lint, afin d’ajuster d’éventuels petits problèmes : http://csvlint.io
Mon fichier est prêt ! Je peux le publier avec sa documentation.
Parmi toutes les données qui sont éligibles à la publication, ce document fournit des indications sur les données que les collectivités doivent publier en priorité.
Source : OpenDataFrance - Licence : CC-BY-SA
Version : v2.0, date : juillet 2022
Les données publiables
La Loi pour une République Numérique rend obligatoire la publication par défaut de toutes les données d’intérêt économique, social, sanitaire ou environnemental, qui ne sont pas protégées (données à caractère personnel, relevant d’un secret commercial ou pouvant mettre en danger la sécurité publique).
Selon les compétences détenues par la collectivité, cela représente de très nombreuses données. Face à cette volumétrie, il est utile de se concentrer sur quelques jeux de données dont l’intérêt est prioritaire. OpenDataFrance a souhaité proposé un socle de données prioritaires pour aider au démarrage de la politique d'ouverture des données complémentaires aux données prioritaires définies par l'Etat par voie réglementaire.
Dans le cadre du projet OpenDataLocale, nous avons d’abord posé la question aux collectivités engagées de longue date dans l’open data. Quelles données ont été le plus demandées ? Quelles sont celles qui sont le plus consultées, téléchargées ? quelles sont celles qui ont donné lieu aux réutilisations les plus fréquentes ?
Nous avons ensuite proposé 3 critères pour évaluer la pertinence des données :
Politique : transparence, suivi des politiques publiques, exercice démocratique, ...
Service & Economique : quelles sont les données à priori les plus utiles pour améliorer les services publics, que ce soit la création de nouveaux services, l’enrichissement de l’offre publique ou l’optimisation de services existants.
Usage : accès à des informations publiques d’intérêt général (cartographie, statistique, description de l’espace public, ..)
Nous avons aussi évalué la disponibilité et la relative facilité d’accéder à ces informations. La répartition des compétence entre plusieurs administrations, ou plusieurs services, peut par exemple rendre assez complexe la collecte de certaines données. La délégation de compétences auprès d’acteurs privés peut engendrer aussi des freins, tout comme la nature des données et leur mode de production (données peu structurées, données temps réel, ...).
L’identification de quelques données prioritaires présente plusieurs avantages :
Identification des premières données publiées,
Normalisation du contenu (nature et format des données),
Mise à disposition d’outillage d’extraction et de publication,
Constitution d’une base de données commune à toutes les collectivités.
Les collectivités peuvent bien entendu publier d’autres données en fonction de ses possibilités ou de ses propres priorités (un chantier prioritaire mené par la collectivité sur un thème particulier et qui nécessite -ou facilite- la publication de données spécifiques).
Ces données sont décrites dans le Socle Commun des Données Locales. La nature des champs et leur format sont précisés.
En application de la loi pour une République Numérique, l’état a publié des décrets et arrêtés précisant le contenu de certains jeux de données qui sont considérés par l’état comme prioritaires pour constituer des référentiels nationaux.
Ces données ont été intégrées dans le Socle Commun des Données Locales. Elles contiennent essentiellement : l’acheteur qui passe le marché, l’identifiant du marché, la date de notification, le(s) titulaire(s), l’objet, le montant, la nature, le lieu d’exécution, la durée du marché, les modifications apportées éventuellement sur ces données.
Voici l’arrêté du 22 décembre 2022, publié par l’état : https://www.legifrance.gouv.fr/loda/id/LEGISCTA000046888834
Ces données ont été intégrées dans le Socle Commun des Données Locales. Elles contiennent essentiellement : l’autorité administrative qui attribue la subvention, la date de convention, le(s) bénéficiaire(s), l’objet, le montant, la nature, les dates et conditions de versement.
Voici le décret du 5 mai 2017, publié par l’état (NOR: PRMJ1636989D) : https://www.legifrance.gouv.fr/affichTexte.do;jsessionid=A040DBC18F687F722994ADFF5D7779BE.tplgfr23s_1?cidTexte=JORFTEXT000034600552&dateTexte=20170507
Publication des documents d’urbanisme selon les formats en cours d’établissement par e CNIG et ayant vocation à être publier sur le site Géoportail de l’urbanisme (https://www.geoportail-urbanisme.gouv.fr/a-propos/)
Voici l’ordonnance publiée par l’état (NOR: ETLX1327949R) https://www.legifrance.gouv.fr/affichTexte.do;jsessionid=?cidTexte=JORFTEXT000028346965&dateTexte=&oldAction=dernierJO&categorieLien=id
Spécifications CNIG : http://cnig.gouv.fr/wp-content/uploads/2018/01/180103_Standard_CNIG_PLU_v2017.pdf
Base nationale des vitesse maximales autorisées en vigueur sur leurs réseaux routiers (applicable à partir du 1 janvier 2018).
Voici l’article 22 de la loi République numérique (NOR: ECFI1524250L) : https://www.legifrance.gouv.fr/affichTexteArticle.do;jsessionid=ADD739D9B5694F535C625565B285AFC0.tpdila14v_2?idArticle=JORFARTI000033203075&cidTexte=JORFTEXT000033202746&dateTexte=29990101&categorieLien=id
Cette fiche aide à savoir ce qu’il est possible de publier ou de ne pas publier en open data lorsque les données contiennent des informations à caractère personnel
Source : OpenDataFrance - Licence : CC-BY-SA
Version : v2.0, date : juillet 2022
L’open data ne concerne pas initialement les données à caractère personnel (voir cette notion dans le glossaire en annexe). En effet, la majorité des informations du secteur public mises à disposition des internautes ne comportent aucune donnée à caractère personnel. Cependant, le champ de l’open data s’élargit. Par exemple depuis la Loi pour une République Numérique, il concerne des domaines tels que les décisions de justice, les données sanitaires, des données en matière de tourisme, d’énergie ou d’immobilier, ainsi que plus classiquement, celui des élus et des organigrammes de l’administration… De ce fait, un nombre croissant de données à caractère personnel sont susceptibles d’être concernées par les obligations en matière d’open data. L’essor sans précédent du numérique entraîne des possibilités croissantes de réidentification des personnes concernées par des données pourtant anonymisées. C’est pourquoi sur ce sujet, il faut régulièrement se référer aux mises à jour des recommandations de la CNIL.
Le développement de l’open data soulève donc la question de l’équilibre entre le droit d’accès à l’information publique, c’est-à-dire la transparence administrative, et la nécessaire protection des données à caractère personnel et de la vie privée. Ainsi, c’est le contexte dans lequel s’inscrit l’open data qui doit nous inciter à la vigilance : informatisation de la société, des administrations comme des acteurs privés ; diffusion spontanée de données personnelles par les internautes ; indexation de données nominatives par de puissants moteurs de recherche ; développement du Big Data...
Pour la CNIL, les objectifs parfaitement légitimes poursuivis par la politique d’ouverture des données publiques sont pleinement conciliables avec la protection des personnes et de leur vie privée. Plus encore, la prise en compte de cet impératif permettra de favoriser la confiance des différentes parties prenantes de ce mouvement (autorités publiques, citoyens, entreprises), qui constitue une condition essentielle de la réussite de toute politique publique. Pour ce faire, un cadre juridique existe depuis la fin des années 70 visant précisément à articuler les objectifs de transparence administrative et de protection des données personnelles. Ce cadre juridique a été renouvelé par la loi pour une République numérique et le RGPD. Ainsi, la loi pour une République numérique a, entre autres, renforcé les missions de la CADA et de la CNIL. La CNIL a par ailleurs été dotée d’un pouvoir de certification et d’homologation de processus d’anonymisation (voir cette notion dans le glossaire en annexe) des données. Elle publie régulièrement des packs de conformité pour accompagner au mieux les acteurs à protéger les données à caractère personnel ; dans ce cadre, elle a d’ailleurs annoncé la publication conjointement avec la CADA d’un pack open data. Ainsi, si la CNIL est le guichet unique pour toutes les plaintes des personnes estimant qu’il y a une atteinte à leurs droits en matière de protection des données à caractère personnel, la CADA demeure compétente pour répondre à des demandes d’accès portant sur des bases de données comprenant, par exemple des données personnelles. Sur la base de leurs compétences respectives, les présidents de ces deux organismes peuvent conjointement choisir de réunir la CNIL et la CADA en un collège unique lorsqu’il est question de la protection des données à caractère personnel dans le cadre de l’open data. Ainsi, elles pourront être amenées à examiner ensemble des demandes d’accès aux données.
Dés que vous travaillez sur des données à caractère personnel, vous devez vous assurer que vous êtes habilités pour traiter de telles données. En cas de doutes, demandez à votre Délégué à la Protection des Données. Vous devez vérifier que le fichier contenant des données caractère personnel est référencé dans le répertoire idoine et prendre connaissance du niveau de risque(s) associé(s) à ce fichier. Vous devez aussi appliquer précisément les dispositions préconisées pour la protection de ces données.
Les acteurs publics de plus de 3500 habitants et de plus de 50 agents qui ont des documents produits ou reçus dans le cadre d’une mission de service public et sous format électronique, doivent mettre en ligne, dans un format ouvert et réutilisable, les bases de données et les données régulièrement mises à jour, qui présentent un intérêt économique, social, sanitaire ou environnemental.
.
Pour les principaux documents produits et détenus par les administrations, contenant des informations publiques et figurant dans le répertoire des documents administratifs, ces dispositions sont effectives dès le 7 octobre 2017, soit un an après la promulgation de la Loi pour une République numérique). Pour les autres documents cela s’applique au plus tard le 7 octobre 2018.
La loi prévoit que les demandeurs peuvent solliciter, afin d’accéder à un document administratif, la publication en ligne de ce dernier. Cette diffusion publique doit être faite dans un standard ouvert, aisément réutilisable et exploitable par un système de traitement automatisé (en format .csv pour un tableur par exemple). Les documents communiqués par l’administration à la suite d’une demande doivent être mis en ligne ainsi que leurs versions mises à jour. Tout document communicable (à tous) est publiable sur Internet. Les documents comportant des secrets, ou portant atteinte à la vie privée des personnes ou des données à caractère personnel (voir glossaire) ne peuvent en revanche pas être publiés sauf sous certaines conditions (voir plus bas).
Les documents diffusables peuvent faire l’objet d’une libre réutilisation, dès lors qu’ils ne comportent pas de données grevées par des droits de propriété intellectuelle de tiers. Ce point est facilité puisque toute communication ou publication - « se fait dans un standard ouvert, aisément réutilisable et exploitable par un système de traitement automatisé ».
Nous rappelons que le principe général retenu est qu’il y a une interdiction de diffusion de données à caractère personnel dans le cadre de l’open data. Il y trois conditions alternatives qui sont prévues pour permettre la publication de documents comportant des données à caractère personnel :
une disposition légale particulière,
le consentement explicite des personnes concernées (voir ci-dessous),
la mise en œuvre d’un traitement permettant de rendre impossible l’identification de ces personnes (anonymisation).
Un décret listant les exceptions à l’anonymisation a été publié le 12 décembre 2018. Il indique les données à caractère personnel en nécessitant pas l'anonymisation préalable des données.
Plus précisément, le consentement est une notion encadrée par les dispositions applicables aux données à caractère personnel. Il joue un rôle de plus en plus central avec l’adoption du RGPD. C’est pourquoi, il faut être particulièrement vigilant dans les conditions encadrant l’obtention du consentement. Il s’agit d’une démarche active de la personne. Il doit être :
explicite, spécifique, et éclairé,
de préférence de forme écrite,
produit librement par l’intéressé,
préalable à la collecte des données (bonne pratique).
Par exemple, dans un formulaire en ligne, le consentement peut se matérialiser, par une case à cocher. Elle doit, par défaut, être décochée. Les questions à se poser pour une publication en open data des données à caractère personnel :
La publication de la donnée à caractère personnel est-elle précisée par une loi ?
La diffusion est-elle totale ou réservée aux intéressés ?
De quand date la donnée à caractère personnel ?
Si la donnée à caractère personnel ne concerne pas la vie publique de la personne et que la donnée est récente, le consentement de publication de cette donnée est-il explicite de la part de la personne concernée ?
La personne est-elle vivante ?
Le réutilisateur des jeux de données ouverts contenant des données à caractère personnel devra respecter les dispositions de la Loi Informatique et Libertés, ainsi que les termes de la licence. En effet, dès que le réutilisateur clique pour télécharger un fichier contenant des données à caractère personnel, il devient au sens du RGPD, responsable de traitement (voir glossaire). Ainsi, il devra obtenir le consentement des personnes dont les données à caractère personnel sont réutilisées (voir ci-dessus pour les conditions de validité du consentement). Il ne peut bénéficier du consentement obtenu par la collectivité puisqu’il est spécifique au traitement réalisé en vue de communiquer ou de diffuser les données. En effet, la réutilisation des données constitue un nouveau traitement distinct du premier (le responsable n’est pas le même, les finalités sont différentes).
Une donnée à caractère personnel peut être transmise à la personne concernée. La règle veut que les documents administratifs contenant des informations à caractère personnel (voir glossaire) ne puissent être mis à disposition, ni réutilisables en l’état. Lorsque ces informations sont contenues dans des documents qui peuvent être publiés en open data tels que les délibérations, elles sont à anonymiser car cela fait partie de la vie privée de la personne. De tels documents peuvent être publiés soit :
après mise en œuvre d’un traitement permettant de rendre impossible l’identification de ces personnes (occultation, pseudonymisation, anonymisation…)
le consentement explicite de la personne concernée,
une disposition légale particulière (par exemple au delà d’un délai de 50 ans).
Quant au Règlement Général sur la Protection des Données, il donne aux citoyens plus de contrôle sur leurs informations privées. Cet important texte sur le sujet n’apporte pas de nouveaux éléments en matière d’ouverture des données.
Les données de décès sont des données d’état civil, les mêmes règles s’appliquent (voir paragraphe ci-dessus). En plus de la rédaction de l’acte de décès et de sa mention en marge de l’acte de naissance, le maire a la responsabilité de nombreuses transmissions d’informations concernant le décès d’une personne. Le maire est responsable du traitement des données d’état civil. « Les informations nominatives enregistrées aux fins d'inscription d'un acte sur le registre de l'état civil ne peuvent être utilisées par les élus municipaux à des fins de message de félicitations ou de condoléances, ou ne peuvent être publiées dans la presse, que dans la mesure où, au moment de l'établissement de l'acte, les personnes concernées ont donné leur accord à ce message personnalisé ou à cette publication. Les informations collectées pour ces seules fins ne peuvent être conservées ni alimenter un fichier permanent. »
Les données transmises par internet doivent être chiffrées et les expéditeurs et destinataires identifiés.
Au-delà de ces dispositions générales sur l’open data, il existe de nombreuses dispositions sectorielles permettant la mise à disposition, à des fins d’intérêt général, de données publiques particulières ou de données détenues par des opérateurs privés, ainsi que des dispositions visant à favoriser la circulation de ces données dans la société par l’obligation de les mettre à disposition dans des standards ouverts et réutilisables.
Afin de faciliter l’accès au droit tout en protégeant la vie privée des personnes concernées par ces décisions, les données de décisions de justices « sont mis(es) à la disposition du public à titre gratuit dans le respect de la vie privée des personnes concernées », toutefois cette mise à disposition « est précédée d’une analyse du risque de réidentification des personnes ».
La pseudonymisation (voir cette notion dans le glossaire en annexe) en amont de ces données par la puissance publique et le contrôle de la CNIL sur leur réutilisation, en particulier sur l’absence de réidentification des personnes et sur le caractère effectif et continu du respect des droits des personnes concernées (rectification et opposition notamment), permettra ainsi de maintenir le délicat équilibre entre accès au droit et protection de la vie privée. Le décret en Conseil d’Etat qui doit déterminer les conditions d’application de ces nouvelles obligations devra en effet déterminer les modalités d’analyse de risque de réidentification des personnes et la CNIL pourra ainsi apporter toute son expertise sur ce sujet, dans le cadre de son avis sur ce décret. Il existe une foisonnante littérature sur cette question comme par exemple :
Dans le domaine de l’immobilier, il est proposé une ouverture aux professionnels du secteur des données foncières détenues par l’administration fiscale.Pour ouvrir de telles données, il est recommandé de s’appuyer sur le pack de conformité logement social.
En cas de publication de données à caractère personnel non-conforme aux dispositions en matière d’open data (CRPA) et de protection des données à caractère personnel (Loi Informatique et Liberté) dans le cadre de la, la collectivité encourt des :
sanctions administratives auprès de la CNIL. Elles peuvent atteindre 3 millions d’euros. Les sanctions prévues par le règlement européen (RGPD) applicable à partir du 25 mai 2018 pourront aller jusqu’à 20 millions d'euros ou 4% du chiffre d’affaire mondial, si cela se justifie. La CNIL peut également prononcer des avertissements pouvant être rendus public ;
sanctions pénales qui peuvent aller de 1 500 euros à 300 000 euros d’amende et 5 ans d’emprisonnement en fonction du type de violation dont il est question (exemple : non-respect des finalités, absence d’information des personnes concernées).
En cas de réutilisation des informations publiques à des fins commerciales de manière non conforme à la licence ou aux prescriptions du code des relations du public et de l’administration, les montants sont désormais portés à :
un million d’euro, en cas de réutilisation illégale ou non conforme aux prescriptions contractuelles des informations publiques ;
deux millions d’euros, en cas de manquement réitéré.
Les montants sont différents lorsque les données sont utilisés à des fins non commerciales et peuvent atteindre 3 millions d’euros. Les sanctions prévues par le règlement européen applicable à partir du 25 mai 2018 pourront aller jusqu’à 20 millions d'euros ou 4% du chiffre d’affaire mondial, si cela se justifie. Par ailleurs, le réutilisateur peut également se voir appliquer des sanctions administratives prononcées par la CNIL (voir ci-dessus).
La loi pour une République numérique fait évoluer les missions de la CNIL et, elle peut désormais homologuer des méthodologies d’anonymisation. À ce titre, les administrations pourront soumettre à la CNIL des méthodologies d’anonymisation pour homologation/certification de la CNIL. Ces méthodologies préciseront le traitement d’anonymisation mis en œuvre en fonction de la nature des données. La CNIL a relevé que les administrations doivent avoir une « vigilance particulière » à l’égard de la condition d’anonymisation (voir glossaire) et doivent mettre en œuvre des moyens « significatifs » mais qui ne doivent pas entraîner des efforts disproportionnés pour les administrations.
La CNIL et la CADA rédigent actuellement un « pack de conformité » en collaboration avec la DINSIC pour accompagner les administrations dans l’ouverture des données publiques.
Il est donc nécessaire avant toute chose de déterminer la pertinence de l’anonymisation des données à publier : de quel type de diffusion des données s’agit-il ? Il s’agira aussi de se référer aux cadres législatifs nationaux et européens. De même, il faut cerner les enjeux de la publication des données au regard de leur type de diffusion. Par exemple, les fichiers MFR (Microdata File for Research purposes) sont réservés à la recherche scientifique et les fichiers PUF (Public Use File) sont accessibles par tous.
La deuxième étape porte sur la définition et la mesure des risques de divulgation et donc du choix de la ou des méthodes de protection des données en établissant tous les scénarios possibles: occultation, pseudonymisation...
La troisième étape concerne le choix des mesures de protection pour lesquels vous allez opter en fonction des critères fixés.
La quatrième et dernière étape porte sur la mise en œuvre et l’expertise du fichier qui a été produit en procédant à quatre étapes :
le choix d’un logiciel de protection,
la mesure des risques avec l’outil choisi,
la quantification de l’information perdue,
le contrôle du processus de protection et la réalisation d’un document synthétique sur les méthodes de protection avec un bilan de l’information perdue.
Au chapitre 3, Maxime B. présente les méthodes de protection des données, exemples à l’appui et par la résolution d’équations mathématiques.
Le triple filtre prévu (interdiction de publication de documents portant atteinte à la vie privée ; publication sous condition de documents comportant des données personnelles ; réutilisation de telles données dans le respect de la loi Informatique et Libertés) permet de garantir la protection des données des personnes concernées par les informations publiques.
L’étendue exacte des secrets protégés par la loi en matière de publication de données, les modalités de recueil du consentement des personnes concernées par celles-ci ou le caractère anonyme ou non des informations diffusées constituent des points d’interrogations récurrents de la part des différentes parties prenantes du mouvement de l’open data. Dans ce contexte, la CADA et la CNIL souhaitent améliorer l’accompagnement de ces acteurs en élaborant un « pack de conformité » dédié à l’ouverture des données publiques.
La présence des données à caractère personnel ne rend pas les documents communicables uniquement à l'intéressé. L'obligation d'open data par défaut persiste. Dans ce cadre l'anonymisation est présentée comme une étape préalable obligatoire à la diffusion sauf si elle engendre pour l’acteur public des efforts disproportionnés.
Les données publiées sur le portail data.gouv.fr peuvent facilement être présentées sur une page web, en particulier sur une des pages du site institutionnel d’une collectivité.
Source : OpenDataFrance - Licence : CC-BY-SA
Version : v2.0, date : juillet 2022
La plateforme « data.gouv.fr » offre plusieurs moyens plus ou moins avancés d’intégrer les données disponibles en open data sur vos propres sites :
de manière unitaire si vous souhaitez n’afficher qu’un ou quelques jeu(x) de données particulier(s) ;
de manière plus générale si vous souhaitez afficher tous les jeux de données relatifs à un territoire ou à une organisation ;
pour une gestion fine de l’habillage et des données affichées, nous vous recommandons l’API ;
pour avoir votre propre portail fondé sur le moteur de la plateforme.
Ces différents cas d’intégration correspondent généralement à différents profils :
un journaliste traitant d’une problématique donnée va être intéressé par l’inclusion de jeux de données directement au sein de son article ;
une mairie va être intéressée par l’intégration des jeux de données relatifs à son territoire sur son site internet ;
une association pourrait être intéressée par la création d’une page personnalisée compilée à partir de données issues de sources multiples ;
un pays se lançant dans l’open data va chercher à créer son propre portail.
Celles-ci ont été décrites initialement dans la documentation de data.gouv :
Chaque jeu de données est intégrable sur n’importe quelle page en ajoutant quelques lignes de HTML, deux versions existent :
ET En remplaçant l’IDENTIFIANT DU JEU DE DONNÉES par l’identifiant disponible sur sa page dédiée, dans l'onglet Métadonnées sous la rubrique ID :
La première version de code proposée est accessible directement depuis l'onglet Action du jeu de données souhaité. Il suffit de copier le code proposé dans la rubrique "INTÉGRER SUR VOTRE SITE"
Selon le code utilisé, vous verrez apparaître l'une ou l'autre des versions d'intégration sur votre site. Sur cet exemple le premier cartouche correspond à la première version du code proposé et le second à la seconde version. Ces cartouches contiennent les informations relatives au jeu de données choisis de la manière suivante :
Voici un autre exemple d’intégration sur le blog d’Etalab, ici avec les données de consommation d’électricité des ministères. Il est possible d’intégrer plusieurs jeux de données à la fois en dupliquant la ligne correspondant à l’élément <div> avec un nouvel identifiant. Vous pouvez personnaliser l’apparence du rendu du cartouche grâce à la classe CSS dataset-card.
Le mécanisme pour afficher tous les jeux de données relatifs à une organisation ou un territoire est le même que celui pour l’intégration d’un seul jeu de données décrit précédemment. Cet usage est recommandé si vous êtes responsable de cette organisation ou de ce territoire et souhaitez faire la promotion des jeux de données associés. Par exemple dans la cadre de la loi Notre, il est demandé aux communes de plus de 3500 habitants de rendre accessible en open data certaines données. L’usage de la plateforme « data.gouv.fr » pour déposer ces données puis les intégrer sur son propre site est rendue possible par cette solution.
En remplaçant l’IDENTIFIANT DE L’ORGANISATION par l’identifiant disponible sur sa page dédiée (l'ID se trouve en bas de page de description de l'organisation, dans les informations techniques, rubrique ID). Vous devriez alors voir apparaître sur votre site un cartouche contenant les informations relatives aux jeux de données de cette organisation. Optionnellement, il est possible d’afficher une barre de recherche pour laisser la possibilité au visiteur de filtrer la liste des jeux de données affichés. Cela est activé en passant l’option {withSearch: true} à la méthode loadOrganization() ci-dessus.
L'exemple ci-dessous montre l'intégration des jeux de données de la ville de Grenoble sur une page web avec cette méthode et l'option de filtrage activée :
Voici un exemple de restitution :
Données publiées sur data.gouv.fr :
Données vues sur le site web de Castelnaudary.fr via métaclic
Les outils développés sont disponibles en open-source. Ils sont le fruit d’un effort international pour créer des synergies autour de la donnée ouverte et mutualiser nos efforts de développement. La gouvernance est inclusive et la licence est permissive. Nous participons à l’animation autour du développement de la plate-forme car nous souhaitons produire un bien commun réutilisable par tous.
Le code est alors :
> via l’API METACLIC
> Via l’API data.gouv
A partir de 16 acteurs pionniers dans l’ouverture des données, cette fiche permet de connaitre les données le plus usuellement publiées en décembre 2017.
Source : OpenDataFrance - Licence : CC-BY-SA
Version : v2.0, date : juillet 2022
Ce, a été réalisé par Datactivist pendant l’été 2017 dans le cadre du projet Dododata1 à partir d’une quinzaine de portails d’agglomération Les candidats retenus pour cette analyse étaient : Angers, Bordeaux, Grenoble, Lille, Lyon, Marseille, Martigues, Montpellier, Nantes, Nice, Paris, Poitiers, Rennes, Saint Malo, Strasbourg, Toulouse. 400 jeux de données ont été classifiés selon les rubriques suivantes : Administration, Budget, Citoyenneté, Commerce, Culture, Economie, Elections, Energie, Environnement, Equipements, Logement, Mobilité, Patrimoine, Politique, Religion, Santé, Sécurité, Social, Sport, Télécommunications, Tourisme, Transport, Urbanisme.
Des données ont été publiées dans chacun de ces domaines, mais sont valorisés ci-dessous uniquement les domaines pour lesquels au moins la moitié des acteurs ont publié ces données.
Dans la catégorie administration, c’est le catalogue des jeux de données qui arrive en tête. Un tel catalogue peut être mise en place dès la publication des premiers jeux de données. Si vous souhaitez mettre en place un catalogue de vos jeux de données, nous vous recommandons de vous reporter au travail élaboré par les membres d’Opendata France. 70% des acteurs ont publié les limites administratives de leurs communes et la moitié ont publié le découpage administratif des communes et des cantons.
Ces obligations s’inscrivent dans la politique de transparence de la vie publique. Elle permettra les agrégations de données et de disposer de moyens de connaissance sur la dépense publique.
Dans la catégorie Citoyenneté, 75% des collectivités du panel ont publié les statistiques d’état civil « décès », « mariages », « naissances » ou/et « prénoms » et un peu moins concernant les données sur les cimetières.
Côté vie politique, plus de 80% du panel publient les emplacements des bureaux de vote et un peu moins de 70% au moins une fois les résultats d’élections.
La moitié des acteurs publient leurs statistiques de prêt en bibliothèque.
Plus de 80% des acteurs publient la liste des établissements scolaires. Parfois il ne s’agit que des écoles primaires, parfois la liste s’étend aux collèges, lycées et autres établissements relevant de la formation initiale.
Dans le domaine de l’environnement, 75% des collectivités du panel publient la liste des lieux concernés par les déchets : tri du vert, lieux d’apports volontaire, mobilier urbain.
Une grosse moitié des acteurs publient des informations sur les espaces verts, les équipements et les arbres.
La moitié des acteurs ont publié des données en relations avec les inondations (zones humides, zones inondables, débordements de cours d’eau).
Dans le domaine de la mobilité, 88% des collectivités du panel publient des données sur le réseau cyclable et la moitié sur les équipements dédiés y compris les vélos en libre-service. 88% des acteurs publient des informations sur le réseau de transport en commun : points d’arrêt, circuits mais seulement 63% des acteurs publient les horaires de transport en commun, pourtant la publication des horaires est une obligation légale.
Plus de 60% des collectivités du panel publient des donnés sur les cheminements pour piéton (zones apaisées, cheminements doux, zones 20 ou 30).
La moitié des collectivités du panel publient des données sur le stationnement.
Dans le domaine du sport, 70% des collectivités du panel publient la liste des équipements sportifs.
La moitié publient la liste des associations sportives et les sentiers de randonnées.
Dans le domaine de l’urbanisme, seul un acteur parmi les collectivités du panel ne publie pas les adresses de son territoire.
70% publient la liste des tronçons de rues , 63% le Plan Local d'Urbanimes (PLU).
La moitié des acteurs publient le relief et l’emplacement des toilettes publiques.
Source : OpenDataFrance - Licence : CC-BY-SA
Version : v2.0, date : mai 2022
Guide pour publier un jeu de données sur le portail des Données Publiques National “data.gouv.fr” opéré par la mission interministérielle Etalab.
Source : OpenDataFrance - Licence : CC-BY-SA
Version : v2.0, date : juillet 2022
Crédits : Ce document a été réalisé à partir du tutoriel publié par OpendataLab (Préfecture de région Occitanie) et le SICOVAL pour accompagner les communes se lançant dans l’opendata. Ce document s’est lui-même appuyé sur le guide d’utilisation de l’API Data.gouv produit par la mission Etalab : Il a été complété par OpenDataFrance lorsqu’il a été nécessaire de généraliser la fiche pour un usage au niveau national. Nous remercions la préfecture de région Occitanie et le SICOVAL pour leur contribution.
Le portail national data.gouv.fr permet à tout acteur public de créer un domaine pour sa collectivité et d’y publier gratuitement tous les jeux de données qu’il souhaite ouvrir.
Le producteur d'une base de données, entendu comme la personne qui prend l'initiative et le risque des investissements correspondants, bénéficie d'une protection du contenu de la base lorsque la constitution, la vérification ou la présentation de celui-ci atteste d'un investissement financier, matériel ou humain substantiel. Cette protection est indépendante et s'exerce sans préjudice de celle résultant du droit d'auteur ou d'un autre droit sur la base de données ou un de ses éléments constitutifs. Source
Les organisations inscrites sur la plateforme « data.gouv.fr » estimant assurer une mission de service public peuvent effectuer une demande en ligne pour être reconnue comme telle. Une organisation certifiée bénéficie d’un meilleur référencement. Pour devenir un service public certifié, inscrivez-vous sur le site en tant qu’organisation, puis effectuez la demande sur la page suivante : . Une vérification par email ou courrier vous sera demandée. Vous pouvez néanmoins commencer à publier vos jeux de données avant d’obtenir le badge de certification.
Un jeu de données peut contenir plusieurs ressources (fichiers de données, fichiers d'explications, API, liens...) qui constituent un lot cohérent sur un thème donné. Par exemple «La Réserve Parlementaire», contiendra plusieurs ressources, typiquement un fichier par année.
Créez un compte sur « data.gouv.fr ». Dès que vous serez inscrit, vous pourrez «contribuez» et «publier un jeu de données».
Un jeu de données peut être publié simplement avec un titre et une ressource. Pour autant, il sera mieux référencé s'il contient des informations supplémentaires qui le décrivent : période couverte, fréquence de mise à jour, territoire couvert, thématiques…
Vous devez par sécurité vérifiez que votre collectivité n’existe déjà pas dans les entités connues par Etalab (déclarée par un collègue par exemple, ou déclarée automatiquement par Etalab dans certaines conditions).
Le libellé de la structure doit respecter des règles implicites pour faciliter la découverte et clarifier sans ambiguité l'organisation :
Nom juridique exact de la structure :
valable : Rennes
non valable : Ville (de) RENNES, Mairie de Rennes, etc
Lorsque qu'il s'agit d'un organisme associé, le préciser :
VIB (opérateur Vélo Libre Service Brest)
Vous serez ainsi certain.e de publier vos données dans un format déjà défini, d'en vérifier la structure et la conformité à son schéma.
Un jeu de données peut contenir plusieurs ressources (exemple : le jeu de données des statistiques des bibliothèques de Grenoble comprend la liste des 17 bibliothèques municipales de Grenoble, puis 6 éléments statistiques concernant ces bibliothèques (Nombre de prêts annuels de 2008 jusqu'à 2016, Nombre d'inscrits de 2008 jusqu'à 2016, Nombre d'emprunteurs de 2008 jusqu'à 2016, Nombre de visiteurs de 2008 jusqu'à 2016, Catégorie socio-professionnelle des emprunteurs depuis 2012 jusqu'à 2016....
(auto-installation avec )
Le portail national
CD Côte d’Armor ()
CD
Syndicat Mixte Morbihan Energies (
, , , , , ,
Un de l'ensemble des portails français se trouve sur la page de l', produit par Open data France et co-financé par la DINUM (Etalab) et l'ANCT dans la cadre du Pan de Relance. Ce projet a obtenu aussi des co-financements de la Banque des territoires.
Site web : à priori les coûts d’intégration des données sur le portail de la collectivité sont assez faibles car dans ce choix d’entrée de gamme les fonctionnalités sont réduites. L’utilisation d’un script comme (open source et gratuit) en relation avec une publication sur data.gouv.fr entraîne un coût marginal très faible (création d’une page web simple).
Ville de Castelnaudary :
(les données sont publiées sur data.gouv.fr et récupérées sur les site web de la collectivité via un script Metaclic : )
(450 habitants)
Ainsi, outre quelques exceptions, « les documents contenant des données à caractère personnel doivent être rendus anonymes avant diffusion, sauf si une disposition législative (...) en prévoit autrement ou que l’administration concernée obtient l’accord des personnes intéressées. ». .
Règlement (UE) 2016/679 du Parlement européen et du Conseil du 27 avril 2016 : .
Seul le maire ou ses adjoints et les agents municipaux habilités à établir ou exploiter les actes d'état civil peuvent avoir accès au fichier de l'état civil. La Cnil que « les traitements mis en œuvre sur les fichiers d’état civil ne peuvent servir à d'autres finalités ou à alimenter d'autres fichiers, en particulier la constitution d'un fichier de population. Les informations nominatives enregistrées par les services d'état civil à l'occasion de l'établissement ou de l'actualisation d'un acte ne peuvent être utilisées que pour l'accomplissement des missions dont sont investis les maires en leur qualité d'officier de l'état civil et ne doivent être communiquées qu'aux destinataires habilités à les connaître. Les informations enregistrées ne peuvent, en particulier, être utilisées à des fins commerciales. Aucune cession du fichier de l'état civil ne peut avoir lieu. » Pour quelques missions de services publics de la commune (donc pour un usage interne de ces données), il est toutefois possible de produire des extraits pour alimenter « le fichier de vaccination de la commune, le fichier de recensement des jeunes en vue de la journée d'appel de préparation à la défense ou la commission administrative chargée de la révision des listes électorales, (mais) pour ces seules fins et dans la limite des textes existants. » « Les registres de l'état civil sont conservés à la mairie pendant cent ans à compter de leur clôture » mais « les informations collectées aux fins d'alimentation des bulletins statistiques de l'INSEE lors de l'établissement des actes de l'état civil ne doivent pas être conservées plus de six mois après leur transmission à l'INSEE ni utilisée par la mairie. ». Donc les données de l’état civil contenant des données à caractère personnel ne peuvent pas être publiées en open data, sauf délai de 75 ans.Pour ouvrir des données de l’état civil ne contenant pas de données à caractère personnel se reporter à la fiche Socle Commun des Données Locales.
Les données de bans de mariages sont des données d’état civil (voir paragraphe précédent). Elles ne sont pas à publier en open data selon l’, sauf après un délai de 75 ans. Ce sont des documents de l’état civil, ainsi les bans sont soumis au droit d'accès uniquement par les intéressés. Toutefois pendant la période de l’affichage, les bans de mariage sont des informations publiques, mais cet affichage contient des données à caractère personnel, une telle réutilisation ne serait possible, qu'après avoir recueilli le consentement des personnes concernées ou après anonymisation (voir glossaire) par la commune. La CADA considère que le code du patrimoine, qui régit l'accès aux archives publiques permet la publication à l'expiration du délai de 75 ans. Aller plus loin :
Les données de naissance sont des données d’état civil (voir paragraphe précédent). Elles ne sont pas à publier en open data, sauf après un délai de 75 ans. Si elles sont anonymisées, elles peuvent peuvent être publiées. Pour mettre les données d’état civil en open data, il est possible de s’appuyer sur le d’OpenDataFrance relatif aux prénoms
Délibération Cnil n°04-067 du 24 juin 2004 :
de Loïc Cadiet sur "l'open data" des décisions de Justice,
sur l’open data jurisprudentiel...
Depuis 2015, la CNIL participe aux travaux gouvernementaux portant sur l’anonymisation (voir glossaire) de données énergétiques. La loi pour une République numérique a prévu dans ce cadre de nouvelles dispositions, selon lesquelles les gestionnaires des réseaux de transport et de distribution d’électricité et de gaz naturel mettent à disposition du public les données détaillées de consommation et de production issues de leurs systèmes de comptage d’énergie, dans l’objectif de favoriser notamment le développement d’offres d’énergie, d’usages et de services énergétiques, « sous une forme agrégée garantissant leur caractère anonyme ». Pour ouvrir de telles données, il est recommandé de s’appuyer sur le compteurs communicants et de prendre connaissance du et de d’application.
En matière de santé : la loi du 26 janvier 2016 de modernisation de notre système de santé, les données du système national des données de santé (SNDS) précise les conditions de leurs mise à disposition auprès du public, soit sous la forme de statistiques agrégées ou de données individuelles dans des conditions telles que l’identification, directe ou indirecte, des personnes concernées est impossible. La loi prévoit que la réutilisation de ces données ne peut avoir ni pour objet ni pour effet d’identifier les personnes concernées. La CNIL peut dès lors fixer les opérations techniques permettant l’anonymisation (voir glossaire) de ces données particulièrement sensibles (voir glossaire). Aller plus loin sur les données de santé :
Aller plus loin : et règlement européen de protection des données personnelles applicable à partir du 25 mai 2018.
Au sujet de la procédure à suivre pour la publication et l’anonymisation des données, l'INSEE présente dans « », les cinq étapes à suivre en se basant sur ce même travail réalisé par Hundepool et al. (2012).
En attendant le pack de conformité sur l’anonymisation, des sur le sujet de l’anonymisation des données ont été rassemblées par l’Administrateur général des données, qui a également élaboré un outil informatique, intitulé Anonymizer. D’autres solutions existent, tel que l’outil d’anonymisation financé par des fonds européens : .
L'anonymisation des données personnelles vue par la CNIL :
La publication en ligne et la réutilisation des données publiques (« open data ») :
METACLIC : Une a été développée en open source par la société DATAKODE pour faciliter la personnalisation de l’affichage des jeux de données sur un site tiers. Un système de gabarit permet d’intégrer les données que vous souhaitez à vos couleurs et selon la disposition qui vous convient. Il s’agit d’un moyen de créer votre propre page open data à coûts réduits au sein de votre site.
L’intégration d’un portail open data complet demande des compétences en administration système, en développement Python et JavaScript ainsi qu’un temps non négligeable de prise en main de la plateforme. C’est un choix qui doit être mûrement réfléchi et nous vous recommandons de passer directement par « data.gouv.fr » si vous avez des données issues de territoires francophones.Si vous souhaitez néanmoins vous lancer dans cette aventure, vous pouvez commencer par analyser le ainsi que la . Vous pouvez également venir en (en anglais).
Exemple de publication des données de Castelnaudary :
Dans la catégorie Budget, 70% des collectivités du panel ont publié leurs marchés publics. Au plus tard le 8 octobre 2018, tous les acteurs publics ont l’obligation de publier les données essentielles des marchés publics et concessions lorsque leur montant est supérieur à 25 000 € HT. La moitié des acteurs du panel ont publié leurs subventions versées et leurs comptes administratifs. De la même facon, au plus tard le 8 octobre 2018, toutes les collectivités ont l'obligation de publier les données de subvention lorsque le montant est supérieur à 23 000 €. Les formats et les références réglementaires sont disponibles sur le site du .
Dans le domaine de la culture seulement trois collectivités du panel reversent leurs données dans et la moitié des acteurs alimentent cette rubrique. La démarche la plus exemplaire semble être l’agenda partagé et centralisé animé par Ouest France sur http://infolocale.fr.
Un peu moins de la moitié ont publié leurs données sur la qualité de l’air. Ces dernières données sont presque toutes téléchargeables depuis le site de la Fédération des Associations de Surveillance de la Qualité de l’Air (par exemple ). Comme elles sont déjà publiées par ailleurs, il est dommage de ne pas les valoriser aussi sur le site du territoire.
Pour plus de précision, voir le sur data.gouv.
Au préalable de la publication des données sur data.gouv.fr, il faut avoir créé un compte en tant que producteur. Cela se passe ici :
Si le nom de votre organisation est bien libre, créez votre organisation : C'est une responsabilité importante, assurez vous d'avoir la légitimité pour le faire et soyez précis et complet dans les éléments que vous enregistrez. Il sera toujours possible de corriger, voire de supprimer, la fiche Organisation mais prenez dés le début de bonnes habitudes.
Les règles de publication se trouvent sur la même page :
Sur certaines données vous avez la possibilité de vérifier s'il existe un schéma de description pour la ou les données concernées (Délibérations, subventions, DAE...) :
Ces fichiers peuvent être dans des formats différents (XLS, CSV, json, geojson...) mais aussi avoir une emprise géographique ou temporelle différente. Il est donc nécessaire de bien veiller à ce que la description de ces ressources soit correctement effectuée ; tout est ici :
Ce document détaille les étapes de préparation d’un jeu de données
Source : OpenDataFrance - Licence : CC-BY-SA
Version : v2.0, date : juillet 2022
Cela exige de procéder par de multiples approches car il est rare d'avoir un inventaire exhaustif des données. Les services les plus compétents pour aider dans cette démarche sont les services d'archive, de documentation, d'informatique, d'information géographique, du numérique, d'observatoire, de pilotage, de dgs, de communication. On sera vigilant à récupérer des données brutes et non des données travaillées, comme par exemple sous forme de statistiques.
OpenDataFrance propose le Socle Commun des Données Locales, il s’agit des données que les collectivités doivent publier en priorité, dans un format normalisé.
Un premier périmètre de données “prioritaires” a été établi autour des données suivantes :
Catalogue : dictionnaire des données publiées
Délibérations : données déclaratives (date, objet, type), sans données personnelles
Marchés Publics : date, nature, montant et identification des tiers bénéficiaires
Subventions : date, nature, montant et identification des tiers bénéficiaires
Équipements Collectifs Publics : inventaire géolocalisé des équipements collectifs publics implantés sur un territoire
État Civil : statistiques sur les prénoms des nouveaux-nés
Base Adresse Locale : correspondance entre l'adresse et la géolocalisation précise
Infrastructures de Recharge de Véhicules Électriques : localisation géographique et caractéristiques techniques des stations et des points de recharge pour véhicules électriques
Normalisation des éléments de base : codification normalisée des champs habituellement utilisés
Pour aller plus loin se reporter au Socle Commun des Données Locales.
Si une standardisation existe vous devrez essayer de l’appliquer au plus près. Cette opération peut être plus ou moins facile.
Si il n’y a pas de standardisation, vous devrez au moins appliquer les préconisations faites sur les intitulés de colonnes usuels tel l’adresse, la date, le nom de l’acteur… Le document “Normalisation des éléments de base” du Socle Commun des Données Locales (SCDL) peut vous y aider.
Votre modèle d’extraction est l’occasion de faire un premier niveau de nettoyage, autrement dit, l’occasion de sortir les données qui n’apportent rien au fichier tels que des identifiants techniques internes, ou des données qui font l’objet d’une législation qui empêchent leur publication.
Ensuite, vous devrez savoir sur quel(s) format(s) doivent être présentés vos données. Les attendus de la loi pour une République numérique sont “dans un format ouvert, aisément réutilisable et exploitable par un système de traitement automatisé”. Le format le plus répandu est le format .csv. La fiche Produire un fichier CSV de qualité est rédigée pour vous aider à ce travail.
Certains acteurs choisissent de publier leurs données dans plusieurs formats, comme le fait par exemple Bordeaux métropole qui pour ses données géographiques a choisi les formats suivants : ESRI Shapefile RGF93/CC45, ESRI Shapefile RGF93/Lambert93, Google KMZ, WebService OGC WMS, WebService OGC WFS, Fichier CSV, AutoCAD DWG.
En ce qui concerne la licence, elle aura été probablement choisie en amont et annoncée dans la délibération donnant le cadre de l’ouverture des données. Mais il est toutefois utile de se poser la question avant la publication de chaque jeu de données.
Il arrive que les données qui sont dans des fichiers, pour en faciliter les lectures et traitements sont "esthétisées": les cases des tableurs sont esthétisées, des cellules sont fusionnées, des textes sont en italique ou graissés... Certains fichiers de type tableur, peuvent être organisés en onglets ou bénéficier de "macro" plus ou moins complexes.
L'ensemble de ces aménagements spécifiques éloignent le fichier de son potentiel de réutilisation. Un fichier qui aurait au moins une de ces “fantaisies” ne répond pas aux standards de l'ouverture.
Chaque base de données ou application métier a ses opérations préalables à l'exportation. Parfois, il y a aura un bouton ou un menu “exporter les données”, dans d'autres cas il sera possible de présélectionner les données avant de les exporter, dans d'autres cas encore, rien n'est prévu nativement pour exporter les données. Dans cette hypothèse, il faudra mettre en place une opération technique qui réalise l'export, opération souvent désignée comme "moulinette" ou "patch". La "moulinette" peut être une simple ligne de commande ou bien réalisée par un programme ou un outil d'extraction tels que les ETL (Extract, Transform, Load) : Talend, Knime, Pentaho Data Integration...
Ces derniers outils permettent d'extraire des données de n'importe quel format (fichiers, bases de données, pages html...) pour ensuite les traiter si besoin (changer le nom des entêtes, corriger les formats de dates, uniformiser les différences de nommage de certains champs, croiser des données entre-elles...) pour ensuite les réinjecter dans un entrepôt de données spécifique pour l'opendata, dans des fichiers csv ou tout autre format.
Certains standards, comme GTFS, demandent beaucoup de rigueur pour répondre à leurs exigences. L'export des données va exposer les données sous une nouvelle réalité. En effet, tant que les données sont dans leur environnement logiciel, elles ont une cohérence utile aux exploitations quotidiennes, mais sorties de leur contexte usuel, elles peuvent faire apparaître des "défauts" de qualité. Dans cette phase, il est vraiment important de faire un travail avec les agents qui s'occupent de l'alimentation des données à la source pour que les erreurs repérées puissent être corrigées au plus prés de l'alimentation source.
Si possible, on organisera le SI de sorte à ne pas activer la “moulinette” manuellement mais à appliquer des procédés automatisés. La solution usuellement retenue est la mise en place d’API, simple à mettre en place et appréciée des réutilisateurs.
Lorsque les données viennent d'être exportées, il faut avoir un regard général pour cette nouvelle forme de présentation. Dans certains cas, il y a aura des défaut des formes; par exemples, les caractères accentués s'afficheront mal. Dans d'autres cas, il y aura des habitudes de services, les agents, dans leur travail quotidien, utilisant des abréviations ou diverses expressions, sorte d'argot professionnel. Une personne extérieure au service, n'aura pas facilement les significations des différents termes utilisés, à moins qu'ils soient documentés. Dans d'autres cas, la nouvelle mise en forme des données fait apparaître des notions dérangeantes : un lieu est privilégié, un élu est sur ou sous exposé, les effets des politiques du moment ne se voient pas dans les données qui sont représentatives des mois antérieurs.... La diffusion des données pourraient venir perturber les missions de services publics. Par exemple, diffuser les sections des tuyaux des réseaux d'assainissement pourrait favoriser des explorations dans les tuyaux dans lesquels il est possible de tenir debout. Enfin, l'ouverture des données pourrait être contrainte pour une disposition réglementaire spécifique.
Enfin, des doublons ou des incohérences pourraient apparaître; ainsi, souvent, c’est une nouvelle occasion de faire des opérations de nettoyage. Elles seront facilités par des outils tels que les ETL ou d'autres comme Openrefine
Il peut y avoir certaines transformations du texte, des intitulés des colonnes, des abréviations pour rendre les données lisibles par toutes les personnes extérieures au service producteur de données. Une documentation viendra compléter cette mise en visibilité des données. Pour rédiger la documentation, il est possible de s’appuyer sur la trame type rédigée par OpenDataFrance : Documenter les données avant publication C’est l’occasion, de mettre en place les métadonnées. Dans bien des cas, ces dernières s’appuient sur un dictionnaire des métadonnées. C’est à ce moment qu’on décide de la fréquence de mises à jour des données.
Le fichier de données brutes pour répondre aux attendus d’intelligibilités des humains et des machines a subit de nombreuses transformations. Certaines transformations sont des transformations de mises à niveau pour une ouverture facilitée. Il est souhaitable qu'elles soient le plus nombreuses possibles et qu'il ne soit plus obligé de revenir dessus pour chaque mises à jour. Les transformations de mises à jour sont le minimum des transformations qu'il faut opérer pour publier la nouvelle version du jeu de données. Par exemple, il est souhaitable que la publication mensuelle du fichier des marchés publics ne demande qu'un changement de date dans le nom du fichier. Cette étape peut être l'objet d'une réorganisation plus ou moins profonde du travail de production de données ou peut révéler un besoin de formation…
Dans bien des cas, avant l'ouverture du jeu de données, l'agent producteur aura validé les données prêtes pour l’application. Et à son tour, il aura fait valider le fichier à un de ses responsables hiérarchiques. C’est l’occasion de conforter le rythme des mises à jour.
Il faudra produire un texte qui présente le service producteur et les données afin de mettre en avant le jeu de données sur le site internet ou les éventuels messages dans les communiqués de presse ou sur les réseaux sociaux.
Il faudra également savoir si le jeu de données est présenté ou non sous forme de datavisualisation.
Il existe peut-être un événement ou un document qui est en lien avec l’ouverture de ces données. Par exemple, l’ouverture des données des vélos en libre service peut être présentée dans un encadré sur le flyers de la semaine de la mobilité.
Exemple d'une convention liant un Animateur de territoire avec une collectivité dans le cadre d'un accompagnement OpenDataLocal.
Source : OpenDataFrance - Licence : CC-BY-SA
Version : v2.0, date : juillet 2022
Crédits : GIP Ternum BFC, avril. 2017
La loi Pour une République Numérique instaure l'obligation d’ouvrir les données publiques pour les communes et EPCI de plus de 3500 habitants et 50 agents. Le programme OpenDataLocale est piloté à l’échelon national par l’association Opendata France.
[Nom de la collectivité] est l’un des territoires retenu comme Animateur Territorial des Données (ATD). L’ATD ne reçoit pas de financement mais un soutien (animation, ressources documentaires, méthodologie) de la part de Opendata France afin d'accompagner les Expérimentateurs Territoriaux des Données de son territoire (ETD).
Les objectifs de OpenDataLocale sont :
Définir un Socle Commun des Données Locales qui formera un premier catalogue de jeux de données publiables par les collectivités, en complément du Service Public de la Donnée que propose déjà Etalab,
Créer les ressources pédagogiques qui permettent la sensibilisation, l’accompagnement et la formation à la démarche d’ouverture des données publiques,
Structurer une démarche homogène au niveau national tout en s’appuyant sur un réseau local qui permettra à la fois de tester en grandeur réelle les dispositifs proposés dans l’expérimentation, de capitaliser sur les bonnes pratiques, mais aussi d'accompagner les collectivités territoriales de petite taille.
En décidant de rejoindre OpenDataLocale vous devenez Expérimentateur Territorial de la Donnée (ETD) dans le but de :
Publier en 2017 un ou plusieurs jeux de données du Socle Commun de Données Locales et participer aux groupes de travail organisés par Opendata France,
Tester les dispositifs d’accompagnement produits dans le cadre du programme afin de favoriser la démarche d’ouverture des données dans votre collectivité et/ou auprès de vos partenaires locaux (autres collectivités, associations citoyennes, entreprises, universités…)
Bénéficier de la publication des données de marchés publics issus du profil d’acheteur de Territoires Numériques BFC,
Bénéficier de supports pour structurer vos actions de publication des données, de sensibilisation et formation de vos acteurs (agents, élus…),
[Bénéficier des fonctionnalités de publication du portail OpenData] (le cas échéant, si mutualisation possible)
Participer à chaque fois que possible aux rencontres ou conférences téléphoniques que nous organiserons (environ 1 fois par mois) pour suivre le programme OpenDataLocale,
Partager vos retours d’expériences et travaux de publication avec les autres ETD. Un espace documentaire est mis à disposition.
Notre équipe projet est heureuse de vous accueillir dans ce programme et nous restons à votre disposition pour avancer conjointement sur nos démarches d’ouverture des données.
[NOM ETD] Titre et Signature
[NOM ATD] Titre et Signature
Normalisation des éléments de base
Source : OpenDataFrance - Licence : CC-BY-SA
Version : v2.0, date : juillet 2022
Quelque soit le jeu de données publiés par les collectivités, certains champs doivent avoir un format unifié au niveau national pour éviter les disparités dans leur présentation. Dans quelques cas, il est aussi indispensable que des champs “pivots” soient respectés pour faciliter les liens entre les bases et la récupération de nombreuses données contextuelles. Enfin, de bonnes pratiques émergent pour produire des jeux de données identifiables, exploitables et de qualité. Bien qu’un peu éloigné de l’open data, on pourra aussi consulter le Référentiel Général d’Intéropérabilité, ou RGI, produit par l’Etat (DINSIC) qui décrit des standards d’interopérabilité : information sur les formats d’échange (synthèse des standards retenu pour l’interopérabilité syntaxique), interopérabilité sémantique (définition à retenir par tous pour les principaux concepts liés à l’interopérabilité, etc.). Nous rassemblons ici quelques règles générales et bonnes pratiques, sans prétendre à l’exhaustivité.
Des nombreuses données sont soumises à des normes (plus ou moins connues ou appliquées) nationales ou internationales. Les lister ici serait fastidieux, probablement incomplet et peu opérationnel. Nous indiquons ci-après des champs courants dans les jeux de données produits par les collectivités qui gagneraient à respecter des standards reconnus. Leur normalisation favorise l’interopérabilité et la compréhension des données, donc leur qualité et réutilisabilité.
Date : format AAAA-MM-JJ (2016-07-23), conforme à la norme internationale ISO8601 (voir aussi https://fr.wikipedia.org/wiki/Heure)
Heure (pour les données temps-réel notamment), heure/minutes/seconde et période de temps : format HH:MM:SS (éventuellement suivi d'une virgule ',' puis de décimales de seconde), conforme à la norme internationale ISO8601. (voir aussi https://fr.wikipedia.org/wiki/Heure)
Nombre : dans le cas des données décimales, on privilégiera le séparateur décimal point “.” (la virgule étant réservée à la séparation des champs dans un fichier CSV)
Il existe aussi des référentiels pour codifier les langues (ISO 639-1, cas des données régionales), pour les pays (ISO3166), pour les monnaies (ISO 4217), etc. que nous ne détaillons pas ici.
Adresse : la norme officielle pour coder les adresses est assez lourde. Elle est décrite dans le document AFNOR NF Z 10-011 En pratique, nous recommandons de décrire une adresse avec les champs suivants :
numero
Titre : Numéro d’adresse
Description : Numéro d’adresse dans la voie et, dans le cas des voies sans adresse, la valeur “99999” est attendue
Type : nombre entier
Exemple : 130
suffixe
Titre : Information suffixée qui complète et précise le numéro d’adresse
Description : Indice de répétition et/ou complément d'adresse (nom d’entrée d’immeuble) normalisé en minuscules sans espace
Type : chaîne de caractères
Exemple : ter
voie_nom
Titre : Nom complet de la voie
Description : Concaténation du type et du nom de la voie en majuscules et minuscules accentuées Le nom de la voie peut également être un lieu-dit
Type : chaîne de caractères
Exemple : Rue du Rempart
commune_nom
Titre : Nom officiel de la commune
Description : Texte libre qui permet d’identifier rapidement la commune dans laquelle l’adresse est située
Type : chaîne de caractères
Exemple : Brest
Géolocalisation :
Les adresses peuvent être exprimées dans un des deux référentiels de référence :
WGS84 Ce référentiel est proposé car cela correspond à un usage très courant, notamment un contexte international et la plupart des équipements et services de géolocalisation (GPS). Il s’applique à certaines zones du territoire français (DOM-TOM).
RGF93 (ou Lambert93) Ce référentiel est préconisé par la réglementation pour le territoire métropolitain français. Il est cependant peu utilisé dans un contexte international.
Cas des Longitudes et Latitudes exprimées dans le format WGS84
Exprimé LAT (Latitude) et LONG (Longitude)
Nombre de décimale : Le nombre de décimale dépend de la précision de la localisation. 5 décimales correspondent à une précision au mètre et permettent de couvrir la majorité des usages.
Exemple : Latitude : 48.87079, Longitude : 2.31689
Cas des Longitudes et Latitudes exprimées dans le format RGF93
Généralement appelé X (pour la longitude) et Y (pour la latitude)
Exemple : Centre-ville de la ville de Tours :
X=1525240,99 (ou EST) et Y =6246398,33 (ou NORD) dans RGF93-CC47
Ce qui correspond dans le référentiel WGS84 à : LAT=47,39414(59) LONG=0,68467(36)
Les outils géomatiques savent générer ou convertir les coordonnées d’un point dans un référentiel ou un autre.
Certains champs peuvent servir de “pivots” au niveau national. Ce sont des champs qui permettent de retrouver de façon univoque, claire ou complète des données dans des bases de référence nationale (en particulier dans les bases du Service Public de la Données).
On rappelle les principaux ci-après :
Identification d’une collectivité
Code COG (connu aussi sous le nom de code INSEE) :
Le Code officiel géographique (COG) est la référence légale éditée par l’Insee, qui rassemble les codes et libellés des communes, des cantons, des arrondissements, des départements, des régions, des collectivités d'outre-mer, des pays et territoires étrangers. On se réfère souvent à l'un ou l'autre de ces codes géographiques en parlant de code Insee :
Le code région contient deux chiffres.
Le code département contient deux à trois chiffres ou lettres. Il se retrouve sur les plaques d'immatriculation.
Le code arrondissement contient un chiffre.
Le code canton contient deux chiffres.
Le code commune contient cinq chiffres ou lettres (concaténation du code département et de la codification de la commune de deux à trois chiffres). Il est le plus employé.
1 : un code issu du COG n’est pas unique quelque soit les niveaux hiérarchiques des collectivités. Par exemple le code de la Région Champagne-Ardenne est 21, comme celui du département de la Côte-d'Or. De ce fait, il ne faut pas mélanger des régions et des départements dans la même colonne; une pratique constatée est de donner le COG dans un champ et le type de collectivité dans un autre (comme par exemple dans les données de marchés publics). 2 : Le Code officiel géographique est révisé chaque année, en fonction notamment des fusions et associations de communes ou de territoires, et des changements de dénomination.
Code SIRENE :
Cet identifiant est plus précis qu’un code INSEE lorsqu’un désigne un acteur public, car il n’existe pas de code INSEE pour un EPCI (Etablissement Public de Coopération Intercommunale)
Identifiant du Système d'Identification du Répertoire des Entreprises (et dans notre cas aussi des Collectivités)
Chaîne numérique 9 (correspondant à l’entité juridique)
Ex : 797681236
Code SIRET :
Cet identifiant est à choisir lorsque l’on veut désigner un établissement au sein d’une organisation. Cela est souvent pertinent lorsque l’on s’intéresse à un budget ou une décision locale.
Identifiant du Système d'Identification du Répertoire des Établissements
Chaîne numérique 9+5 (ces 5 derniers chiffres correspondant à l’établissement de l’entité juridique indiquée par la première chaîne de 9 chiffres)
Ex : 79768123600015
Identification d’une entité juridique (entreprises, organismes -dont les collectivités- et associations)
Code SIRENE ou SIRET selon si l’on parle de l’entité juridique ou de l’établissement (une personne, un budget) : Voir ci-dessus
Se voient attribuer un numéro SIREN par l’INSEE :
des personnes physiques :
toutes celles exerçant une profession non salariée de façon indépendante (professions libérales, commerçants, etc.) ;
des loueurs de biens immobiliers non inscrits au RCS mais signalées à l’Insee à la demande des centres des impôts ;
et, à des fins de gestion donc hors accès public, les associés-gérants signalés à l’Insee par les URSSAF
les groupements de droit privé non dotés de la personnalité morale (indivisions, sociétés de fait, sociétés en participation, etc.)
et toutes les personnes morales, c’est-à-dire :
les personnes morales de droit privé (SA, SARL, GIE, sociétés civiles, associations, syndicats, etc.) ;
les personnes morales de droit public soumises au droit commercial (entreprises publiques) ;
les personnes morales de droit étranger ayant un établissement ou un bureau de liaison en France ;
les personnes morales (ou organismes assimilés comme telles) soumises au droit administratif (comme les institutions et services de l’État, les collectivités territoriales, etc.) ;
Il existe cependant une exception pour les personnes morales : les associations loi de 1901 n’ont l'obligation d’avoir un SIREN que dans trois cas seulement :
si elles sont employeuses ;
si elles sont soumises à la TVA ;
si elles souhaitent l’obtention de subventions auprès d’administrations publiques.
Identification d'une association : code RNA (RépertoireNational des Associations)
L'inscription d’une association au RNA donne lieu à une immatriculation sous la forme d'un “numéro RNA”, composé de la lettre W suivie de 9 chiffres. (ex. W123456789)
Cet identifiant est unique mais les données associées dans la base RNA ne sont pas toujours mises à jour (il s’agit plutôt de l’acte de déclaration à la création de l’association). La base SIRENE fournit généralement des informations plus fiables.
Un travail approfondi a été mené par plusieurs acteurs sous la conduite de la Fing pour énoncer des règles de base de production et de contrôle d’un fichier tabulaire au format CSV.
Documenter dans un fichier séparé (ou autre) le sens des données contenus dans le jeu de données :
nom explicite de chaque champ (pas uniquement des codes plus ou moins compréhensibles),
portée de chaque donnée et condition particulière de production,
sens des codifications lorsque le cas se présente
On trouvera un exemple de documentation dans les jeux de données du Socle Commun des Données Locales.
Données tabulaires
Le principe de l’opendata est de publier des données à un format ouvert non prioritaire, on privilégiera donc le format “CSV” et le format “ODT” (lisible par un logiciel libre tel que Libre Office)
On acceptera le format “XLS” qui, bien que de propriétaire (Microsoft), peut être lisible par des logiciels libre comme LibreOffice.
On pourra aussi produire les données au format "XML" qui est un standard ouvert et reconnu pour les jeux de données de structure un peu plus complexe (xml)
Données textuelles
Format “TXT” :
Format “JSON” : JSON est un format de données textuelles dérivé de la notation des objets du langage JavaScript. Le principal avantage de JSON est qu’il est simple à mettre en œuvre par un développeur tout en étant complet. Au rang des avantages, on peut également citer : peu verbeux, ce qui le rend lisible aussi bien par un humain que par une machine.
ODF (ou ODT) : OpenDocument est un format ouvert de données pour les applications bureautiques : traitements de texte, tableurs, présentations, diagrammes, dessins et base de données bureautique. OpenDocument est la désignation d'usage d'une norme dont l'appellation officielle est OASIS (Open Document Format for Office Applications, également abrégée par le sigle ODF)
RDF
Données géographiques
GéoJSON
Shapefile
OWS
KML
...
Données temps-réel
(rédaction ultérieure)
L'Infolab est un espace d'accueil et de rencontre pour partager et comprendre, transformer voire bâtir avec les données numériques : des objets, des projets, des visions... L’Infolab met à disposition
Source : OpenDataFrance - Licence : CC-BY-SA
Version : v2.0, date : juillet 2022
La sensibilisation, l’acculturation, la formation
L’incubation de projet
La création de connaissances, et les modalités de discussion, concertation débat.
Dans l'environnement numérique, un Infolab contribue ainsi à découvrir toute la richesse du monde des données numériques : chercher, voir, découvrir, manipuler, collecter, produire des données. Il permet également d'accompagner les projets en apportant un cadre et des ressources, en hébergeant, facilitant voire proposant des formations, rencontres, conférences, groupes de travail, etc.
Les Infolabs se caractérisent également par la défense de valeurs :
L'Infolab est un espace d'accueil ouvert. Il recherche la diversité et la complémentarité des publics, des talents, et des envies. Un Infolab est destiné à tout le monde !
L'Infolab est un espace accessible. Il n'est pas nécessaire d'avoir fait de longues études pour comprendre et y partager des choses.
L'Infolab privilégie le collectif et la collaboration. Le croisement est à la source des idées les plus neuves et les plus enrichissantes.
Face à l'enjeu de démocratisation des données, les Infolabs contribuent à
redistribuer au plus grand nombre un pouvoir d’agir avec et sur les données plutôt que renforcer le pouvoir de ceux qui présentent déjà une forte maturité sur ce sujet
développer un écosystème riche et ouvert plutôt que maintenir des expertises en vase clos et des hyperspécialisations
favoriser une appropriation large par l’ensemble du tissu économique plutôt que la naissance de monopoles industriels
contribuer à une réelle appropriation par l'économie sociale et solidaire plutôt que des services ciblés pour citoyens aisés
Les particuliers, qui peuvent découvrir les données, participer aux débats, développer des projets personnels, tester des objets connectés, etc.
Les organisations (entreprises, associations, acteurs publics, etc.), qui ont aussi intérêt à (re-)découvrir leurs données et celles des autres, souhaitent incuber un projet, se former, détecter des compétences, faire tester un service
Les chercheurs, les journalistes, qui recherchent des données mais aussi des compétences pour les faire parler, les publier, etc.
Les producteurs de données qui souhaitent valoriser leurs données et avoir des retours de leurs usagers
Les communautés d’usages ou métiers (sportifs, généalogistes, botanistes, astronomes, randonneurs, cartographes, amateurs comme professionnels de tout crins), qui souhaitent travailler ensemble sous l’angle des données
La Scop La Péniche à Grenoble est à la fois une espace de co-working et un Infolab organise régulièrement des événements pour accompagner le développement de la culture des données.
Source : OpenDataFrance - Licence : CC-BY-SA
Version : v2.0, date : juillet 2022
Nous indiquons ici les prestataires Conseil et Formation connus pour leur capacité à faire de l'accompagnement open data. Il en existe sans doute d'autres de qualité. Si vous connaissez des prestataires qui méritent de figurer dans cette liste, merci d'adresser un message à contact@ opendatafrance.email
Source : OpenDataFrance - Licence : CC-BY-SA
Version : v2.0, date : juillet 2022
Une animation territoriale open data consiste à un programme d’accompagnement des collectivités de petites tailles pour ouvrir leurs données. Elle est portée par un acteur expérimenté et outillé de niveau inter-communal (EPCI, département, région, structure de mutualisation informatique, association) capable de mettre en œuvre des moyens opérationnels et réguliers de soutien : sensibilisation, formation, mutualisation d'outils, aide méthodologique à la production de données de qualité...
Pour aider à structurer cette démarche, Opendata France propose un dispositif d'appui national, OpenDataLocale, qui permet d'accompagner ces collectivités animatrices dans l'ingénierie de leur démarche de partage d'expériences, production de ressources communes, développement des compétences.
Le dispositif Opendatalocale est ouvert à toutes les collectivités souhaitant devenir Animateur Territorial des Données (ATD).
Un questionnaire de positionnement sur la culture des données à destination des agents de la fonction publique afin de proposer des actions de sensibilisation et de formation adaptées.
Source : OpenDataFrance - Licence : CC-BY-SA
Version : v2.0, date : juillet 2022
Lien vers le sondage en ligne : http://bit.ly/dataposition
OpenDataLocale (ODL) est un programme d’accompagnement des collectivités locales à l’ouverture des données publiques, coordonné par OpenDataFrance. Il s'appuie sur des acteurs territoriaux.
Source : OpenDataFrance - Licence : CC-BY-SA
Version : v2.0, date : juillet 2022
Après la préfiguration des dispositifs de soutien et leur expérimentation durant la période 2017-2018 (saison 1), celle du déploiement pour la période 2019-2020 (saison 2), OpenDataFrance lance la phase de généralisation (saison 3) à partir de 2021.
L’objectif est d’atteindre 2000 collectivités territoriales ouvertes à l’horizon 2022. En particulier, elle s'adressera aux collectivités de taille intermédiaire (10 000 > 80 000 habitants)
Le programme OpenDataLocale s’appuie sur l’engagement d'acteurs publics territoriaux de rang supérieur (intercommunal, départemental ou régional) pour accompagner sur l’ensemble du territoire français les petites et moyennes collectivités dans leur démarche d’ouverture des données.
Ces structures de soutien sont appelées Animateurs Territoriaux des Données (ATD). Un Appel à Candidature a permis d'identifier les Animateurs engagés dans la saison 3.
Leur intervention consiste à :
formaliser une offre d’accompagnement des collectivités de rang administratif inférieur dans leur périmètre de compétence,
mettre en place les ressources nécessaires pour accompagner ces petites et moyennes collectivités (moyens humains et techniques),
participer à la mutualisation et à la valorisation des démarches engagées dans leurs territoires respectifs.
Le réseau des ATD bénéficie d’une visibilité nationale forte et d’un appui méthodologique par OpenDataFrance. L’Observatoire open data des territoires (la carte interactive) sert d'outil de mesure. Les données collectées permettent de suivre le déploiement, l’amplification et l’impact des dispositifs d’accompagnement de proximité.Ce programme est soutenu par la Direction Interministérielle au Numérique (DINUM) et par l’Agence Nationale de la Cohésion des Territoires (ANCT) dans le cadre du Plan de Relance.
Source : OpenDataFrance - Licence : CC-BY-SA
Version : v2.0, date : juillet 2022
L'intérêt premier de la publication reste les réutilisations et donc l'appropriation des jeux de données par les acteurs du territoire. Les faire porter à connaissance est donc essentiel. Par exemple en publiant les jeux de données sur les pages thématiques publiques de son site web (comme par exemple la liste des Points d'Apport Volontaire sur la page environnement / citoyenneté...).
Une démarche d’ouverture des données en mode projet doit porter ou soutenir des initiatives de valorisation et de médiation des données : hackathons, challenges, cartoparties, rencontre de sensibilisation et formations au sujet, appels à projets et temps d’échange réguliers avec la communauté.
Réduction de la production de déchets. Les données concernées sont celles répertoriant les lieux d’apport volontaire, la liste des déchèteries et les données socio-économiques sur les activités de collecte et de traitement des déchets. L’application se destine aussi bien aux particuliers utilisateurs des services de la déchèterie et aux opérateurs publics et privés.
L’application regroupe les outils d’information et d’aide à la décision pour la réduction de production de déchet, l’accès aux déchèteries et la gestion de ces équipements. L’utilisation des ces informations doit conduire à une amélioration du service rendu aux citoyens utilisateurs de déchèteries et doit apporter une meilleure réponse aux besoins de gestion et de planification des gestionnaires de collecte.
La carte interactive du réseau d’évacuation des eaux usées d’Angers Loire Métropole est une application contenant le plan détaillé du réseau de canalisations de la métropole d’Angers.
Types d’usages : Permettra aux professionnels de prendre connaissance du réseau de canalisations afin de planifier leurs interventions. Ils disposent des points d’accès avec le diamètre des canalisations, mais aussi de l’âge du réseau par année de pose.
Fonctionnalités :
Matériaux des canalisations
Année de la pose
Dénivelé
Bornes incendies
Stations de pompage
Stations de dépollution
Regards de visite.
Optimod’Lyon et Coovia sont des applications destinées aux particuliers et aux professionnels du transport. Elles visent à l’amélioration de la circulation urbaine aussi bien pour les personnes que pour le transport de marchandises. Les utilisateurs peuvent obtenir les informations concernant la disponibilité des vélos en libre-service dans les stations, le co-voiturage, les transports publics et le trafic.
Types d’usages : Favoriser et inciter à l’usage de modes de transports alternatifs à la voiture. Cela passe par la proposition du co- voiturage, du vélo et des transports en commun afin d’inciter les gens à utiliser des moyens de déplacements moins polluants, ceci ayant un impact positif sur leur santé et permettant aussi un allègement du trafic.
Fonctionnalités :
Optimod’Lyon :
Prédiction du trafic à une heure afin de partir au meilleur moment et ainsi éviter ou limiter le temps passé dans les embouteillages ;
Fourniture à tous et partout des informations relatives à tous les modes de transports (heures de passages, disponibilité des vélos en stations et co-voiturage à proximité) ;
Gestion optimisée du fret urbain afin de livrer aux meilleures heures pour éviter de bloquer le trafic ;
Navigateur urbain pour les particuliers et les professionnels ;
Coovia :
Gestion en temps réel du nombre de co-voitureurs et gestion multimodale des transports pour optimiser les déplacements ;
Gestion automatisée des transferts d’argent entre utilisateurs du covoiturage ;
Possibilité de réservation de plusieurs trajets en une seule fois ;
Proposition automatique des points de rendez-vous les plus pertinents ;
Notifications pour prévenir de nouveaux messages et les réservations ;
Communication entre utilisateurs via une messagerie instantanée ;
Covoiturage en horaires d’équipes ;
Un espace profil contenant davantage d’informations.
Qui dit miam ? est une application qui se donne pour mission d’informer les parents d’élèves sur ce qui est servi à leurs enfants par la restauration scolaire, avec le détails des ingrédients de chaque menu.
Types d’usages : Sensibiliser les parents à l’équilibre nutritionnel. Renseigner les parents sur le contenu des repas servis à leurs enfants dans les écoles maternelles et élémentaires. Les parents ont accès au menu du jour avec les allergènes et aliments bio qui le composent. L’application fonctionne également pendant les périodes de vacances scolaires pour les repas servis dans les centres de loisirs.
Fonctionnalités :
Accès à la liste des ingrédients par plat ;
Être alerté lorsqu’un aliment est présent dans un plat ;
Notifications pour être tenu informé des évènements de la restauration scolaire;
Outil de contribution pour échanger avec le restaurateur ;
Qucit est une entreprise qui propose d’améliorer les applications de transport. Les particuliers connaissent le nombre de vélos disponibles dans les stations et les places de stationnement libres pour les véhicules motorisés. Les gestionnaires des parcs de stationnement et de vélo sont des informations précieuses pour offrir un service optimum.
Types d’usages : Améliorer la disponibilité et la qualité des vélos en libre-service en se basant sur les données de fréquentation des stations pour les équilibrer en détectant les pannes le plus tôt possible afin d’éviter toute immobilisation prolongée des vélos. Diriger les conducteurs vers la meilleure solution de stationnement selon des critères fixés par eux en basant sur les données de prédiction de trafic et des places disponibles afin de réduire le trafic et donc la pollution générée par les embouteillages et le temps passé à chercher une place.
Fonctionnalités :
Être informé de la disponibilité de vélos ou non dans la station de son choix ;
Déposer le vélo dans une station disposant de places libres afin de ne pas perdre de temps à chercher ;
Se garer facilement (dans la rue, en parking collectif ou de particulier à particulier) selon ses critères et ainsi ne pas perdre de temps dans la recherche d’une place.
Source : OpenDataFrance - Licence : CC-BY-SA
Version : v2.0, date : juin 2022
Les diverses expérimentations qui ont pu être menées en matière d’ouverture des données montrent le besoin des acteurs territoriaux d’échanger, de collaborer et de mettre en place des dispositifs communs.
L’animation de réseaux est l'un des outils qui permet de définir des objectifs communs, de favoriser le partage de savoirs et savoir-faire et de développer des actions communes. Dans le domaine de l’information géographique, les Infrastructure de Données Géographiques (IDG) jouent ce rôle. Au niveau national, l’association OpenDataFrance réalise une veille, anime des groupes de travail et favorise la remontée des besoins et des attentes aux instances nationales (Etalab). La coopérative Datactivist anime également un forum
Les concours open data ont pour objectif de constituer un cadre de lancement à des projets innovants : ils visent à favoriser leur développement et créer un terrain favorable à l’émergence de nouveaux services et d’applications d’utilisation des données. Le concours est sanctionné par la remise d’une somme d’argent pour le vainqueur.
C’est un procédé de pré-sélection de candidats sur dossier. L’objectif est de travailler en amont pour créer des conditions favorables à de futurs appels d’offres restreints. L’appel est ouvert à tout le monde. Lorsqu’un appel concerne un marché spécifique, le service en charge des appels transmettra le cahier des charges et l'invitation à soumissionner aux candidats figurant sur la liste ou seulement à certains d'entre eux choisis selon des critères de présélection déterminés en fonction du marché concerné.
Un hackathon est un évènement se déroulant sur un temps court, généralement un week-end, en continu : développeurs, analystes de données, spécialistes thématiques se réunissent et collaborent autour d’un projet qui a pour objectif le développement de nouveaux programmes informatiques ou de nouvelles applications accessibles. À la fin du hackathon, il y a souvent un prix remis par un jury au projet le plus prometteur. Cela peut être une somme d’argent ou un accompagnement pour inciter les vainqueurs à finir le développement de leur projet.
Un barcamp est un événement pendant lequel des personnes aux compétences variées sont invitées à présenter soit un projet, soit une idée, soit à demander de l’aide sur l'une de leurs actions.
Le principe du barcamp est de proposer à chaque participant de se présenter et de proposer librement des projets. C'est une modalité ouverte et collaborative incitant à partager l’expérience acquise pendant et après l’évènement en communiquant via des dispositifs et outils collaboratifs (wikis, forums et blogs).
La force du barcamp réside dans la diversité des individus qui peuvent y prendre part et dans la création d’un programme d’échanges et d’actions en fonction des envies et des motivations des participants.
Le crowdsourcing est une pratique de production collective sur une thématique, un sujet ou un savoir. L’exemple le plus connu est celui de wikipédia : l’encyclopédie est rédigée par tout le monde, des règles de référence et d’écriture sont établies pour aider et encadrer les contributions. D’autres dispositifs s’appuient sur les méthodes collaboratives, notamment dans la culture ou les sciences naturelles : transcription de documents, repérage de photographies, identification de plantes... L’appel à contribution peut être permanent ou ponctuel sur un projet. OpenStreetMap est également un bel exemple de co-production en matière de données.
Une Opération Libre découle d’une démarche entreprise par des organisations travaillant autour d’outils, de licences, de contenus et de données libres. L’objet de l’Opération Libre est de démontrer les opportunités de la libre diffusion des outils et informations des communes. Une Opération Libre dure 48 heures (soit le temps d’un week-end). Les participants collectent et publient les informations détenues par une commune. Cette démarche fait appel aux habitants, aux contributeurs (par exemples des wikipédiens, des historiens, des archivistes, des cartographes, des photographes, etc.) et aux associations.
Une cartopartie est un évènement qui regroupe aussi bien des néophytes que des amateurs ou professionnels de la cartographie. Une cartopartie se déroule en général le temps d’un week-end et les participants se retrouvent dans un lieu commun pour travailler, qu’il s’agisse d’un café, d’un espace de travail partagé ou d’une bibliothèque. Des équipes sont organisées pour quadriller le secteur à cartographier. Ensuite, tous les participants se retrouvent donc dans le lieu commun pour informatiser les données récoltées afin de les traiter pour au final les publiées.
L’atelier de manipulation des données vise à enseigner aux personnes, qui en auront en charge, le renseignement des données dans des bases de données. Cela s’appelle le Langage de Manipulation des Données. La connaissance de ce langage permet l’insertion, la suppression et la mise à jour des données contenues dans un fichier.
Source : OpenDataFrance - Licence : CC-BY-SA
Version : v2.0, date : juillet 2022
La Loi pour une République Numérique rend obligatoire la publication des données en open data pour les collectivités de plus de 3 500 habitants (et de plus de 50 agents). Les collectivités territoriales qui accompagnent les collectivités de petites ou moyennes tailles (ATD) doivent ainsi identifier les collectivités cibles. Voici quelques conseils pour procéder à leur identification.
Charger le fichier au format Excel (attention il est assez volumineux puisqu'il détaille les 36.500 communes de france)
Dans Excel, sélectionner tout le document (bouton en haut à gauche) et dans la barre de menu choisir "Données/filtre/filtre automatique"
Choisir le sélecteur qui convient le mieux (par exemple "région" pour les communes d'une région) et sélectionner la région concernée. La liste n'affiche plus que les communes de la zone géographique considérée.
Dans le champ "nb d'habitant", sélectionner Tri par ordre décroissant.
Sélectionner les communes de plus de x habitants (3500 pour le minimum, un autre seuil si l'on souhaite traiter des communes de taille supérieure) :
De la ligne 2 à la lignes nnn, les Communes qui apparaissent respectent les critères de sélection (par exemple : région x et nb habitant supérieur au seuil).
Les sélectionner par copier/coller. Les coller dans un autre fichier de traitement. Ne pas modifier le fichier source pour une réutilisation ultérieure.
Cela donne en copie d'écran :
Cette source est un peu plus difficile à exploiter.
Commune : http://carto.observatoire-des-territoires.gouv.fr/#s=2013;v=map40;i=pop_rp.pop;l=fr
EPCI : http://carto.observatoire-des-territoires.gouv.fr/#s=2013;v=map41;i=pop_rp.pop;l=fr
En haut à droite, utiliser le bouton « imprimer/exporter »
Une fenêtre s’affiche, cliquer sur « exporter les données » à droite.
faire l'export au format Excel.
faire la suite des traitements comme indiqué ci-dessus pour le fichier de l'INSEE.
En version excel 95, le fichier exporté sera tronqué au-delà des 16.000 premières lignes. Penser à le réenregistrer en version 97/2003 ou *xlsx
Le décret fixant le seuil minimal d'agents à 50 agents pour que l'obligation d'ouverture des données s'applique est paru le 28 décembre 2016. La DGCL publie régulièrement les chiffres clés des collectivités territoriales permettant d'identifier les collectivités territoriales répondant à ce critère.
Source : OpenDataFrance - Licence : CC-BY-SA
Version : v2.0, date : juin 2022
Une cartopartie est une balade urbaine qui vise à arpenter une zone géographique à plusieurs, afin de produire des données géo-référencées. Cet atelier, initié par la communauté OpenStreetMap, est également organisé par des collectivités au sein de dispositifs de participation citoyenne qui mettent en œuvre des technologies numériques : métrologie citoyenne sur la qualité de l’air, sur l’environnement sonore, inventaire d’arbres remarquables, recensement des services d’hyperproximité, des défibrillateurs etc...
extraction et publication sur un portail open data : geodatamine.fr
https://movilab.org/wiki/Cartopartie
Cet intéressant article restitue l'étude de différentes cartoparties menées sur les villes de Pornichet, Nantes et Rennes. À travers une analyse croisée, elle s’attache à tracer les contours de cette forme de balade urbaine collective « cartopartie » et notamment à montrer comment les acteurs urbains articulent les espaces numériques avec les ateliers présentiels. Enfin elle s’intéresse à comment cet ensemble hybride est pratiqué par les participants.
Source : OpenDataFrance - Licence : CC-BY-SA
Version : v2.0, date : juillet 2022
Le tiers-lieu est une notion introduite en 1989 par le sociologue Ray Oldenburg. Il s'agit de lieux hybrides, entre espace personnel et espace ouvert, domicile et travail, convivialité et concentration, adaptés aux nouveaux usages d'un style de vie urbain, individualisé et mobile.
Les tiers-lieux réunissent un certain nombre de conditions logistiques permettant les rencontres informelles et favorisant la créativité issue des interactions sociales, notamment à travers l’ouverture et sa fertilisation, la flexibilité, la convivialité et l’accessibilité. Les amis occasionnels, les habitants d’un quartier, les professionnels d’un secteur, peuvent s’y retrouver et en faire le carrefour de leur communauté.
Les tiers-lieux sont destinés à être des espaces physiques de rencontres entre personnes et compétences variées qui n'ont pas forcément vocation à se croiser en dehors de cet espace. Les bibliothèques et médiathèques se transforment depuis une dizaine d'années pour devenir de tels espaces, autour de leur cœur d'action publique. Dans de nombreux cas, ces espaces intègrent des programmes de médiation numérique.
C'est une forme d'accompagnement qui désigne la mise en capacité de comprendre et de maîtriser les technologies numériques, leurs enjeux et leurs usages. Elle met en œuvre un accompagnement qualifié (personnes formées à la médiation) et de proximité des individus et des groupes (habitants, associations, entreprises, élèves, étudiants, parents, professionnels...) dans des situations de formation tout au long de la vie.
Elle participe ainsi à développer la culture numérique de tous, pour pouvoir agir dans la société numérique. Elle est un levier de lutte contre l'illectronisme et ses conséquences sur l'iniquité d'accès aux services publics. Elle favorise les coopérations utiles aux réalisations et aux innovations en faveur des Communs.
Les acteurs publics qui publient des données devraient aussi accompagner les acteurs du territoire, qu’ils soient internes ou externes, à la culture des données. La culture des données est à la croisée d'autres cultures : médiatique, informatique, statistique, mathématique...
Avoir une culture des données de base passe par une bonne maitrise du vocabulaire et aussi une prise de conscience des acquis qui peuvent être mobilisés dans chacune des disciplines mentionnées ci-dessus en faveur d'un travail sur les données. C’est également savoir paramétrer son environnement informatique, savoir produire ou lire une datavisualisation, ou encore comprendre les effets des règles d’un algorithme.
A ce jours les acteurs publics ont des compétences bien identifiées dans d’autres domaines du numérique tel que l’aménagement ou la productions d’un patrimoine cartographique. Dans le domaine de la culture des données, ce sont aux acteurs publics de s’auto-saisir de cet enjeu pour favoriser le développement de la culture des données auprès de leurs différents interlocuteurs.
Les Tiers-lieux et les acteurs de la médiation numérique sont de potentiels relais de la culture des données. Quand le partage et le travail des données se fait dans des espaces ouverts à différents profils de la population, ils sont propices à l’émergence de services innovants.
Source : OpenDataFrance - Licence : CC-BY-SA
Version : v2.0, date : juin 2022
Crédits : FING : Infolab 1, 2, 3 DATA
Pour de nombreux acteurs, le hackathon représente un format d’expérimentation clé. De fait, il produit une effervescence et des résultats tangibles en un temps record. Il connaît d’ailleurs un gros succès : des entreprises, des communautés, des territoires, des acteurs publics, des collectifs citoyens, s’en saisissent pour un oui ou pour un non. Les plus gros y ont recours : Axa, Orange, Pernod Ricard, la SNCF, la RATP, Vinci, le ministère de l’Environnement, de l’Énergie et de la mer, celui de la Ville, de la Jeunesse et du sport, etc. Même le très sérieux Figaro en fait des gorges chaudes et clame que le hackathon “réinvente l’innovation en entreprise”. Il est vrai qu’il a de quoi séduire : il crée de la rencontre spontanée, de la convivialité et de l’émulation.
Malgré son succès, des critiques s’élèvent contre le hackathon, parfois détourné pour des raisons de communication de son but premier. Le hackathon, "c'est un truc vendu par des consultants à de vieilles organisations, animé par des idéologues pour faire bosser des esclaves..." — @nodesign ou "un écosystème où les développeurs sont toujours considérés comme des unités de production, et non pas comme les designeurs de solutions à haute valeur ajoutée ..."-- Valentin Squirelo
Un autre type de critique tient à la temporalité de l’exercice : certains parlent d’événement “en cloche” dont la valeur retombe très rapidement. De fait, un très grand nombre de projets meurent le lendemain du hackathon (la quasi totalité ?).
Pour être réussi, un hackathon ne doit pas être pensé comme un événement ponctuel, mais bien comme une étape dans une démarche projet plus large. On peut par exemple imaginer un hackathon comme point de départ ou comme point d’orgue d’une démarche d’ouverture des données. Dans le premier cas, illustré par exemple par l’évènement OpenDAMIR organisé par l’Assurance Maladie en 2014, le hackathon permet de préparer l’ouverture d’un important jeu de données (les dépenses détaillées de santé), de mobiliser les équipes internes au sein de l’administration et de tester in vivo l’intérêt d’un public plus large pour ces données.
A l’issue de la journée, les responsables de l’Assurance Maladie ont pu ainsi annoncer que les données mises à disposition des participants le seraient à tous, en open data, quelques semaines plus tard.
Dans un autre registre, les hackathons organisés par le Ministère de l’Environnement s’inscrivent dans une démarche plus globale autour de la GreenTech Verte, outre les hackathons on y retrouve un incubateur de startups, des concours de datavisualisation, etc. Le hackathon est ici pensé comme l’un des moyens pour faire inter- face avec les écosystèmes tiers.
Les équipes sont organisées pour quadriller le secteur à cartographier. Les données sont collectées en petit groupe sur des (secteurs ou rues affectés à chaque groupe). Ensuite, tous les participants se retrouvent dans un lieu commun pour saisir les données récoltées, en général sur OpenStreetMap, et les publier. La réutilisation de ces données dépend d'applications ou de services qui pourront être mise en œuvre :
création d'une carte de ville sous OSM :
Handicap : org, openmap.org
Le lancement d’un projet open data est un acte politique important qu’il est nécessaire d’officialiser par une décision en conseil. Voici un exemple de texte de délibération.
Source : OpenDataFrance - Licence : CC-BY-SA
Version : v2.0, date : juillet 2022
La loi pour une République Numérique rend l’ouverture des données publiques obligatoire au-delà du seuil de 3 500 habitants et de 50 agents (oct.2016). Bien qu'une délibération ne soit plus juridiquement nécessaire, elle permet néanmoins de poser un acte politique fort au fondement de la démarche Open data. Elle est l'occasion de sensibiliser élus, agents publics et citoyens.
Elle pose des éléments structurants comme le choix de la licence par défaut pour les données ou le site de publication qui entourera la démarche d'une légitimité.
Conseil [Municipal] N° du
Délibération n°
DÉCIDANT DE L’OUVERTURE DES DONNÉES PUBLIQUES DE [Collectivité]
Mesdames, Messieurs,
VU le Code Général des collectivités territoriales ;
VU la loi du 17 juillet 1978, modifiée, relative à la liberté d’accès aux documents administratifs et à la réutilisation des informations publiques ;
VU la directive européenne 2003/98/CE du 17 novembre 2003 concernant la réutilisation des informations du secteur public ;
VU le décret 2005-1755 du 30 décembre 2005 relatif à la liberté d’accès aux documents administratifs et à la réutilisation des informations publiques, pris pour l’application de la loi du 17 juillet 1978 ;
VU la directive européenne 2007/2/CE du 14 mars 2007, publiée au journal officiel de l’Union européenne le 25/04/2007, dite directive INSPIRE ;
VU la loi n° 2015-991 du 7 août 2015 portant nouvelle organisation territoriale de la République
VU la loi n° 2016-1321 du 7 octobre 2016, dite Loi pour une République Numérique, rendant obligatoire la publication par défaut des informations publiques non protégées produites par les collectivités territoriales ;
VU le Livre III du Code des relations entre le public et l'administration, en vigueur au 09 octobre 2016.
Considérant que l’ouverture des données est cohérente par rapport à la stratégie numérique menée par [Collectivité] ;
Considérant que les services de [Collectivité] entretiennent des bases de données ;
Considérant que la collectivité en tant que donneur d’ordre, producteur ou coproducteur possède la propriété intellectuelle intégrale de ces bases de données ;
Considérant que la collectivité souhaite mettre à disposition progressivement ses données de façon non discriminatoire et en permettant leur réutilisation pour un usage commercial ou non-commercial sous une licence libre de type Licence Ouverte v2 ;
Considérant que la mise à disposition des données publiques facilitera leurs réutilisations par les citoyens, les acteurs économiques et les partenaires institutionnels ;
Considérant que la mise à disposition des données permettra de réaliser des économies d'échelle en incitant l'ensemble des acteurs publics et privés à partager le même territoire numérique sans multiplier des acquisitions de données similaires ;
Considérant que la mise à disposition des données permettra de stimuler l'innovation et de participer à la relance en permettant aux acteurs économiques de développer de nouveaux usages et services numériques.
Décision
Entendu l’exposé de Monsieur le [Maire], après en avoir délibéré,
Article 1 : [Collectivité] décide de mettre à disposition progressivement les données publiques propriété de la collectivité sur un portail Internet dédié appelé « data.xxx.fr », sous une licence de type License Ouverte v2.0 dont les termes sont annexés à la présente délibération.
Article 2 : La mise à disposition des données de [Collectivité] sera effectuée conjointement avec la mise à disposition des données de ses partenaires.
(si la collectivité est associée dans son projet avec une agglomération/métropole, la rédaction peut être la suivante: Article 2 : La mise à disposition des données de [Collectivité] sera effectuée conjointement avec la mise à disposition des données de l’agglomération/métropole et des ses partenaires, ainsi qu’avec les autres communes membres de l’agglomération/métropole ).
Délibération du Conseil [municipal] publiée par affichage en Mairie le : reçue à la Préfecture le : publiée au RAA le :
LES CONCLUSIONS DU RAPPORT SONT ADOPTEES POUR EXTRAIT CONFORME LE [MAIRE], POUR LE [MAIRE]
Capitalisation des meilleures pratiques en terme de rédaction des mentions légales attachées à un site open data : responsabilité éditoriale, protection des données personnelles, droits d'accès, etc.
Source : OpenDataFrance - Licence : CC-BY-SA
Version : v2.0, date : juin 2022
Crédits : Rennes Métropole, Toulouse Métropole, Bordeaux Métropole
Les mentions légales d'un portail open data, comme tout site internet, sont utiles pour encadrer la relation entre l'administrateur du site et les utilisateurs. Elles sont obligatoires et soumis à quelques règles.
Le texte ci-dessous est une proposition de rédaction s'appuyant sur les meilleures pratiques adoptées par Toulouse, Rennes ou Bordeaux Métropole.
Mentions légales du site https://opendata.xxx.fr
Le site https://opendata.xxx.fr est le catalogue de données publiques ouvertes (open data) de [Nom-de-la-Collectivité] (ou de la métropole xxx et des communes qu’elle regroupe). Il est géré par le Service [Nom-du-Service] au sein de la Direction [Nom-de-la-Direction] de [Nom-de-la-Collectivité]. Editeur [Nom-de-l'éditeur] adresse CP - Ville Tél. : nn.nn.nn.nn.nn Directeur de publication [Nom-du-directeur] Service [Nom-du-Service] / Direction [Nom-de-la-Direction] Cellule Open Data : [mail_de_contact] Conception graphique, Développement, Intégration [Nom-du-Presatataire] Lien vers le prestataire
Hébergement [Nom-de-l’Hébergeur] n° de SIREN Adresse CP - Ville Tél. : nn.nn.nn.nn.nn Lien vers l'hébergeur
Nous nous efforçons de contrôler au mieux la pertinence et la véracité des contenus du site Internet. Si toutefois, malgré nos efforts, vous constatiez un problème, nous vous serions reconnaissants de bien vouloir nous en informer, par le biais du formulaire de contact prévu à cet effet.
Dans le cadre de ses missions de service public, [Nom-de-la-Collectivité] met en œuvre différents traitements de données à caractère personnel. À ce titre, elle est soumise aux dispositions du Règlement Général pour la Protection des Données (également dénommé « RGPD ») entré en application le 25 mai 2018 et qui renforce les obligations relatives à la circulation et la protection des données à caractère personnel. En France, ce texte est complété par la loi n°78-17 du 6 janvier 1978 relative à l'informatique, aux fichiers et aux libertés (également dénommé « loi Informatique et Libertés »).
Ce sont tous les traitements manuels ou informatisés relatifs à des informations se rapportant à une personne physique identifiée ou identifiable, c’est-à-dire « une personne physique qui peut être identifiée, directement ou indirectement, notamment par référence à un identifiant, tel qu'un nom, un numéro d'identification, des données de localisation, un identifiant en ligne, ou à un ou plusieurs éléments spécifiques propres à son identité physique, physiologique, génétique, psychique, économique, culturelle ou sociale » (voir article 4, point 1) du RGPD). Il peut s’agir, par exemple, du nom et prénom, d’une photographie, d’un e-mail nominatif, d’un numéro d’identification, de données de localisation, de données propres à l’identité physique, physiologique, ou économique d’une personne, etc.).
Le RGPD garantit aux individus différentes protections juridiques dont une obligation d’information transparente, concise et complète dès la collecte des données à caractère personnel. Cette information doit permettre aux individus de comprendre l’objectif tout en les aidant à maîtriser leurs données en facilitant l’exercice de leurs droits (opposition, accès, rectification, effacement, limitation, portabilité).
[Nom-de-la-Collectivité] a désigné un « Délégué à la protection des données » (acronyme anglais : DPO) qui est l’interlocuteur officiel pour toutes les questions touchant à l’exercice des droits des personnes concernées par un traitement mis en œuvre par un service communal (ou intercommunal/métropolitain) ; Vous pouvez le joindre à l’adresse suivante : @mail de contact du DPO
Accéder à notre site Internet Lorsque vous accédez à notre site Internet, votre navigateur transmet certaines données à notre serveur Web. Cela est nécessaire pour des raisons techniques et pour mettre à votre disposition des informations requises. Pour faciliter l’accès à notre site Internet, les données suivantes sont recueillies, utilisées et conservées pour une durée limitée dans le temps : - Adresse IP - Date et heure d’accès - Fuseau horaire par rapport à l’heure GMT (Greenwich Mean Time) - Statut d’accès/code de statut http - Volume des données transférées - Navigateur, paramètres de langue, version du logiciel navigateur et interface Nous conserverons ces données pour une durée limitée dans le temps afin de pouvoir instaurer un suivi des données personnelles en cas d’accès ou de tentative d’accès non autorisé à nos serveurs. Utilisation des cookies Lors de la consultation de notre site des cookies sont déposés sur votre ordinateur. Les cookies sont des petits fichiers texte (ou témoins de connexion) déposés sur votre ordinateur lors de votre visite sur un site internet. Les cookies sont utilisés par le site internet visité pour envoyer des informations à votre navigateur et permettre à ce navigateur de renvoyer des informations au site internet visité. Ils sont, dans le cas présent, utilisés à des fins de mesure d'audience du site internet . Les cookies permettent de conserver, pendant une durée maximale de 13 mois, des informations d'état lorsque votre navigateur accède aux différentes pages de notre site internet ou lorsque votre navigateur retourne ultérieurement sur notre site internet. Seul l'émetteur d'un cookie peut lire ou modifier les informations qui y sont contenues. Les cookies présents sur ce site nous permettent : - d'optimiser votre navigation sur notre site internet, - de réaliser des statistiques de visites. La durée de conservation des cookies est de plusieurs mois, à défaut du renouvellement du consentement de l’Utilisateur ces données seront supprimées. Utilisation des formulaires de Contact Ce site internet contient un formulaire de contact qui vous permettra de nous contacter directement. Dans ce cas, vous serez amené(e) à nous fournir les informations suivantes : - identité - adresse mail Nous collecterons, traiterons et utiliserons les informations que vous nous aurez fournies par ce formulaire de contact exclusivement pour traiter votre demande.
Conformément à la réglementation applicable en matière de protection des données à caractère personnel et aux dispositions du RGPD, vous disposez notamment des droits suivants sur les données qui vous concernent :
Droit d'information sur vos données à caractère personnel que nous stockons ;
Droit de demander la correction, la suppression ou la limitation du traitement de vos données à caractère personnel ;
Droit de vous opposer au traitement de vos données à caractère personnel. Si votre demande d’opposition ne concerne pas la prospection, l’organisme pourra justifier son refus au motif que · il existe des motifs légitimes et impérieux à traiter les données ou que celles-ci sont nécessaires à la constatation, exercice ou défense de droits en justice ;
· vous avez consenti (vous devez alors retirer ce consentement et non vous opposer) ;
· un contrat vous lie avec l’organisme ;
· une obligation légale lui impose de traiter vos données ;
· le traitement est nécessaire à la sauvegarde des intérêts vitaux de la personne concernée ou d'une autre personne physique.
Droit à la portabilité de vos données : vous avez le droit de récupérer une partie de vos données à caractère personnel dans un format lisible par une machine. Libre à vous de stocker ailleurs ces données portables ou les transmettre facilement d’un système à un autre, en vue d’une utilisation à d’autres fins.
Droit de retirer le consentement au traitement de vos données à caractère personnel : vous pouvez à tout moment révoquer votre consentement à la collecte, au traitement et à l'utilisation future de vos données à caractère personnel. Pour plus d’informations, veuillez consulter les chapitres ci-dessus décrivant les traitements de données fondés sur votre consentement.
Pour exercer ces droits ou pour poser toute question sur le traitement de vos données, vous pouvez contacter [Nom-de-la-Collectivité] par courriel : @mail de contact du DPO
[Nom-de-la-Collectivité] Direction des Affaires Juridiques Cellule protection des données Adresse CP - Ville Si vous estimez, après nous avoir contactés, que vos droits ne sont pas respectés, vous pouvez adresser une réclamation à la Commission Nationale Informatique et Libertés (CNIL), autorité compétente en matière de protection des données personnelles.
Nous pouvons parfois actualiser notre politique de confidentialité. Ces mises à jour seront publiées sur notre site Internet. Toute modification entrera en vigueur dès sa publication. Nous vous recommandons donc de visiter régulièrement notre site Internet pour vous tenir informé.e.
La reproduction des pages de ce site est possible à condition de respecter l'intégrité des documents reproduits (pas de modification ni altération d'aucune sorte) et de bien vouloir mentionner la source. Toutes les données et applications ont leur propre licence. Les logos de [Nom-de-la-Collectivité] et des communes qu’elle regroupe sont la propriété de ces collectivités. Ainsi, toute reproduction ou modification, totale ou partielle, de ces éléments graphiques sans autorisation préalable et écrite est interdite. Pour tous renseignements, vous pouvez nous contacter via le formulaire de contact ou par courrier postal.
[Nom-de-la-Collectivité] autorise tout site Internet ou tout support à mettre en place un lien hypertexte en direction de son contenu à l'exception de ceux diffusant des contenus à caractère polémique, pornographique, xénophobe, contraire à la décence ou aux bonnes mœurs. Pour autant, l'intégralité de la page liée doit être respectée, et aucune imbrication dans un autre site ne doit être réalisée. De même, le lien doit indiquer clairement la nature des contenus, ainsi que l'adresse exacte de la page. Toute utilisation de liens vers le site open data à des fins commerciales et publicitaires est interdite.
S’agissant des échanges sur le forum dédié, conformément aux lois en vigueur seront systématiquement supprimés : - l’incitation à la haine raciale et les propos racistes, antisémites et xénophobes, la négation de crimes contre l’Humanité et des génocides reconnus, et l’apologie des crimes de guerre et/ou du terrorisme - les propos à caractère homophobe ou sexiste, les propos d’une nature violente, pornographique ou pédophile - la diffamation et les injures entre internautes ou à l’égard d’une tierce personne- les atteintes à la vie privée ou à la présomption d’innocence, l’usurpation d’identité - le non-respect du droit d’auteur, de la propriété intellectuelle et de licence - l’incitation à la commission de crimes ou de délits, l’apologie des stupéfiants - l’appel au meurtre et l’incitation au suicide, la promotion d’une organisation reconnue comme sectaire.
[Nom-de-la-Collectivité] ne garantit pas que le site sera exempt d'anomalies, d'erreurs ou de bugs, ni que celles-ci pourront être corrigées, ni que le site fonctionnera sans interruption ou pannes, ni encore qu'il soit compatible avec un matériel ou une configuration particulière autre que celle expressément validée par [Nom-de-la-Collectivité]. [Nom-de-la-Collectivité] ne pourra en aucun cas être tenu pour responsable de dysfonctionnements imputables à des logiciels de tiers que ceux-ci soient ou non incorporés dans le site ou mise en œuvre à partir de celui-ci. En aucun cas, [Nom-de-la-Collectivité] ne sera responsable de tout type de dommage prévisible ou imprévisible (incluant la perte de profits ou d'opportunité) découlant de l'utilisation ou de l'impossibilité totale ou partielle d'utiliser le site. Enfin, [Nom-de-la-Collectivité] ne pouvant contrôler l'ensemble des sites sur lesquels elle renvoie par l'intermédiaire de liens hypertextes, qui n'existent que pour faciliter les recherches de l'utilisateur, n'est aucun cas responsable de leur contenu.
Clauses juridiques à insérer dans les marchés publics pour s’assurer que le prestataire (ou délégataire) restituera librement les données produites dans le cadre d’un service public.
Source : OpenDataFrance - Licence : CC-BY-SA
Version : v2.0, date : juin 2022
Les marchés publics délèguent, dans de nombreux cas, la gestion de données à des tiers, données qui relèvent du périmètre de l'open data ou, a minima, d'une réutilisation légitime par la collectivité, pouvoir adjudicateur. Il est donc capital de clarifier dès le document contractuel l'accès et les droits d'usages sur ces données, la Loi pour une République Numérique, n'étant pas toujours connue et respectée par les titulaires des marchés. 3 CCAG encadrent les prestations qui peuvent être concernées.
(Cahier des clauses administratives générales applicables aux Techniques de l’Information et de la Communication)
Cela concerne tout ce qui est relatif à l’approvisionnement de logiciels, maintenance etc.. L’article 37-1 du CCAG TIC prévoit d’ores et déjà l’utilisation des résultats pour publication :
“Le titulaire du marché autorise le pouvoir adjudicateur à extraire et exploiter librement les bases de données incluses, le cas échéant, dans les résultats, notamment en vue de la mise à disposition des informations publiques à des fins de réutilisation à titre gratuit ou onéreux.”
(Cahier des Clauses Administratives Générales applicables aux marchés publics de Fournitures Courantes et de Services)
Cela concerne tout ce qui est relatif à la réalisation de prestations corrélées à un approvisionnement logiciel. Exemple : photo aérienne. Le CCAG FCS ne comporte pas de clause relative à la publication des résultats. Il est donc nécessaire de l'ajouter expressément.
(cahier des clauses administratives générales, prestations intellectuelles). Le cas du CCAG PI est plus complexe. Cela ne concernera que les résultats des études. L’option du CCAG PI relative à l’utilisation des résultats par le titulaire peut être l’option A. ou B.
Option A ― Le titulaire du marché concède, à titre non exclusif, au pouvoir adjudicateur et aux tiers désignés dans le marché le droit d'utiliser ou de faire utiliser les résultats, en l'état ou modifiés, de façon permanente ou temporaire, en tout ou partie, par tout moyen et sous toutes formes.
Option B ― Le titulaire du marché cède, à titre exclusif, l'intégralité des droits ou titres de toute nature afférents aux résultats permettant au pouvoir adjudicateur de les exploiter librement, y compris à des fins commerciales, pour les destinations précisées dans les documents particuliers du marché.
Après un travail en collaboration des différentes collectivités ouvrant leurs données publiques et membres d’OpenDataFrance, il est proposé une clause spécifique à rajouter dans les consultations à partir desquelles les collectivités achètent les outils dont elles ont besoin. Ce travail a été récemment enrichi par la proposition de clause formulée dans le rapport "De la smart city à la réalité des territoires connectés".
3 CCAG concernés, 1 seule clause duplicable
La [nom de la collectivité] s’est engagée dans une politique pour l’innovation et le développement numérique faisant une place prioritaire au logiciel libre et à la réutilisation des données publiques conformément à la loi pour une République numérique, n° 2016-1321 du 7 octobre 2016 et au Livre III du Code des relations entre le public et l'administration, en vigueur au 09 octobre 2016.
Pour cela, elle permet aujourd’hui à des tiers de réutiliser librement les données publiques diffusées sur sa plateforme accessible à l’adresse [url portail]. Sont expressément exclues de cette démarche les données à caractère personnel ainsi que celles sur lesquelles des tiers détiendraient des droits de propriété intellectuelle.
Les données produites, collectées, traitées ou gérées par l’acheteur public ou par le titulaire du marché pour son compte dans le cadre de ses activités de service public et en lien avec ses compétences en ce qu’elles sont nécessaires au fonctionnement du service public sont réputées appartenir à l’acheteur public dès l’origine. Le titulaire du marché s’engage à permettre à l’acheteur public d’accéder librement à ces données à tout moment de l’exécution du Marché public. A l’issue du Marché public, le titulaire du marché s’engage à remettre gratuitement à l’acheteur public toutes les données visées au premier alinéa du présent article et à apporter la preuve de leur destruction. (ajout issu du rapport "De la smart city à la réalité des territoires connectés")
[Conformément à l’article 37-1 du CCAG TIC,] le pouvoir adjudicateur se réserve la possibilité de publier sous une licence de réutilisation publique, qui précise les droits et les obligations rattachés aux données, les données issues de l’utilisation de l’outil approvisionné par le présent marché. A cette fin, le titulaire fournit au pouvoir adjudicateur, dans des standards ouverts (c’est-à-dire, selon l’article 4 de la LCEN du 21 juin 2004 « tout protocole de communication, d'interconnexion ou d'échange et tout format de données interopérable et dont les spécifications techniques sont publiques et sans restriction d'accès ni de mise en oeuvre »), en vue de la mise à disposition à titre gratuit des informations publiques à des fins de réutilisation à titre gratuit ou onéreux : - Les outils permettant d’extraire et exploiter librement tout ou partie de ces données et bases de données. - Ou le cas échéant, les données et bases de données collectées ou produites à l’occasion de l’exécution du présent marché.
Certains jeux de données "prioritaires" font l'objet d'une standardisation en raison de leur intérêt particulier et de la nécessité de garantir leur interopérabilité. Pour ces raisons, différentes structures de portée nationale déterminent les données essentielles que l'on doit trouver dans ces jeux de données ainsi que le format de présentation de ces données. C'est l'objet du Socle Commun des Données Locales porté par OpenDataFrance.
Pour éviter les difficultés de production de ces données dans le format attendu, il est préférable de demander contractuellement aux prestataires et délégataires la mise à disposition de ces données conformément au référentiel du SCDL.
Une clause à insérer dans le CCTP (puisque spécifique à chaque prestation) est proposée :
Lorsque les données produites dans le cadre du présent marché font partie des données mentionnées dans le référentiel national Socle Commun des Données Locales, le titulaire sera tenu de transmettre ces données à la collectivité dans les formats décrits par ce référentiel.
Les formats de transmission des données autres que celles mentionnées dans le référentiel national Socle Commun des Données Locales, seront transmises à la collectivité sous un format ouvert qui devra être décrit dans le mémoire technique.
Une formation sous forme de webinaires produite par OpenDataFrance et le CEREMA
Module complémentaire de formation proposé dans le cadre du Parcours Agents Métier, développé par ODF pour CultureD
Source : OpenDataFrrance - Licence : CC-BY-SA
Date de production : c1.0 (mars 2023) / Dernière Mise à jour : v1.1 (avril 2023)
Comprendre ce qu’est une donnée et pourquoi anticiper sa réutilisation par d’autres ? Connaître selon les cas les obligations de publication ou de protection.
Comment produire des données de qualité, où en trouver, quels outils à disposition ? Où m’adresser si je suis perdu ?
Type : Guide (support d’une Vidéo) / Langue : Fr
Agents publics découvrant les principes de l'ouverture des données (ou open data).
#iNveau : débutant / Cible : collectivité territoriale /
Aucun
Le support et la vidéo peuventt être lu/écouté en 30 minutes
Aucune
Ce programme a été conçu afin de vous permettre de découvrir ce qu’est l’open data et comment cela peut contribuer à faciliter la vie des personnes sur notre planète.
Source : Programme e-Learning du Portail Européen de Données. 2018.
Cours 1 - L’open data, c’est quoi ?
Cours 2 - Générer de la valeur à partir de l’open data
Cours 3 - L’open data. Agent de changement
Cours 4 - Quelle est l’importance d’une licence ?
Cours 5 - Comment évaluer la qualité de l’open data ?
Cours 6 - Mesurer le succès d’open data
Cours 7 - Pourquoi se préoccuper de la durabilité ?
Cours 8 - Maîtriser les plateformes d'open data
Cours 9 - Choisir le bon format pour l’open data
Cours 10 - À quel point mes données sont-elles utilisables ?
Cours 11 - Comment nettoyer les données ?
Cours 12 - Trouver les données cachées sur le Web
Cours 13 - Lier le Web des données
Cours 14 - Mobilisation pour l'open data
Cours 15 - Gestion du changement au sein d'une organisation
Cours 16 - Réaliser un impact avec l'open data
Une offre de e-formation dans un format webinaire, portée par Open Data France en partenariat avec INNIZ.
Afin de renforcer l’offre de formation disponible, OpenDataFrance propose une nouvelle offre de formation en ligne. L’accès à cette formation est gratuite pour toutes les collectivités locales mais les inscriptions sont obligatoires. La première session est ouverte depuis le 1 décembre 2021.
Comprendre les enjeux des collectivités vis-à-vis de la donnée
Identifier les ressources utiles pour démarrer une démarche Data au sein de sa collectivité
Acquérir les méthodes et outils pour engager des démarches opérationnelles
Parcours en ligne (vidéos, quizz, fil de discussion), environ 20h sur 1 mois
Tout agent public
Il n’y a pas de pré-requis en matière en connaissances techniques
Au cours de l’histoire, les plus grandes transformations se sont produites lorsqu’une ressource jusque-là rare est devenue abondante. Ces « révolutions » ont systématiquement généré de nouvelles structures sociales, de nouvelles formes de gouvernance, de nouvelles sources de richesse, de nouvelles opportunités. La révolution du web est à l’origine de l’une de ses transformations majeures avec la création exponentielle des données.
Comprendre la donnée et ses enjeux
Les enjeux de la donnée
Le glossaire autour des « Data »
Les obligations des collectivités territoriales
1er Quizz de la donnée
Exploitation des données : promesses et risques
Retour d’expérience sur une exploitation des données
L’intelligence artificielle : un enjeu de régulation
Organiser l’écosystème autour de la donnée
Qu’est-ce que la gouvernance des données ?
Les nouveaux métiers de la donnée
Définir une politique des données
La politique française d’ouverture des données
Frise chronologique de l’ouverture des données
La donnée au service du citoyen
S’engager dans l’opendata
L’enjeu de standardisation
2ème Quizz de la donnée
Voici la définition que donne le Larousse de l’agilité : Légèreté, souplesse dans les mouvements, Vivacité intellectuelle. De ces définitions, on en déduit que l’esprit agile d’une équipe, c’est sa capacité à appliquer des processus légers, disposer d’un flux de décision efficace, sa dynamique intellectuelle favorable à la créativité et à l’adaptation. Des conseils et des outils vous sont donnés pour comprendre et appliquer les valeurs de l’agilité.
Introduction à l’agilité
La démarche agile
Les rôles dans une équipe agile
Les rituels d’une équipe agile
1er Quizz de l’Agilité
Méthodologie appliquée
Le Design sprint
L’incubateur national
Méthodologie appliquée
Qu’est-ce que la datavisualisation ?
La datavisualisation en pratique
2ème Quizz de l’Agilité
Qu’est-ce que le « SMART » ?
Les enjeux de la donnée à l’échelle d’un territoire
Retours d’expérience : Smart City, Smart Village
La protection des données
La coopération et la mutualisation autour des données territoriales
La standardisation : pour aller plus loin
Droits et devoirs en matière d’algorithmes
L’opendata et la carto
Ce dispositif de formation est soutenu par la Direction Interministérielle du Numérique (DINUM) et l’Agence Nationale de la Cohésion des Territoires (ANCT), et co-financées par l’Europe dans la cadre du Plan de Relance 2021/2022.
Ces formations sont co-produites en partenariat avec la société INNIZ.
Quoi ? | Atelier créatif : à partir de données fournies pour l’occasion, concourir pour faire germer des idées d’usages innovants |
Qui ? |
|
Combien de temps ? | Préparation : Minimum une semaine Animation : Une journée minimum ; idéalement 2 jours nuit comprise. Suivi : tout dépend de vous... |
Qu’est-ce que cela produit ? |
|
Source : OpenDataFrance - Licence : CC-BY-SA
Version : v2.0, date : juin 2022
Dispositifs permettant d’engager le débat avec les citoyens à partir de données factuelles. Ils peuvent prendre la forme de tableaux de bord interactifs sur le site de la collectivité ou d'animations spécifiques avec la fourniture de données, brutes ou interprétées, pour étayer les débats et les décisions.
Des tableaux de bord et des représentations graphiques pédagogiques (dataviz) pour comprendre l'information obtenue grâce à une exploitation des données, même pour un public non initié
Des tableaux de bord "honnêtes", non biaisé ni manipulateurs
Des données justes, complètes, de qualité
Des données brutes associées et en open data (en entrée et en sortie)
Le dispositif >
Les données partagées >
Les résultats >
3.4 Observatoires nationaux
Couverture télécom
Crise sanitaire
Le document de consultation complet de la communauté d'agglomération de la Rochelle. Pour s'inspirer...
Source : OpenDataFrance - Licence : CC-BY-SA
Version : v2.0, date : juillet 2022
Un exemple de CCTP pour la mise en œuvre d'une solution de publication en open data.
Source : OpenDataFrance - Licence : CC-BY-SA
Version : v2.0, date : juillet 2022
Souvent ouvertes, les données environnementales foisonnent. Plusieurs projets remarquables de plateformes et observatoires émergent pour y accéder. Cependant, cette logique de l’offre est loin de croiser celle de l’usage et de l’appropriation massive et systématique de ces données à des fins de transition écologique. Par leur diversité, leur complexité, l’appropriation des données environnementales soulèvent plusieurs enjeux : Gouvernance, Médiation, Technique, Environnementaux, Sociaux.
Les données possèdent au fond un énorme potentiel et elles sont encore aujourd’hui trop peu mobilisés par les décideurs, aménageurs ou services publics alors qu’elles faciliteraient les choix et initiatives en matière de transition écologique.
L’objet de ce projet vise à passer d’une logique d’offre de donnée à une logique d’usage. En explorant les conditions d’amélioration, de qualité et de découvrabilité des données, ainsi qu’en facilitant leur appropriation par l’expérimentation, la standardisation et la documentation de leurs usages.
Partager diagnostics, expériences et inspirations, liés au potentiel de transformation des données environnementales en faveur de la transition écologique pour les territoires
Identifier les bases de données environnementales, qualifier leurs contenus et les conditions d’accès
Valoriser les cas d’usage où les données environnementales sont utilisées de façon exemplaire : indicateurs d’état, de pression, de réponse, outils de pilotage et de suivi des politiques publiques, etc.
Mettre à disposition des outils qui facilitent l’extraction et l’appropriation de ces données au niveau local en faveur de projets de transition
(Lien vers le site DataEditorial produit par OpenDataFrance)
Ce document a pour objet d’accompagner les agents des collectivités territoriales dans leur montée en compétences sur la visualisation et l’éditorialisation des données.
Il s'adresse plus particulièrement aux : Responsables communication web et print qui traitent des données
Journalistes territoriaux
Personnes en charge de l’ouverture des données publiques
Formateurs à l’open data
Ce document aborde la datavisualisation du point de vue des collectivités territoriales. Il propose une sélection de ressources sur :
Les enjeux de la datavisualisation
Les différents types de datavisualisation
Une méthodologie
Les bonnes pratiques
Une sélection d'outils et de plateformes "no code"
PA-AM 2 : Module complémentaire de formation proposé dans le cadre du Parcours Agents Métier, développé par ODF pour CultureD
Source : OpenDataFrance - Licence : CC-BY-SA Version : v0.1, date : oct. 2023
Il est proposé ici de s'approprier quelques fonctions avancées du logiciel bureautique Excel permettant des traitements dans un fichier tabulaire (d'ùo le nom de tableur).
Les exercices présentés içi sont des manipulations assez courantes lorsque l'on souhaite récupérer un fichier de données au format tabulaire, faire des traitements et produire de nouvelles à des fins de partage (interne ou externe).
Nous présentons ici un exemple à partir du logiciel Excel qui est très utilisé. Des fonctions à peu près équivalantes sont disponibles dans les autres tableurs du marché, modulo une syntaxe légèrement différente. Par exemple; la fonction =Somme(...) de Excel peut s'appeler =Sum(...) dans GoogleSheet ou LibreOffice)
Toute personne devant réaliseer des traitements un peu avancés avec un tableau de données sans utilisation de code (no code).
Ce module nécessite une première connaissance des fonctions basiques du tableur Excel. Le participant pourra s'appuyer sur la vidéo d'initiation suivante :
L'exercice peut être fait en 20 minutes.
le logiciel Excel de micosoft
le fichier de test nécessaire aux exercices
repérer le standard de données (schéma) qui normalise un tel jeu de données
Le participant pourra utilement rechercher dans des ressources gratuites en ligne des tutoriels présentation des fonctions avancées ici mobilisées (RechercheV,
Ouvrir le fichier « Contrôle_Subvention » au format csv avec LibreOffice. Choisir le format de séparateur qui permet une présentation de toutes les colonnes
Aide : à l'ouverture du fichier avec libreoffrice, utiliser le éparateur = Comma (qui veut dire « virgule ») puis sauvegarder au format excel.
Ouvrir le fichier Contrôle-Subvention.xls (format xls). Constater les erreurs : date incorrecte, ligne en doublon, nomination non homogène, identifiant incorrect, format des montants incorrects, codification incorrecte de la notification UE, format pourcentage incorrect (plus quelques autres erreurs que vous saurez repérer)
Remplacer la chaine de caractère « Ville de Poitiers » par « Poitiers ».
Aide : Edition/Rechercher/Remplacer
S’assurer que tous les libellés de nomAttribuant (ligne 1, colonne A) sont homogènes
Modifier l’affichage de la colonne idAttribuant (colonne B). Il s’agit d’un numéro de SIRET sur 14 caractères. Le faire apparaitre sous le forme non scientifique : xxxxxxxxxxxxxx.
Aide : sélection la colonne B, aller à Mise en Forme/Cellule, choisir Nombre, sans décimale et sans séparateur
Modifier le format d’affichage d’une date : Colonne DateConvention (C), sélection la/les dates incorrectes, modifier le format
Aide : sélection la colonne C, aller à Mise en Forme/Cellule, choisir Date, format 2012-03-14)
Mettre le SIRET au bon format d’affichage dans la colonne F (IdBeneficiaire). Détecter l’erreur (identifiant 32402138500000.0), d’où vient l’erreur ?
AIde : le format de la cellule est bien Nombre, sans décimale -qui serait séparée par une virgule- mais il a été rajouté un « .0 ». Il suffit de supprimer cette chaine de caractère)
colonne N (pourcentageSubvention), le schéma stipule numérique entre 0 (0%) et 1 (100%), séparateur « . » (point). Repérer les erreurs (>80, 100, 0,5). Corriger les valeurs
Aide : commencer par normaliser les formats dans la colonne, remplacer les «.» par «,», créer une nouvelle colonne temporaire O, insérer dans chaque cellule le calcul : =N$/100, copier par "remplacement les valeurs" calculées de la colonne O vers la colonne N. On peut supprimer alors la colonne O. Colonne N : remplacer le type de chaine de "Nombre" par "texte". Remplacer enfinles «,» par «.»
colonne notification_UE : constater la non-conformité des champs par rapport au schéma (on ne doit avoir que « oui » ou « non »). Trier les lignes et regrouper les lignes selon la valeur notification_UE (col. M)
Aide : Sélectionner toute la table (en Haut à Gauche), Données/Trier colonne notificationUE. Corriger les valeurs incorrecte (remplacer no par non, yes par oui).
Rappel : Appuyez-vous sur l’aide en ligne d’Excel pour trouver la syntaxe exacte des fonctions que vous utilisez.
Créer un nouveau champ Validation, qui possèdera les valeurs suivantes (liste fermée : Non validée, En cours, Validée). Ajouter aléatoirement les valeurs à chaque ligne
Aide : Données, Validation, Autoriser : liste, Liste déroulante dans la cellule, Sources : Validée; En cours; Non Validée
Créer des indicateurs :
Créer un nouvel onglet nommé Indicateur,
Insérer un graphique de type Barre
Représenter les colonnes G (Bénéficiaires) et Q (montant) sous forme de graphe
Mettez à jour les titres : du graphique, des axes
Adapter la présentation avant publication finale
Exporter le graphique au format image
Aide : créer une colonne de travail avec les montants au format numérique (donc avec des "," comme séparateur), trier les données suivant l'ordre croissant des montants attribués, sélectionner les plage G1:G14 et Q1:Q14, insérer un graphique de type barre. Cliquez sur les sections (le titre, le bloc de l'abscisse ou le bloc de l'axe horizontal) pour faire apparaitre les options, dans le cadre général (hors bloc), option : imprimer sous forme d'image.
Onglet : ex_subventions_corrigées
Ouvrir un fichier de type cvs et xsl avec l’outil Excel, s’adapter au format du fichier (séparateur de colonne et de ligne)
Manipuler les colonnes et des lignes pour un affichage adapté. Modifier l’affichage (cacher), faire des tris et de regroupement
Faire des calculs simples pour générer des indicateurs : totaux par catégorie (nombre ou somme)
Compléter les données par des informations externes : ajouter une géolocalisation à une adresse et inversement,
Contrôler la qualité des données
Manipuler les données pour des traitements avancées
Création d'un graophique simple et présentation
Il s’agit de s’approprier de nouvelles compétences, par la pratique et avec l’appui d’experts (coach). Ces MasterClass sont réservées à des agents publics issus des collectivités locales et ayant déjà une certaine connaissance des données publiques. Lors des MasterClass, ils approfondiront leurs connaissances, pratiqueront des outils, développeront leur autonomie sur la manipulation et la valorisation des données.
Cette MasterClass a comme objet la Datavisualisation. OpenDataFrance vous invite à venir vous perfectionner dans la manipulation des données et la production de datavisualisation.
2 jours intenses pour :
S’approprier les bonnes pratiques de la Dataviz
Découvrir et utiliser des outils indispensables dans le cycle de préparation des données
Vivre un cycle complet de projet de datavisualisation dans une expérience apprenante
Mettre en oeuvre un projet open data : principes et travaux pratiques.
Le support de formation a été produit pour une formation commandée par le CNFPT de Rhône-Alpes en juin 2019.
La session de formation est conçue pour se dérouler sur une journée, avec 20 participants max. se répartissant en 2 groupes de 10 lors des ateliers pratiques (à l'épreuve de la pratique, elle aurait pu avantageusement se dérouler sur 2 jours).
La journée de formation en présence doit être précédée d'une auto-formation en ligne, les semaines précédentes, via le MOOC "l'open data et vous" (co-rpoduit par le CEREMA, le CNFPT et OpenDataFrance).
Objecifs : comprendre les principes de la normalisation des jeux de données et l'utilité d'un outil comme Validata pour automatiser les tests de conformité au regard des standards existants, décrit dans le Socle Commun des Données Locales.
Document A3 : Tableau d'un jeu de donnée Subvention avec erreurs
Document A3 : Tableau d'un jeu de donnée Subvention avec erreurs corrigées
Ressources pédagogiques utiles pour nourrir le parcours d'acculturation à la données "Agents métier".
Source : OpenDataFrance - Licence : CC-BY-SA Version : v1.0, date : octobre 2023
Dans le cadre du programme , OpenDataFrance propose des parcours d'acculturation qui s'appuient sur des ressources pédagogiques généralement existantes, produites par OpenDataFrance ou d'autres acteurs. Des modules nous sont apparus comme manquant et nous les proposons içi.
Support de formation (niveau intermédiaire) : L’open data en pratique : identifier les étapes clés, faire vos premiers pas, animer pour stimuler les usages et encourager les (ré)utilisations
Archives des webinaires produits par OpenDataFrance en déc. 2021 et mars 2022
OpenDataFrance anime des émissions journalières pour sensibiliser les acteurs publics à la culture de la donnée. De nombreux aspects seront abordés : de la protection des données personnelles à l’exposition des données publiques en passant par les enjeux politiques, la dataviz, les algorithmes ou les contraintes techniques et juridiques du partage des données.
Retrouvez ici les présentations réalisées à l'occasion de la saison 1 (déc.21) et de la saison 2 (mars 22) : supports de présentation et conférences enregistrées (repaly).
Support de formation (niveau débutant) : le contexte général, le cadre réglementaire et les grands principes
Version : OpenDataFrance, juin. 2018, v1.0, Licence : CC-BY-SA
Historique des modifications : 1.0 : création du document
Règlement général sur la protection des données.
Ce guide est destiné à accompagner les organisations (collectivités territoriales, institutions, associations…) dans leur maîtrise de l’impact environnemental de la donnée. Il offre des pistes dans l’élaboration de plans d’actions pour un numérique responsable, sur son volet data. Il est conçu et proposé par OpenDataFrance et ses partenaires.
L’objectif de ce guide est, d’une part, de sensibiliser les différents acteurs aux impacts de certaines pratiques rencontrées au sein des organisations et, d’autre part, de partager des exemples de bonnes pratiques numérique responsable qui peuvent participer à la réduction de l’empreinte environnementale du numérique à travers ce prisme de la donnée ouverte et de ses services associés.
Au sein des organisations visées, le numérique ne concerne pas uniquement la direction du numérique. D'autres services transverses comme les achats, les ressources humaines, la communication, les services généraux, etc. sont également impliqués.
Ce guide s’adresse à un large public en relation avec les systèmes d’information tels administrateurs systèmes et réseaux, développeurs, acheteurs, mais aussi naturellement leurs usagers, les directions dites « métiers » et en premier lieu les décideurs.
Source : OpenDataFrance - Licence : CC-BY-SA
Version : v2.0, date : juillet 2022
Présentation du jeu sérieux : Un outil de coopération et de valorisation de données
Les explorateurs de données territoriales est un jeu de rôle qui propose de vivre une expérience de mobilisation de données à partir d’un scénario thématique (culture, transport, tourisme). Le maître du jeu raconte le début du projet et invite les participants à définir leur objectif, composer leur équipe et partir en quête de données.
Sur tous les territoires, la demande de formation « open data » est patente, mais les présentations longues des définitions, enjeux et outils sensibilisent, mais n’invitent pas à l’action. En s’appuyant sur la pédagogie par projet, le jeu invite à s’inscrire dans une situation concrète et favorise une mise en activité collective. La prise en main du scénario vise à créer une expérience enrichissante qui pourra ensuite être transférée sur le terrain.
Les explorateurs de données territoriales suit deux objectifs pédagogiques.
S'approprier de la démarche : Les séquences du jeu correspondent aux étapes-clefs d’une démarche d’ouverture des données. Elles invitent à se poser les questions essentielles et à mobiliser certains outils de référence.
Favoriser la Coopération : le jeu propose d’agir collectivement en incarnant des personnages et progressant à chaque étape. La coopération est au cœur du dispositif et constitue une manière différente d’aborder la place des données dans les projets. Le jeu incite à abandonner le « faut qu’on ouvre des données parce que c’est la loi », et suggère de passer à « ouvrons des données pour mieux travailler sur notre territoire ».
Les en Creative Common CC-BY-SA OpenDataFrance :
le jeu de 72 cartes
les trois scénarii (Données & transport, Données et Tourisme, Données et Culture)
le plateau du jeu (format A1 ou 8 pages A4)
les règles du jeu
la présentation générale du jeu
un guide portatif du maitre du jeu
Ce jeu nécessite des explications qui sont fournies lors des séances de formation « Formateurs open data » délivrées par OpenDataFrance.
Vous souhaitez acheter le jeu déjà imprimé ? Vous pouvez le faire en vous adressant à contact -at- opendatafrance.email
Jeu sérieux développé par le Conseil Départemental Haute-Garonne (31)
Dans la cadre de son offre d'accompagnement OpenDataLocale, le département de Haute-Garonne a développé un jeu sérieux pour sensibiliser les acteurs locaux à l'ouverture des données publiques.
Les supports sont librement accessibles ici. La licence d'utilisation est Creative Common CC-BY-SA
Ce module à pour objectif de donner un premier niveau de connaissance à l'ensemble des agents publics sur l'open data par un module de formation en ligne.
Source : CEREMA + CNFP Rhône-Alpes
Vous souhaitez en savoir en plus sur l'OpenData ?
Cette formation a été concue et produite par le CEREMA, le CNFPT Rhône-Alpes, la préfecture de région Auvergne-Rhone-Alpes et OpenDataFrance.
Cinq thèmes sont abordés dans cette formation en ligne :
la donnée au quotidien,
l'open data un enjeu de société,
open data et mission de service public,
vous et le cycle de vie de la donnée,
savoir trouver de la donnée
Ce module à pour objectif de donner un premier niveau de connaissance à l'ensemble des agents publics sur l'open data par un module de formation en ligne.
Le programme Transformation Numérique des territoires est soutenu par l’État et les associations d’élus.
L’État et les associations d’élus ont publié à l’occasion de la 2ème Conférence nationale des territoires, réunie à Cahors le 14 décembre 2017, leur programme de Développement Concerté de l’Administration Numérique Territoriale (DCANT) pour la période 2018-2020. Véritable feuille de route de la transformation numérique des territoires, ce programme a été entièrement co-écrit par les associations d’élus et les représentants des services de l’État autour d’une ambition partagée : construire ensemble des services publics numériques fluides et performants.
Lancé le 31 mai 2021 par la ministre de la Transformation et de la Fonction publiques et la ministre de la Cohésion des territoires et des Relations avec les collectivités territoriales pour une durée de 3 ans, le programme Transformation numérique des territoires (TNT) prend la suite du programme DCANT (développement concerté de l’administration numérique territoriale).
4 priorités ont été au cœur du programme DCANT 2018-2020 pour les territoires :
Construire un socle commun d’applications, de briques numériques, de référentiels et de cadres partagés pour accélérer la transformation numérique
Garantir une gouvernance partagée entre l’État et les collectivités territoriales de la transformation numérique
Contribuer à une approche globale de la donnée au service des politiques d’intérêt général
Faciliter le passage à l’échelle de l'administration numérique
DCANT publie chaque semaine un webinaire sur la transformation numérique des acteurs publics. Ceux qui sont relatifs à l'open data sont signalés dans la barre de menu.
Il est possible de retrouver tous les webinaires via la lien :
Les ressources réunies dans ce kit visent à faciliter les démarches d'ouverture de données des acteurs publics territoriaux. Elles ont été produites par OpenDataFrance dans le cadre du programme OpenDataLocale.
Il est possible d'accéder aux ressources référencées ici de plusieurs manières.
En recherchant un mot clé dans le menu de recherche du site
Par le menu de gauche qui présente les ressources par "collections" : Guides méthodologiques, Formations, Outillages, Services, etc.
En naviguant dans la galerie ci-dessous classée par ordre alphabétique :
Version : 1.0.1 Date : Septembre 2022 Rédacteur : OpenDataFrance - Jean-Marie Bourgogne Licence : CC-BY-SA
Ce programme est financé par les collectivités locales et avec le soutien de ses partenaires : la DINUM, l'ANCT et la Banque des Territoires.
Présentation du schéma “Le cycle de vie des données”
Source : OpenDataFrance - Licence : CC-BY-SA
Version : v2.0, date : mai 2022
Crédits : Document élaboré avec les partenaires des territoires d’expérimentation dans le cadre du sprint “cycle de vie des données” OpenDataLocale et en particulier les archives du CD83
Le cycle de vie des données présente le processus de production, d’utilisation et de conservation ou destruction des données dans une organisation. Il liste les différentes étapes et les acteurs intervenants. Le cycle de vie des données s’applique à l’ensemble des données des organisations. Il permet de repérer la manière d’utiliser les données en fonction de leurs caractéristiques et de préciser les différents usages des données en fonction de leur spécificité. Il présente les différentes interventions nécessaires tout au long de la vie des données dans et hors de l’organisation.
Il existe un cycle par usage. Une donnée peut donc appartenir à plusieurs cycles de vie.
Le schéma présente les différentes phases du cycle de vie. Il est un outil utile pour diffuser, auprès de tous, la bonne compréhension de la circulation des données au sein d’une organisation ainsi que les bonnes pratiques qui y sont attachées.
La première phase réside dans dans le choix, l’implémentation et/ou le paramétrage de l’application-métier. Ce premier choix est déterminant car il conditionne l’ensemble du processus d’acquisition et de gestion de la donnée. A l’heure de l’ouverture des données, une application qui ne permettrait qu’un export au format pdf, par exemple, compliquerait la tâche de mise à disposition du jeu de données.
Si la donnée est créée au moment où elle est saisie, cette dernière est conditionnée par les choix effectués en amont sur notamment l’application métier, dans les champs des formulaires. Lors de la phase de planification de la gestion des données, certaines décisions sont prises et déterminent la manière dont les données seront structurées. Le paramétrage de l’application métier conduit ainsi à la production de la structure générale de la base de données interne.
Les outils du SI contraignent la structuration des données. Par exemple : le nommage des champ, leur présence (obligatoire ou pas), le format et la codification de ces champs
Les choix qui sont effectués à cette étape ont des conséquences déterminantes sur le cycle de vie des données : cela a des implications sur la possibilité d’exporter des données et des métadonnées, et sur le choix du/des formats d’export (csv, xml, json...). La qualité des données est clairement un enjeu de cette phase car c’est à ce moment-là que sont définies les règles. L’application doit avant tout répondre aux besoins métiers tout en prenant en compte les besoins techniques et juridiques (archives, CNIL…). C’est à ce stade que la gouvernance est cruciale pour impliquer les personnes concernées et réaliser les bons arbitrages.
La phase d’acquisition de données correspond à la "production" de la donnée.
Les données peuvent être saisies manuellement par un producteur de données (un agent à l’Etat civil, par exemple), ou produites grâce à un capteur (comme lors du comptage du public dans un lieu). Dans le cas d’une captation automatique, représentée par la flèche marquée [1] sur le schéma, on importe des données issues d’une autre application. Les données peuvent donc être récupérées, via des protocoles informatiques, pour limiter la saisie manuelle d’informations existant déjà dans d’autres applications. Cela impose une parfaite correspondance entre l’objet décrit dans chaque champ, le nom et les valeurs possibles de ce champ. Par exemple : dans le cadre d’un marché public, la donnée “identification de l’acheteur” est le SIRET de l’acheteur, elle est donc normée de facto (suite unique de 14 chiffres pour chaque entité), en revanche le “nom de l’acheteur” doit être normalisé en définissant la règle de nommage à utiliser (Par exemple, on a le choix entre Conseil Départemental du Tarn, Département du Tarn, CD Tarn, CD81...). Il est possible de définir les caractères autorisés (majuscules en début de mot ou pour la totalité du mot, minuscules pour toute ou partie du mot, accents, etc.). L’arrêté du 14 avril 2017 relatif aux données essentielles dans la commande publique est un bon exemple de normalisation des données. C'est la question de la standardisation. A ce stade du cycle, il est fondamental que la saisie des données soit guidée. Car la saisie sans contrainte a une forte incidence sur l'hétérogénéité et la complétude, donc sur la qualité. La préparation de la phase de production, via du paramétrage et de la formation, est donc capitale pour la suite du cycle.
Le procédé de vérification et de contrôle qualité est nécessaire pour s’assurer de la fiabilité des données. Il peut prendre la forme de contrôles automatiques ou manuels (c’est pourquoi les procédures de la première phase doivent être réalisées avec précision et de façon exhaustive). Par exemple, dans le cas d’utilisateurs devant saisir manuellement des champs normalisés (tel qu’une date), une application bien paramétrée contraindra la saisie (le champ se présentera sous la forme de date définie : jj/mm/aaaa) ; à l’opposé, une application moins performante nécessitera un contrôle humain. Les phases T1 et T2 peuvent se répéter tant que la donnée n’est pas prête à être validée. La procédure-métier peut nécessiter des modifications, des traitements, des corrections ou des enrichissements.
Dans cette phase T3, iI s’agit de travailler à la validation-métier, sur le “fond”, de la donnée. Les étapes précédentes garantissent la validation sur la forme. Et ce n'est qu'à l'issue de cette phase de validation que la donnée est considérée fiable : elle peut alors être utilisée par le métier, partagée au sein de la collectivité et publiée en ligne à destination des citoyens et des organisations. L’exemple du budget est intéressant : dans une collectivité, chaque entité ou service fait sa demande de budget ; cette demande fait l’objet d’un arbitrage et les montants attribués peuvent être modifiés avant validation. La validation formalise le moment où la donnée correspond à une réalité, à une décision de la collectivité et où elle peut être publiée. Il est important que les outils permettent de figer les données une fois validées afin de garantir la fiabilité et la pérennité.
Le format des données dans la base métier peut ne pas être le même que le format d’export défini pour l’open data. Ce qui est important, c’est que la donnée disponible comporte toutes les informations nécessaires à son formatage open data : éléments nécessaires pour codifier une date, une entité juridique (SIRENE), une adresse ou une localisation (format de projection et niveau de précision), etc.
Juste après la validation, les données peuvent donc être utilisées par d’autres applications-métiers ou être publiées en ligne. Ici, il y a deux branches pour illustrer la diversité des usages :
La publication en open data qui consiste à donner un accès à des fichiers contenant des copies des données sur des sites web (ou portail) avec une licence (la Licence Ouverte ou Licence OdBL). Pour rendre en rendre l'exploitation possible, il est important que les données soient clairement présentées et documentées (métadonnées) et que les fichiers soient lisibles par des machines, dans des formats non propriétaires. Rappelons que la mise en ligne des données est une obligation pour les collectivités de plus de 3500 habitants et 50 agents (ETP) depuis la loi pour une république numérique, dite Loi Lemaire.
L'utilisation par une autre application : dans cette hypothèse, les données correspondent aux besoins de cette application ce qui impose, sur le fond, d’assurer la fiabilité, l’exhaustivité et la fraîcheur des données afin d’éviter de fausser les données de l’application de “destination”. Sur la forme, une standardisation sera la garantie d'une interopérabilité entre les deux applications et assurera qualité et homogénéité.
Pour être possible et facile à mettre en place, il est préférable de prévoir et d’anticiper cette phase de mise à disposition en vue de la réutilisation.
Le numérique laisse penser que tout peut être entreposé et gardé dans les serveurs informatiques sans limite de temps. Or, on ne peut pas tout conserver! Comme dans l’univers du papier, il faut savoir faire un tri. Ce tri consiste à faire le choix de conserver ou détruire certaines données. Il y a des lois qui encadrent la durée de conservation et qui définissent si les données doivent être détruites ou conservées définitivement. Cela dépend de la valeur des données :
la valeur juridique (combien de temps ai-je besoin de conserver pour prouver un délit ou, plus largement, prouver les actes),
la valeur informationnelle (pendant combien de temps ai-je besoin de l’information pour travailler),
la valeur patrimoniale (quand il n’y a plus de valeur juridique ou informationnelle, on l’évalue sous l’angle de la valeur patrimoniale : il est possible d’identifier intérêt pour l’histoire).
Point de vigilance : il peut être intéressant d’avoir réalisé le travail de recensement et d’évaluation de cette fin de cycle (conservation ou destruction) le plus en amont possible. En effet, dans l’environnement numérique, il est beaucoup plus difficile, voire impossible, de réaliser les actions d’“archives” si cela n’a pas été prévu en amont. Associer des compétences expertes sur cette dimension (archivistes) est essentiel.
NB : Les données publiées en open data sont généralement des copies (extrait, normalisation, agrégation) de données-métier. Les données-métier possèdent une logique d’archivage propre, établie en concertation entre les métiers, les archives et la DSI. A priori, il n’y a pas de nécessité absolu pour les données publiées en open data d'être archivées. Cependant, cette pratique est utile si l’on veut conserver l’historique et le contenu des données publiées à un moment donné. Cette décision doit être prise en concertation avec le service des Archives qui décidera de son intérêt juridique, opérationnel ou historique et de son coût.
Nombreux sont les acteurs, agents ou usagers de service public, qui jouent un rôle dans la production, la circulation et l'utilisation de la donnée. L’open data révèle l’importance de la gestion de la donnée (ou de sa gouvernance) durant tout son cycle de vie. Cela a des impacts fonctionnels et techniques mais également organisationnelle. L’amélioration des processus de gestion des données apporte des bénéfices importants à la collectivité dans la maîtrise de son patrimoine informationnel. Cela profite à tous et l’ouverture des données s’en trouve largement facilitée.
Source : OpenDataFrance - Licence : CC-BY-SA
Version : v2.0, date : juillet 2022
Comme vu dans la fiche “Les premières étapes pour s’engager dans une démarche d’ouverture des données”, les jeux de données, une fois recensés, peuvent être publiés sur le site web de la collectivité avec le répertoire des documents administratifs (dont le catalogue des données publiées). Il existe plusieurs dispositifs de publication :
le site internet de l’organisation,
les plates-formes de publication de données en open data.
La méthode la plus simple pour publier les données consiste à diffuser les jeux de données directement sur le site internet de la collectivité ou sur des plateformes collaboratives pour les données géographiques. Un tableur constituant le catalogue des données pourra être associé à des liens hypertextes permettant le téléchargement des fichiers. Les données pourront être centralisées au sein d’une rubrique du site internet ou sur une page de type “”. Cette méthode de publication est peu onéreuse, rapide à mettre en œuvre et permet de faire porter à connaissance les jeux de données au plus près des citoyens.
La publication sur une plate-forme de données permet une gestion plus fine pour la production de données (gestion des versions, des téléchargements, des statistiques, mise en place d’API...). Cela apporte des fonctionnalités avancées pour les réutilisateurs (recherche par métadonnées, déclaration des usages, datavisualisations…). Une telle plate-forme, sans nul doute, apporte plus de visibilité aux données publiées.
Ce type d’acquisition se fait plutôt dans le cadre de choix technologiques qui relèvent d’une montée en charge des usages avec des besoins grandissants en termes de réutilisation des données. La mise en place d’un entrepôt de données avec des fonctionnalités de multiformats, de web services (API), d’accès restreint ou temps réel, de visualisation de données s’avère de plus en plus fréquente au sein des collectivités au-dessus d’une certaine taille critique (EPCIs, métropoles, départements, régions…). Cette “mutation technologique” est souvent adossée à une stratégie accompagnant la transformation numérique du territoire, ou les données ouvertes et intelligentes sont un des leviers d’action (Open to Smart Data).
A partir du moment où les données sont hébergées sur une plate-forme, elles peuvent être publiées sur les autres plates-formes existantes. Par exemple, admettons que les données soient déposées sur une plate-forme régionale, celle-ci a très probablement mis des mécanismes pour que les données soient également publiées sur la plate-forme nationale , qui elle-même verse des données sur unes des plates-formes de données Europénnes comme . De tels exports de données s’appelle des versements ou des dépôts de données. L’opération inverse est le moissonnage de données, il s’agit d’une opération d’extraction de données. Le moissonnage peut être initié par une plateforme de niveau national (), de niveau inter-communal (région, département ou EPCI) ou par des tiers qui souhaitent collecter les données en open data.
Plusieurs acteurs privés peuvent proposer des prestations pour la fourniture d’une plateforme open data :
La plate-forme de données est clé en main et accessibles en mode “SaaS” (Software as a Service). Ce sont par exemple les solutions que proposent les sociétés OpendataSoft, Dat4Citizen ou autres ().
La plate-forme de données est sur la base de solutions Open Source:
CKan est vraisemblablement l’offre la plus mature et aboutie,
Udata est une solution développée par Etalab sur le même modèle que ,
DKan facilite la publication d’articles,
Plusieurs projets de collectivités ambitionnent de mutualiser les infrastructures et développements en versant et en documentant les codes sources sous licence libre. C’est ce que propose le syndicat mixte des Alpes maritimes, le Sictiam, avec la plateforme Ozwillo.
...
Il existe d’autres plates-formes nationales qui ont une vocation thématique : données du tourisme, données du transport, données culturelles… Quand elles sont publiques, ces plates-formes sont portées par des ministères. Elles ont l’ambition de mettre à disposition des données de qualité. Leurs démarches de publication reposent sur une valorisation du travail interne des producteurs de données, à l’image de ce que propose le Géoportail de l’Urbanisme qui recense les documents d’urbanisme selon des formats homogénéisés.
Outre cette obligation réglementaire, de nombreux acteurs en charges de compétences territoriales mutualisées proposent des plates-formes de dépôts de données. Il arrive que dans certains territoires, il puisse y avoir plusieurs plates-formes de ce type.
en région PACA, à partir de 2018, les portails de données géographiques et open data ont été mutualisés sur une même plate-forme.
Il est possible de publier les données sur une plate-forme existante. Elles sont soit nationales, soit locales. A minima, la collectivité ne devrait pas faire l'impasse de recenser systématiquement ses données sur ou sur une plate-forme locale. D'autant plus que, une fois déposées sur data.gouv, l'utilisation d’un script comme (open source et gratuit) peut permettre de créer une page web simple sur son site web qui présentera de façon très correcte les données déposées sur data.gouv.
La plate-forme nationale est une plate-forme multithématique, administrée par Etalab. Publier les données sur une telle plate-forme est une solution pérenne, opérationnelle et gratuite.
Pour les données géographiques, depuis août 2015, les communes peuvent s’appuyer sur leur région ou leur département, puisque ces dernières ont la charge de « la coordination, au moyen d’une plate-forme de services numériques qu’elle anime, de l’acquisition et de la mise à jour des données géographiques de référence nécessaires à la description détaillée de son territoire ainsi qu’à l’observation et à l’évaluation de ses politiques territoriales, données dont elle favorise l’accès et la réutilisation. » (Code Général des Collectivités Territoriales, art. L4211-1, al. 13, ). Ce type de plates-formes peuvent proposer des données en open data, voir accueillir des données non-géographiques. De telles plates-formes se sont constituées, entre autres, sous l’impulsion de la directive INSPIRE. Ainsi, elles appliquent des formes de publication tenant compte des standards et normalisations.
dans le Sud-Ouest, il y a pour les données géographiques sur le périmètre Nouvelle Aquitaine, les portails open data du département de la Gironde et de la métropole de Bordeaux de périmètres plus restreints ou encore un portail dédié aux données de l’offre de transport sur le pays Basque (français et espagnol).
Le choix d'une plateforme de publication est
Fonctionnalités | Site web | Data.gouv.fr | plate-forme dédiée |
Consultation et téléchargement des jeux de données | Oui | Oui | Oui |
Recherche avancée (filtres et facettes ; thématique, format, licence…) | Non | Oui | Oui |
Catalogue de données au format tableur | Oui | Oui | Oui |
Catalogue de données “expert” (export multi-formats, filtres) | Non | Non/Oui | Oui |
Fonctionnalités participatives : suivre un thème, une organisation, un jeu de données, déclarer une réutilisation, commenter, participer au forum..) | Non | Oui | Oui |
Entrepôt de données muti-formats | Non | Non/Oui | Oui |
API et web services | Non | Non/Oui | Oui |
Visualisation de données (graphiques, dataviz, cartographie) | Non | Non | Oui |
Statistiques d’usage | Non | Oui | Oui |
Workflow (gestion des révisions des metadonnées et des données, fork, crowdsourcing) | Non | Oui | Oui |