Kit de ressources (old)
  • Description des ressources
  • 10 commandements de l'ouverture des données publiques
  • Fiches pratiques
    • Premiers pas
      • Comprendre le cycle de vie des données
      • Les données prioritaires
      • Préparer les données pour une publication en open data
      • Comment publier en open data en présence de données à caractère personnel
      • Documenter les données avant publication
      • Produire un fichier CSV de qualité
      • Choisir un portail open data
      • Comment publier un jeu de données sur data.gouv.fr
      • Comment afficher sur son site web des données publiées sur data.gouv.fr
    • Aspects juridiques
      • Choix des licences open data
      • Clauses à insérer dans les marchés publics
      • Guide pédagogique RGPD
      • Exemple de délibération en vue du lancement d’un projet open data dans une commune
      • Inventaire des lois en rapport avec l'open data
      • Foire aux questions sur la licence ODbL
      • Mentions légales pour un portail open data
    • Animations territoriales
      • Dataposition Agent/Elu
      • Identifier les collectivités de son périmètre d'intervention
      • Convention d'accompagnement
  • Exemple de documents
    • Cahiers de Charge AMO Data
    • Consultation pour un portail OpenData
    • Fiche de poste Chef de projet Data
  • Références
    • Prestataires Conseil en opendata
  • Fiches pédagogiques
    • Pour comprendre
      • Définition : les données
      • Les données ayant un caractère particulier
      • Définition : Les données ouvertes
      • Le glossaire de la donnée
      • Les acteurs publics nationaux de l’ouverture des données
      • Les acteurs associatifs de l’ouverture des données
      • Les acteurs économiques de l’ouverture des données
      • Les acteurs publics territoriaux de l’ouverture des données
      • Les métiers autour des données
    • Pour agir
      • Ouvrir les données pour la démocratie
      • Ouvrir les données pour la modernisation de l’action publique
      • Ouvrir les données pour l’innovation économique
      • Ouvrir les données : une obligation légale
      • Les premières étapes pour s’engager dans une démarche d’ouverture des données
      • Dispositifs de publication des données en open data
    • Pour animer
      • Les réutilisations de données
      • Les tiers-lieux et acteurs de la médiation numérique
      • Autres formats d’animation de l’ouverture des données
      • Hackathon
      • Infolab
      • Cartopartie
      • Animation territoriale Open data
      • Transparence, Concertation, Observatoire
    • A revoir
      • Recommandations pour favoriser l'interopérabilité des données open data
      • Jeux de données des communes les plus fréquemment ouverts
  • Supports de formation
    • L'ouverture des données publiques pour et par les collectivités territoriales
    • Archives
      • Comprendre l'open data
      • Mener un projet d'ouverture de données dans ma collectivité
  • Jeux sérieux
    • Les explorateurs des données territoriales
    • Belle Colline
    • Datopolis
  • Formations en ligne
    • Webinaires DCANT
      • Webinaire DCANT #5 - Comment mettre en œuvre l'open data dans les territoires
      • Webinaire DCANT #10 - RGPD et collectivités territoriales
      • Webinaire DCANT #13 - Moissonnage des données territoriales sur datagouv
    • L'open data et vous (CEREMA/CNFPT/ODF)
    • Programme e-Learning du Portail Européen de Données
    • Webinaire "La data dans les territoires"
  • Ressources complémentaires
    • Fiches OpenDataLab (Occitanie)
    • Etude Cycle de la donnée et transformation du SI (FNCCR)
    • Guide pratique opendata du ministère de la culture
    • Infolab.io (Fing)
    • Open Data Canvas
    • 1, 2, 3 data, expérimenter !
  • Vidéos pédagogiques tierces
    • Le b.a.-ba de la donnée
    • L'open data à la loupe
    • Grand Lyon Data
    • Open data et secteur public
  • RGPD - Protection des données personnelles
    • L'atelier RGPD de la CNIL
    • Kit RGPD de Mégalis Bretagne
  • Espace ressources partenaires
    • INET
Powered by GitBook
On this page
  • API (application programming interface) ou interface de programmation, ou web service
  • Algorithme
  • Base de données
  • Big Data ou grandes données
  • CSV (Comma Separated Values)
  • Crowdsourcing ou production participative
  • Données liées / Web sémantique (Linked Data)
  • Données de référence
  • GAFAM
  • Interopérables
  • Jeu de données (dataset)
  • Licence
  • Data mining ou fouille de données
  • Datavisualisation ou “Dataviz”
  • Documents administratifs
  • Droit de communication
  • Métadonnée
  • Mission de service public
  • Quantified self (mesure de soi)
  • Self data
  • Service public de la donnée
  1. Fiches pédagogiques
  2. Pour comprendre

Le glossaire de la donnée

API (application programming interface) ou interface de programmation, ou web service

C’est une interface de dialogue, technique et normalisée, qui permet d’échanger des informations et des services entre machines. Une API permet à un service de fournir des données de façon standardisée. Une API peut renvoyer les coordonnées GPS d'une adresse postale donnée par exemple la Base d’Adresse Nationale Ouverte.

Algorithme

Un algorithme est une méthode de traitement des données . Ce traitement est automatisé : la machine l'effectue à partir de données et en produit d’autres (composante technique). Ce traitement est produit par une personne ou un service en fonction d'un objectif (composante sociale). Par exemple, le calcul du jour de la semaine pour une date donnée. La loi pour une République numérique impose la mention de la finalité d’un traitement algorithmique.

Base de données

C’est un ensemble de données organisé dans le but de faciliter leur usage . Une base de données contient un ensemble d’informations structurées permettant de les stocker pour opérer des traitements et fournir des services.

Big Data ou grandes données

Cette expression désigne un ensemble de données très volumineux qui doit être traité par des outils spécifiques.

CSV (Comma Separated Values)

Le csv est un nom d’un format de fichier contenant des données textuelles. Les données sont lisibles par un très grand nombre d’outils : les tableurs, les éditeurs de texte... L’organisation du fichier étant répandue et simple, elle peut être plus facilement traitée par un programme.

Crowdsourcing ou production participative

Données liées / Web sémantique (Linked Data)

On appelle web sémantique l’extension du web traditionnel pour permettre à toute donnée d’être publiée et documentée de façon standard. Les données liées, c’est la possibilité d’attribuer une adresse à un objet, une URI, et de pouvoir pointer vers elle de façon fixe. Il s’agit de créer une clef qui permet d’aller chercher l’objet et d’y faire référence. Par exemple, Wikidata permet de donner accès à des données de base (dates de naissance, capitale d’un pays...).

Données de référence

Dans le cadre du Service Public de la Donnée, les données de référence sont précisées par l’article 14 de la Loi Pour une République Numérique. Les données de référence sont des informations publiques qui satisfont les conditions suivantes :

  • Elles constituent une référence commune pour nommer ou identifier des produits, des services, des territoires ou des personnes ;

  • Elles sont réutilisées fréquemment par des personnes publiques ou privées autres que l'administration qui les détient ;

  • Leur réutilisation nécessite qu'elles soient mises à disposition avec un niveau élevé de qualité.

Un décret dresse la liste des données de références, ainsi que l'administration responsable de leurs conditions de production et de publication. La Base Adresse Nationale, la base Siren, le Répertoire Opérationnel des Métiers et des Emplois (code ROME produit par Pôle Emploi) sont des données de référence.

GAFAM

C’est l’abréviation de Google, Amazon, Facebook, Apple, Microsoft : il s’agit des entreprises les plus puissantes de l’internet et accessoirement celles qui détiennent et/ou manipulent le plus de données.

Interopérables

Le terme interopérable désigne le fait que deux systèmes techniques peuvent s’échanger aisément des données. Plus les systèmes respectent les normes et les standards ouverts, plus ils sont interopérables.

Jeu de données (dataset)

Un jeu de données est un ensemble de données qui forme un tout. Par exemple, la liste de présence des conseillers municipaux lors des assemblées en 2012, est un jeu de données.

Licence

Une licence est un contrat qui précise les conditions de réutilisation d’un jeu de données. Par exemple, des données sous licence ODBL ou Licence Ouverte sont réputées en open data.

Data mining ou fouille de données

La fouille de données consiste en l’exploration de masse de données issues de documents ou base de données pour les analyser à partir de méthodes comme la statistique, un traitement automatisé/algorithmique, une intelligence artificielle. L’objectif de cette analyse est de comprendre, résoudre ou encore prévoir des actions.

Datavisualisation ou “Dataviz”

Il s’agit de représentation graphique de données. Quelques formes simples et connues de visualisation de données sont le “camembert”, l’histogramme, le nuage de points. La visualisation de données peut s’appuyer sur différentes sources de données. Elle a pour objectif de rendre les données plus lisibles et compréhensibles.

Documents administratifs

(voir Pour Comprendre Fiche 1 - Définition : les données)

Droit de communication

Les administrations sont tenues de publier en ligne ou de communiquer les documents administratifs qu'elles détiennent aux personnes qui en font la demande. Cela ne s'applique qu'à des documents achevés et ne concerne pas les documents préparatoires à une décision administrative tant qu'elle est en cours d'élaboration. Dans le cas où la demande permet de bénéficier d'une décision individuelle créatrice de droits, les documents sont communicables à l'auteur de cette demande dès leur envoi à l'autorité compétente pour statuer sur la demande. Le droit de communication perdure, même si le document est déposé aux archives. Le droit de communication cesse lorsque les documents font l'objet d'une diffusion publique.

Métadonnée

Une métadonnée est une information descriptive liée à une donnée. Par exemple, la date de production de la donnée, son producteur, son format, sa licence constituent des métadonnées. Pour qu’un jeu de données soit facilement accessible et réutilisable, la qualité des métadonnées joue un rôle déterminant.

Mission de service public

Une mission de service public est une action menée par une administration pour satisfaire l’intérêt général. Il peut s’agir de service public administratif ou d’un service public industriel et commercial. La jurisprudence a établi un faisceau d’indices permettant de déterminer si l’on est en présence d’un service public :

  • une activité d’intérêt général,

  • la présence directe ou indirecte d’une administration,

  • la présence de prérogatives de puissance publique,

  • les modalités de financement public.

Pour approfondir la notion, le wiki du CNFPT : https://frama.link/Def-servicepublic-cnfpt

Quantified self (mesure de soi)

Self data

Le self data désigne la production, l’exploitation et le partage de données personnelles par les individus, sous leur contrôle et à leurs propres fins : pour mieux se connaître, prendre de meilleurs décisions, se faciliter la vie, etc.

Service public de la donnée

PreviousDéfinition : Les données ouvertesNextLes acteurs publics nationaux de l’ouverture des données

Last updated 6 years ago

C’est l'utilisation de la créativité, de l'intelligence et du savoir-faire d'un grand nombre de personnes, en sous-traitance, pour réaliser certaines tâches traditionnellement effectuées par un employé ou un entrepreneur (Wikipédia juillet 2017 : ). Par exemple, les contenus de Wikipédia et d’Open Street Map sont réalisés en crowdsourcing.

C’est un mouvement qui regroupe les outils, les principes et les méthodes permettant à chacun de mesurer ses données personnelles, de les analyser et éventuellement de les partager. Les outils du quantified self peuvent être des objets connectés, des applications mobiles ou des applications Web (Wikipédia juillet 2017 : ). Le fait de mesurer le nombre de pas effectués par jour constitue une pratique de quantified self.

Le service public de la donnée créé par l’Article 14 de la loi pour une République numérique vise à mettre à disposition, en vue de faciliter leur réutilisation, les jeux de données de référence qui présentent le plus fort impact économique et social. Il s’adresse principalement aux entreprises et aux administrations pour qui la disponibilité d’une donnée de qualité est critique. Les producteurs et les diffuseurs prennent des engagements auprès de ces utilisateurs. La mission Etalab est chargée de la mise en oeuvre et de la gouvernance de ce nouveau service public. Elle référence l’ensemble des données concernées (Extrait : ).

https://fr.wikipedia.org/wiki/Production_participative
https://fr.wikipedia.org/wiki/Quantified_self
https://www.data.gouv.fr/fr/reference