Editorialisation des données publiques
  • 👣LA DATAVISUALISATION PAS A PAS
  • 1️Définition, contexte et enjeux de la datavisualisation
    • 1️⃣Datavisualisation, infographie, tableau de bord...
    • 2️⃣Les enjeux de la datavisualisation pour les collectivités
    • 3️⃣Les trois composantes d'une dataviz réussie
    • 4️⃣La dataviz, une histoire ancienne
  • 2️Les grandes familles de dataviz
    • Une sélection de datavisualisations
    • 1️⃣Représenter une répartition, les parties d'un tout
      • Le camembert
      • Les variations autour du camembert
      • Les graphiques en barres
      • Le compartimentage
      • Graphique en bulles
      • Icônes / surfaces
    • 2️⃣Représenter une évolution dans le temps
      • Histogramme
      • Courbes et lignes
      • Répétition de graphiques
    • 3️⃣Représenter des relations entre les données
      • Diagramme de Sankey
      • Diagramme de Venn
      • Diagramme circulaire
      • Carte de chaleur
  • 3️Mettre en oeuvre son projet dataviz
    • 1️⃣Les 4 grandes étapes
    • 2️⃣Des outils pour préparer les données
    • 3️⃣Dataviz statique ou dynamique ?
    • 4️⃣Dataviz exploratoire ou explicative ?
    • 5️⃣Choisir des couleurs adaptées
      • Minimiser le nombre de couleurs
      • Des outils pour choisir les couleurs
    • 6️⃣Etre guidé dans le choix du type de dataviz
      • Dataviz catalogue
      • Dataviz project
      • From data to viz
  • 4️10 points de vigilance
    • 1️⃣Bien dimensionner son graphique
    • 2️⃣Une échelle régulière
    • 3️⃣Privilégier un axe des Y à zéro
    • 4️⃣Trier les données
    • 5️⃣Pas de donnée ou valeur à zéro ?
    • 6️⃣Fournir un contexte
    • 7️⃣Comparer ce qui est comparable
    • 8️⃣Ne pas confondre corrélation et causalité
    • 9️⃣Limite des représentations surfaciques
    • 🔟Contexte de diffusion et mobile
  • DOCUMENTATION OPENDATAFRANCE
    • Plaquette / Poster DViz
    • Galerie de datavisualisations inspirantes
    • Plateformes et outils de dataviz disponibles
      • Panorama des outils
      • Sélection d'outils
  • Autres ressources
    • Sites internet et Twitosphère
    • Quelques ouvrages en français
    • Présentations et webinaires
    • Guide UE : faire des dataviz de qualité
    • Cartographie
Propulsé par GitBook
Sur cette page
Exporter en PDF
  1. Mettre en oeuvre son projet dataviz

Des outils pour préparer les données

PrécédentLes 4 grandes étapesSuivantDataviz statique ou dynamique ?

Dernière mise à jour il y a 2 ans

Le travail de préparation des données avant de créer la dataviz est, de loin, l'étape la plus longue. deux grands cas de figure sont à distinguer :

  1. Les données fournies sont brutes et n'ont pas fait encore l'objet d'une publication en open data. L'exploitation des données aura alors comme préalable un (laborieux) travail d'extraction, de nettoyage et de contrôle de qualité des données.

  2. Les données ont été publiées et respectent a minima les règles de lisibilité des données par une machine. Il s'agira alors de traiter les données pour les adaptera au message que l'on souhaite passer et/ou de les organiser pour les rendre exploitables par le logiciel de datavisualisation.

Pour connaitre les principales erreurs et les méthodes pour les éliminer on renverra vers ce guide réalisé par de mise en qualité des données et le "sprint qualité" proposé pour y remédier.

Quelques exemples dans la préparation des données :

  • Regroupement de catégories trop nombreuses pour être représentées de manière lisible

  • Distinction des valeurs zéro des valeurs manquantes

  • Reformulation de libellés pour les rendre compréhensibles par un large public

  • Elimination de colonnes inutiles dans l'optique de la dataviz

  • Adaptation de nomenclatures pour les adapter à l'outil de datavisualisation. Par exemple l'écriture des dénominations de communes (avec tiret, sans tiret pour les noms composés, présence ou pas de caractères spéciaux...) permettant de générer une carte varie d'un outil à l'autre.

  • Organisation des données pour les rendre compatibles avec la datavisualisation choisie

On peut partir de l'organisation des données et du nombre de variables pour trouver les datavizs adaptées

Pour nettoyer les données comme pour les organiser, un outil s'impose, il s'agit d'OpenRefine. A l'origine créé par Google, OpenRefine est désormais un logiciel libre avec une traduction française. Beaucoup plus puissant qu'Excel et a pour particularité de garder la trace de toutes les modifications opérées -l'accès au fichier initial reste toujours possible - voire de les enregistrer pour être "rejouées" sur un jeu de données similaires. On renverra vers ce .

3️
2️⃣
tutoriel récent et en Français
👍
l'infolab de la fing
A partir de l'organisation des données (input) aiguille vers les datavisualisations adaptées
le site Datavizproject