1.1 - Contexte

Pourquoi et à qui s'adresse ce guide ?

Ce référentiel est destiné à accompagner les organisations (collectivités territoriales, institutions, associations…) dans leur maîtrise de l’impact environnemental de la donnée. Il offre des pistes dans l’élaboration de plans d’actions pour un numérique responsable, sur son volet data. Il est conçu et proposé par OpenDataFrance et ses partenaires.

L’objectif de ce guide est, d’une part, de sensibiliser les différents acteurs aux impacts de certaines pratiques rencontrées au sein des organisations et, d’autre part, de partager des exemples de bonnes pratiques numérique responsable qui peuvent participer à la réduction de l’empreinte environnementale du numérique à travers ce prisme de la donnée ouverte et de ses services associés.

Au sein des organisations visées, le numérique ne concerne pas uniquement la direction du numérique. D'autres services transverses comme les achats, les ressources humaines, la communication, les services généraux, etc. sont également impliqués.

Ce guide s’adresse à un large public en relation avec les systèmes d’information tels administrateurs systèmes et réseaux, développeurs, acheteurs, mais aussi naturellement leurs usagers, les directions dites « métiers » et en premier lieu les décideurs.

Une production collective

Pour réfléchir à ces enjeux, identifier les bonnes pratiques actuelles et futures pour une gestion responsable des données, nous avons associé les collectivités territoriales dans un travail approfondi de collecte, de documentation et de propositions. Collectivités, experts et membres d'OpenDataFrance, ont été associés à ces travaux à travers différentes étapes :

  1. une phase de collecte des besoins des collectivités, à travers un support d'enquêtes et une série d'entretiens.

  2. une phase d’analyse critique des externalités négatives de la publication, du stockage, et de l'utilisation de données. Des ressources scientifiques et des entretiens auprès d'experts ont pu nourrir cette phase.

  3. une phase d’élaboration de propositions de bonnes pratiques discutées à travers une série d’ateliers.

  4. une phase de mise en consultation et d’enrichissement des bonnes pratiques.

Une production à itérer collectivement

Ce sujet de la sobriété et de la maîtrise de l'empreinte environnementale des données, ainsi que les outils disponibles à la mesure des impacts sont encore émergents. Afin de s'adapter au mieux à des effets non anticipés mais aussi à l'évolution des connaissances et ressources disponibles sur ce sujet, il est indispensable de paramétrer un suivi et des évolutions en fonction du contexte. Ce travail est une première brique pour penser la sobriété des données. Des itérations sont à proposer et à construire collectivement.

Actions engagées au sein des collectivités en 2021, résultat de l'enquête GreenData

En synthèse, l'enquête menée auprès de collectivités membres d'OpenDataFrance (30 répondants, donc pas généralisable), nous montre qu'en 2021, la majorité des répondants n'avaient pas encore engagés d'actions spécifiques pour limiter l'impact environnemental de leurs données et services associés.

A noter que la moitié d'entres elles environ, avaient engagées des actions notamment de développement d'API et d'utilisation de standards pour garantir la valorisation des données. Par ailleurs, de nombreuses pistes d'amélioration peuvent aider à mieux comprendre et limiter cet impact environnemental.

Pour des données ouvertes et maîtrisées

Quel numérique voulons-nous ?

Que ce soit pour les habitants usagers, agents des services ou les organisations elles-mêmes, le numérique déployé et utilisé aujourd’hui n’est pas soutenable. Les impacts éthiques, sociaux, environnementaux, ou encore de gouvernance, désormais largement connus, démontrent que ce numérique n’est pas adapté au monde de demain.

La transformation numérique de l'action publique est depuis longtemps à la recherche d'équilibres entre les gains de productivité et la qualité de services publics. Pour répondre à ces enjeux, il faut faire le choix d’innover pour longtemps et d’innover pour tous, en intégrant une forme de rationalité.

Nous le savons, le numérique (dont l'ouverture des données, sa mise à disposition et ses services associés), sont sources d'une empreinte environnementale non négligeable. Que ce soit majoritairement par les infrastructures et équipements nécessaires au déploiement de nouveaux services, ou encore aux ressources, dont l'eau et l'énergie, nécessaires à la disponibilité des services en continue, il est fondamental aujourd’hui d’aborder la question des services numériques en ayant une vision systémique de la maîtrise.

Ce travail propose d'explorer cette notion de maîtrise à trois niveaux:

  1. infrastructures et gestion de l'hébergement,

  2. la donnée et son cycle de vie,

  3. applications et services numériques proposés.

Ces trois dimensions identifiées offrent un large champ d'actions possibles. Nous proposons ici de les développer en 10 bonnes pratiques afin de maîtriser au mieux leurs impacts.

Impact environnemental du numérique, état des lieux

Malgré l'opacité des méthodes et des données utilisées pour estimer l'impact environnemental du numérique, la littérature sur ce sujet s'accorde à affirmer que la matérialité du numérique impacte l'environnement sur de nombreux secteurs, et ce de manière croissante. En voici quelques-uns :

  1. l'énergie : En 2021, le Shift Project évalue la part du numérique à 12% de la consommation totale d'électricité. La consommation notamment des réseaux mobiles (4G+) devrait selon NégaWatt augmenter de 10 % par an sur les 15 prochaines années. Dès lors, que ce soit pour les centres de données, le maintien de l'infrastructure réseau ou encore l'utilisation des terminaux utilisateurs, la question de l'énergie est cruciale. Pour les collectivités, il convient notamment de s'assurer que l'énergie requise pour ses centres de données s’inscrit dans un plan de transition énergétique et que des critères de sobriété sont respectés. A noter que la consommation d'électricité nécessaire pour faire fonctionner tous les appareils et infrastructures numériques devrait augmenter jusqu'à 80 % entre 2020 et 2030 (source).

  2. Gaz à effet de serre : le numérique représenterait 3 à 4 % des émissions de gaz à effet de serre (GES) dans le monde et 2,5 % de l’empreinte carbone nationale. Si rien n’est fait pour en réduire l’empreinte, ces émissions pourrait augmenter de manière significative : + 60 % d’ici à 2040, soit 6,7 % des émissions de GES nationales (pré-rapport de la mission d’information sur l’empreinte environnementale du numérique du Sénat),

  3. l'eau : 626 milliards de litres, c'est la quantité d'eau que les datacenters consommaient aux Etats-Unis en 2014. En France, peu de datacenters mobliseraient un refroidissement par circuit d'eau. Cependant, l’empreinte eau de la production d’électricité française serait de 4 L / kWh. Un impact indirect mais bien réel des besoins en ressource des centres de données.

  4. les déchets : 53 mégatonnes (Mt) de Déchets d’Équipements Électriques et Électroniques (DEEE) ont été générés dans le monde en 2020, 12 Mt était attribuable à la zone Europe, à hauteur de 16,2 kg par personne (Vanessa Forti et al. «The Global E-waste Monitor 2020: Quantities, flows and the circular economy potential », United Nations University (UNU).

    La production mondiale de déchets électroniques devrait augmenter de 100 % par rapport à 2014 et s'élever à 74 mégatonnes d'ici à 2030 (source).

Plusieurs leviers d'actions pour limiter l'impact environnementale du numérique :

Le cadre légal français, aussi rappelé dans ce guide "Bonnes pratiques numérique responsable pour les organisations" proposé par l'INR et la DINUM, incite les acteurs publiques et innovateurs à évaluer et maîtriser l'impact environnemental de leurs pratiques numériques. Que ce soit à travers la Loi relative à la lutte contre le gaspillage et à l’économie circulaire (AGEC) ou la Loi visant à réduire l’empreinte environnementale du numérique en France (REEN), il convient de s'outiller pour mesurer et ainsi maîtriser l'empreinte environnementale des données, de ses infrastructures et services associés.

Au-delà de la sensibilisation et de la maîtrise du renouvellement d'appareil, 2 dispositions visées par la Loi REEN sont utiles de rappeler ici :

  • Favoriser les stratégies numériques responsables dans les collectivités. Les communes et les EPCI de plus de 50 000 habitants devront avoir, d'ici 2024, défini une stratégie numérique indiquant les objectifs liés à la réduction de l’empreinte du numérique sur l’environnement, et les mesures mises en place pour les atteindre.

  • Promouvoir la sobriété des centres de données. Aller vers des centres de données et des réseaux moins énergivores. Faire émerger une régulation environnementale pour prévenir l’augmentation des consommations et émissions des réseaux et des centres de données. Cette disposition va dans le sens des Plans climat-air-énergie (PCAET) visant à réduire l’empreinte environnementale du numérique en intégrant par exemple le potentiel de récupération de chaleur des centres de données dans leur stratégie.

Ordre de grandeur de l'open data

Partout, les volumes de données produites et hébergées sont déjà significatifs, et les projections anticipent une augmentation non négligeable.

La production de donnée au niveau mondial est exponentielle. Portée par une explosion des usages, en 2020, les données générées, copiées et consommées en ligne est estimée à plus de 60 Zettabytes (1 zetta représente 1 milliard de terabytes).

Bien que ce volume soit essentiellement porté par une croissante forte du contenu vidéo et temps réel, la volumétrie seule n'est pas un indicateur suffisant d'impact du numérique.

Quel est l’impact sur le climat des usages numériques du quotidien ?

Datagir, porté par l'Ademe propose un service "Impact CO2" pour évaluer les émissions de CO2 liées aux usages du numérique et à la construction des appareils. Un outil basé sur des données de référence, la Base Carbone, une base de données publiques administrée par l'Ademe de facteurs d'émissions,.

Ce service permet de rendre compte de l'impact de différents secteurs dont le numérique sur l'empreinte environnementale. Une ressource utile pour garantir que les efforts et que les bons leviers sont mobiliser pour maîtriser et réduire l'empreinte carbone de nos pratiques.

source : https://impactco2.fr/usagenumerique

Cette accumulation de données se répercute sur les besoins hardware et en énergie. Ces besoins malgré les gains d’efficacité notamment de la consommation énergétique des infrastructures, peinent à compenser pleinement l'accroissement des usages. (voir : effet rebond, ressources du MOOC impacts environnementaux du numérique de l'INRIA).

En 2021, 14% des collectivités visées par la Loi République Numérique ont ouvert leurs données (voir Résultats de l'Observatoire OpenData). Environ 300 portails sont à ce jour ouverts et maintenus. Ils représenteraient un volume d'environ 50 To (source : opendatarchives.fr). Au-delà de ces données hébergées, les flux de données entre les portails opendata et les utilisateurs (services web, agent.e.s ...) sont eux aussi croissant. A titre d'exemple, le portail régional Data Grand Est (~10 To de donnée) aurait un flux de 80 Go/jour (données en cours de stabilisation).

Conscient du rapport d’échelle entre certaines données ouvertes publiées et d’autres données plus volumineuses traitées par les collectivités (temps réel, géographiques, données d'opérateurs de services urbains…), ce travail est une première brique pour penser la sobriété des données. Des itérations sont à proposer et à construire collectivement.

Se pose aussi aujourd'hui la question des traitements faits de ces données, notamment pour le développement d'IA. Depuis 2012, le nombre d’opérations nécessaire pour entraîner les modèles état de l’art de deep learning double tous les 3-4 mois (source). L'efficacité énergétique des data centers double tous les 3 ans seulement. D'où l'importance de réduire la taille des modèles, la taille des jeux de données, limiter la recherche d’hyper-paramètres ...

La question n'est pas de savoir quoi ouvrir, mais comment mieux le faire. Pourquoi multiplier les fichiers liés à un même jeu de données, laisser des informations redondantes, répliquer des données publiées par ailleurs...

Enfin, en rationalisant la gestion des données, en encourageant l’ouverture et la réutilisation limitant ainsi les duplications, l’Open Data est aussi une réponse à la maîtrise de l’impact environnemental du numérique. A nous de nous saisir de cette opportunité.

Version : 0.1.4 Date : Janvier 2023 Rédacteur : OpenDataFrance - Matthieu Brient Licence : CC-BY-SA

Ce programme est financé par les collectivités locales et avec le soutien de ses partenaires : la DINUM, l'ANCT et la Banque des Territoires.

Dernière mise à jour