Quelle(s) licence(s) choisir pour publier ses données publiques ? Le point sur le concept de licence et les préconisations actuelles pour faciliter l'accès aux données publiques.
Source : OpenDataFrance - Licence : CC-BY-SA
Version : v2.0, date : juillet 2022
Pour toute diffusion d’information, il est nécessaire de fixer un cadre juridique dans lequel se fait la mise à disposition des données ouvertes. On utilise pour cela une “licence” qui est attachée à chaque jeu de données.
Au carrefour du droit et de l’économie, les licences sont directement liées à la notion de propriété intellectuelle. Une licence est un document qui précise les droits et les devoirs des producteurs et des réutilisateurs de données. Elle présente la nature des engagements des parties prenantes dans le cas d’une collaboration ponctuelle ou récurrente. Elle crée ainsi un cadre qui assure la pérennité et la collaboration.
La démarche d’ouverture vise à faciliter la diffusion et la réutilisation des données publiques, sans faire de discrimination dans les possibles réutilisations. Le choix de la licence est donc fondamental. Un nombre réduit de licences sont aujourd’hui utilisées et recommandées par l’état.
Une licence ne s’applique pas à un portail open data, mais à un jeu de données. Par facilité, certains portails affichent une licence qui s’applique par défaut aux données publiées. Il est nécessaire de vérifier si certaines d’entres-elles ne sont pas régies par une licence spécifique (héritée par exemple de son régime initial de publication par un tiers).
Dans son rapport sur les redevances sur les données publiques, le magistrat de la cour des comptes Trojette souligne l’importance de ne pas noyer les utilisateurs dans les méandres de licences spécifiques : « dans un contexte de concurrence avec des données produites hors du service public, les contraintes ainsi imposées aux réutilisateurs doivent être aussi simples à appréhender et à accepter que possible : une jeune pousse du secteur des Big data, désireuse de réutiliser les données publiques de différentes administrations (et dans des pays différents) ne consentira pas à faire appel à un avocat pour étudier toutes les licences types non standards de l’administration.
Dès lors, l’administration devrait privilégier des licences-types auxquelles d’éventuelles licences spécifiques seraient automatiquement compatibles. Ces licences pourraient avoir l’avantage d’une formulation compatible avec les standards internationaux – pour la définition desquels la France a un rôle à jouer – et faire l’objet d’une traduction pour accroître l’attractivité des plateformes hors de France. »
Les licences libres sont apparues au milieu des années 1980, lorsque le droit d’auteur a été adapté et étendu aux logiciels.
C'est une licence qui s'applique à une œuvre de l'esprit par laquelle l'auteur concède tout ou partie des droits que lui confère le droit d'auteur, en laissant au minimum quatre droits considérés fondamentaux aux utilisateurs :
usage de l'œuvre ;
étude de l'œuvre pour comprendre son fonctionnement ou l'adapter à ses besoins ;
modification (amélioration, extension et transformation) ou incorporation de l'œuvre en une œuvre dérivée ;
redistribution de l'œuvre, c'est-à-dire sa diffusion à d'autres usagers, y compris commercialement.
Ces libertés peuvent être soumises à conditions, notamment l'application systématique de la même licence, ou d'une licence prodiguant les mêmes droits aux utilisateurs, aux copies de l'œuvre et aux œuvres dérivées : un principe nommé copyleft.
Les licences libres sont donc :
des contrats de licence non exclusive,
de droits de propriété intellectuelle
consentis pour le monde entier,
par lesquels un titulaire de droits autorise un licencié à copier, modifier, utiliser et distribuer des données (et plus généralement une création)
la notion de gratuité n’est pas directement liée à la licence, l’accès peut être gratuit ou pas.
Le succès d’une licence est rattaché à ses qualités intrinsèques, mais aussi à de multiples facteurs externes (ses “supporters” industriels ou communautaires, sa langue, les projets leaders, etc.).
Dans les faits, sauf cas exceptionnels, les collectivités choisiront leurs licences parmi celles homologuées par l’état.
A ce jour (déc.2018), il s’agit essentiellement de :
Licence Ouverte v2.0
ODbL
Dans la majorité des cas, la collectivité produit par elle-même, ou par un prestataire, les données qu’elle publie en open data. La règle générale recommandée par l’état est l’utilisation de la Licence Ouverte, qui est une licence simple et dite “permissive” car les réutilisations engendrent peu de contraintes.
Lorsque les données ont été produites dans le cadre d’une collaboration forte avec la société civile (contribution citoyenne) ou lorsque les données sont considérées comme un “bien commun informationnel”, il peut être légitime de protéger cette ressources en imposant un partage à l’identique, c’est à dire la contribution des réutilisateurs à l’enrichissement de ces données. C’est le sens général des licences de type “copy-left” et particulièrement de la licence ODbL.
Attention : la licence ODBL est plus restrictive, elle freine la réutilisation des données et elle peut engendrer des situations de blocages. Elle ne doit être utilisée qu'après une analyse approfondie du sens de la protection des données publiées sous un tel régime.
On distingue deux classes : les licences copyleft et les licences “permissives”.
Au sein d’une licence copyleft, ou Contributive, les contributions et modifications doivent être reversées sous la même licence (« obligation de réciprocité »).
Les licences permissives autorisent la diffusion de la création finale ou des contributions sous n’importe quelle autre licence tant que sont conservées certaines obligations généralement peu contraignantes (garder a minima le texte de la licence et indiquer le nom de l’auteur).
Il est nécessaire préciser clairement sous quelle licence les données utilisées et/ou mises à disposition sont utilisées et utilisables sur une plateforme.
Pour cela il faut donner le nom complet de la licence choisie (et si on le souhaite, son acronyme) ainsi qu’un résumé des droits et restrictions qu’elle suppose. Il est également nécessaire de donner accès au texte complet de la licence (via un lien hypertexte ou un document à télécharger / à consulter en ligne).
Il peut être utile de préciser à l’utilisateur de quelle manière il devra créditer la plateforme. On peut également mettre à disposition du code informatique permettant d’établir un lien et d’associer des métadonnées à l’œuvre ou aux données d’origine.
Afin d’éviter la prolifération des licences, la loi pour une République Numérique a prévu la création d’une liste, fixée par décret, de licences qui peuvent être utilisées par les administrations pour la réutilisation à titre gratuit de leurs informations publiques, qu’il s’agisse de données ou de code source d’un logiciel (article D.323-2-1 du code des relations entre le public et l’administration (CRPA)).
Source Etalab > https://www.data.gouv.fr/fr/licences
Lorsqu’ aucune licence prévue dans le décret ne répond aux besoins d’une administration et qu’elle souhaiterait recourir à une licence spécifique, cette licence devra être homologuée par l’Etat, en l’occurrence la DINSIC, selon les critères fixés par le décret.
Dans le cadre de la politique du Gouvernement en faveur de l’ouverture des données publiques, Etalab a conçu la « Licence Ouverte / Open Licence ». Cette licence, élaborée en concertation avec l’ensemble des acteurs concernés, facilite et encourage la réutilisation des données publiques mises à disposition gratuitement.
La publication du décret n° 2017-638 prévu par l’article L 323-2 du CRPA fait de la LO 2.0 la licence de référence pour les administrations pour la publication de données publiques, aux côtés de l’ODbL, et permet ainsi son utilisation par l’ensemble des administrations.
La « Licence Ouverte / Open Licence » présente les caractéristiques suivantes :
Une licence ouverte, libre et gratuite, qui apporte la sécurité juridique nécessaire aux producteurs et aux réutilisateurs des données publiques ;
Une licence qui promeut la réutilisation la plus large en autorisant la reproduction, la redistribution, l’adaptation et l’exploitation commerciale des données ;
Une licence qui s’inscrit dans un contexte international en étant compatible avec les standards des licences Open Data développées à l’étranger et notamment celles du gouvernement britannique (Open Government Licence) ainsi que les autres standards internationaux (ODC-BY, CC-BY 2.0).
Une exigence forte de transparence de la donnée et de qualité des sources en rendant obligatoire la mention de la paternité.
Une opportunité de mutualisation pour les autres données publiques en mettant en place un standard réutilisable par les collectivités territoriales qui souhaiteraient se lancer dans l’ouverture des données publiques.
Le logo de la « Licence Ouverte / Open Licence » est également librement réutilisable : https://www.etalab.gouv.fr/licence-ouverte-open-licence
Le texte de la licence : https://www.etalab.gouv.fr/wp-content/uploads/2017/04/ETALAB-Licence-Ouverte-v2.0.pdf
Pour l’essentiel, cette licence indique :
Le « Concédant » concède au « Réutilisateur » un droit non exclusif et gratuit de libre « Réutilisation » de l’« Information » objet de la présente licence, à des fins commerciales ou non, dans le monde entier et pour une durée illimitée, dans les conditions exprimées ci-dessous.Le « Réutilisateur » est libre de réutiliser l‘ « Information » :
de la reproduire, la copier,
de l‘adapter, la modifier, l‘extraire et la transformer, pour créer des « Informations dérivées », des produits ou des services,
de la communiquer, la diffuser, la redistribuer, la publier et la transmettre,
de l’exploiter à titre commercial, par exemple en la combinant avec d’autres informations, ou en l’incluant dans son propre produit ou application.
Sous réserve de :
mentionner la paternité de l’ « Information » : sa source (au moins le nom du « Concédant ») et la date de dernière mise à jour de l’ « Information » réutilisée.
Suivi de paragraphes relatifs :
aux données à caractère personnel,
aux droits de propriété intellectuelle,
à la responsabilité des producteurs et des réutilisateurs
à la compatibilité avec d’autres licences existantes
au droit applicable (français)
L'Open Database License (ODbL) est un contrat licence de base de données favorisant la libre circulation des données. Elle est issue du projet opendatacommons.org de l'Open Knowledge Foundation.
Source originale : https://opendatacommons.org/licenses/odbl/1-0/
Traduction française : http://vvlibri.org/fr/licence/odbl-10/legalcode/unofficial
ODbL est comparable à Licence Ouverte sur les points :
pas de responsabilité pour le producteur,
possibilité de complète réutilisation y compris à des fins commerciale,
sous réserve de respecter l'intégrité des données (ne pas les modifier, ne pas les détourner) et de citer la source (notion de paternité)
Elle ajoute cependant une notion très importante : Partage à l'identique (ou Share-Alike)
Elle est proche de la licence CC-BY-SA (BY pour paternité et SA pour Share-Alike), qui elle n'est pas homologuée puisque assez redondante avec OBdL. Certains continuent cependant à utiliser CC-BY-SA car elle inclut plus facilement la protection de ressources numériques qui ne sont à proprement parler des données : support multimédia (image, sons, vidéos, ..)
De nombreuses considérations et questions ont été précisées dans le document suivant :