Choix des licences open data

Quelle(s) licence(s) choisir pour publier ses données publiques ?

Version : OpenDataFrance, jan. 2018, v1.0, Licence : CC-BY-SA Crédit : Les essentiels (Vincent Kober, Territorial edition, déc.17) / Etalab / Inno3 (Benjamin Jean) / Synaltic /

Historique des modifications : 1.0 : version initiale

Qu’est-ce une licence ?

Les finalités

Pour toute diffusion d’information, il est nécessaire de fixer un cadre juridique dans lequel se fait la mise à disposition des données ouvertes. On utilise pour cela une “licence” qui est attachée à chaque jeu de données.

Une licence est un document qui précise les droits et les devoirs des producteurs et des réutilisateurs de données. Elle présente la nature des engagements des parties prenantes dans le cas d’une collaboration ponctuelle ou récurrente. Elle crée ainsi un cadre qui assure la pérennité et la collaboration (par les droits qui sont ménagés). Au carrefour du droit et de l’économie, les licences sont directement liées à la notion de propriété intellectuelle.

En d’autres termes, la licence expose les droits qui sont partagés et les conditions associées à leur usage, en l’absence d’un contrat “à priori” (avant l’accès) et bilatéral (tout le monde peut en disposer librement).

La démarche d’ouverture vise à faciliter la diffusion et la réutilisation des données publiques, sans faire de discrimination envers tel ou tel usager ou usage. Le choix de la licence est donc très important : elle rassure des réutilisateurs potentiels et favorise ainsi l’exploitation et la réutilisation des données par le plus grand nombre. Pour cette raison, un nombre réduit de licences sont aujourd’hui utilisées et recommandées par l’état.

une licence ne s’applique pas à un portail open data, mais à un jeu de données. Par facilité, certains portails affichent une licence qui s’applique par défaut aux données publiées. Il est nécessaire de vérifier si certaines d’entres-elles ne sont pas régies par une licence spécifique (héritée par exemple de son régime initial de publication par un tiers).

Dans son rapport sur les redevances sur les données publiques, le magistrat de la cour des comptes Trojette souligne l’importance de ne pas noyer les utilisateurs dans les méandres de licences spécifiques : « dans un contexte de concurrence avec des données produites hors du service public, les contraintes ainsi imposées aux réutilisateurs doivent être aussi simples à appréhender et à accepter que possible : une jeune pousse du secteur des Big data, désireuse de réutiliser les données publiques de différentes administrations (et dans des pays différents) ne consentira pas à faire appel à un avocat pour étudier toutes les licences types non standards de l’administration.

Dès lors, l’administration devrait privilégier des licences-types auxquelles d’éventuelles licences spécifiques seraient automatiquement compatibles. Ces licences pourraient avoir l’avantage d’une formulation compatible avec les standards internationaux – pour la définition desquels la France a un rôle à jouer – et faire l’objet d’une traduction pour accroître l’attractivité des plateformes hors de France. »

Les licences “libres”

Les licences libres sont apparues au milieu des années 1980, lorsque le droit d’auteur a été adapté et étendu aux logiciels. L’usage d’une licence libre caractérise une certaine façon pour l’auteur d’exploiter ses droits. Elles portent essentiellement sur le droit d’auteur, mais elles se sont adaptées aux évolutions des différents droits de propriété intellectuelle. En pratique, on peut en dénombrer plusieurs centaines. Toutes ne sont pas certifiées, les auteurs des licences peuvent les faire évoluer (plusieurs versions coexistent alors) et les utilisateurs choisissent parfois de les adapter à leurs besoins.

Aujourd’hui, la multiplication des textes est déconseillée dans la sphère communautaire, compte tenu des situations d’incompatibilité que cette prolifération génère (la combinaison de plusieurs composants devenant impossible à cause de leur licence respective).

Nous présentons ci-après les principes fondateurs des licences utilisées dans l’open data.

Définition

Une licence libre est une licence s'appliquant à une œuvre de l'esprit par laquelle l'auteur concède tout ou partie des droits que lui confère le droit d'auteur, en laissant au minimum quatre droits considérés fondamentaux aux utilisateurs :

  • usage de l'œuvre ;

  • étude de l'œuvre pour comprendre son fonctionnement ou l'adapter à ses besoins ;

  • modification (amélioration, extension et transformation) ou incorporation de l'œuvre en une œuvre dérivée ;

  • redistribution de l'œuvre, c'est-à-dire sa diffusion à d'autres usagers, y compris commercialement.

Ces libertés peuvent être soumises à conditions, notamment l'application systématique de la même licence, ou d'une licence prodiguant les mêmes droits aux utilisateurs, aux copies de l'œuvre et aux œuvres dérivées : un principe nommé copyleft.

Les licences libres sont donc :

  • des contrats de licence non exclusive,

  • de droits de propriété intellectuelle

  • consentis pour le monde entier,

  • et toute la durée des droits

  • par lesquels un titulaire de droits autorise un licencié à copier, modifier, utiliser et distribuer des données (et plus généralement une création)

la notion de gratuité n’est pas directement liée à la licence, l’accès peut être gratuit ou pas.

Le succès d’une licence est rattaché à ses qualités intrinsèques, mais aussi à de multiples facteurs externes (ses “supporters” industriels ou communautaires, sa langue, les projets leaders, etc.).

Choix des licences

Dans les faits, sauf cas exceptionnels, les collectivités choisiront leurs licences parmi celles homologuées par l’état.

A ce jour (déc.2018), il s’agit essentiellement de :

  • Licence Ouverte v2.0

  • ODbL

Dans la majorité des cas, la collectivité produit par elle-même, ou par un prestataire, les données qu’elle publie en open data. La règle générale recommandée par l’état est l’utilisation de la Licence Ouverte, qui est une licence simple et dite “permissive” car les réutilisations engendrent peu de contraintes.

Lorsques les données ont été produites dans le cadre d’une collaboration forte avec la société civile (contribution citoyenne) ou lorsque les données sont considérées comme un “bien commun informationnel”, il peut être légitime de protéger cette ressources en imposant un partage à l’identique, c’est à dire la contribution des réutilisateurs à l’enrichissement de ces données. C’est le sens général des licences de type “copy-left” et particulièrement de la licence ODbL.

Attention : la licence ODBL est plus restrictive, elle freine la réutilisation des données et elle peut engendrer des situations de blocages. Elle ne doit être utilisée qu'après une analyse approfondie du sens de la protection des données publiées sous un tel régime.

Licences Contributives versus Permissives

On distingue deux classes : les licences copyleft et les licences “permissives”.

  • Au sein d’une licence copyleft, ou Contributive, les contributions et modifications doivent être reversées sous la même licence (« obligation de réciprocité »).

  • Les licences permissives autorisent la diffusion de la création finale ou des contributions sous n’importe quelle autre licence tant que sont conservées certaines obligations généralement peu contraignantes (garder a minima le texte de la licence et indiquer le nom de l’auteur).

Règles et usages à respecter

Il est nécessaire préciser clairement sous quelle licence les données utilisées et/ou mises à disposition sont utilisées et utilisables sur une plateforme.

Pour cela il faut donner le nom complet de la licence choisie (et si on le souhaite, son acronyme) ainsi qu’un résumé des droits et restrictions qu’elle suppose. Il est également nécessaire de donner accès au texte complet de la licence (via un lien hypertexte ou un document à télécharger / à consulter en ligne).

Il peut être utile de préciser à l’utilisateur de quelle manière il devra créditer la plateforme. On peut également mettre à disposition du code informatique permettant d’établir un lien et d’associer des métadonnées à l’œuvre ou aux données d’origine.

Présentation des licences homologuées

Réduction du nombre de licences homologuéesAfin d’éviter la prolifération des licences, la loi pour une République Numérique a prévu la création d’une liste, fixée par décret, de licences qui peuvent être utilisées par les administrations pour la réutilisation à titre gratuit de leurs informations publiques, qu’il s’agisse de données ou de code source d’un logiciel (article D.323-2-1 du code des relations entre le public et l’administration (CRPA)).

Décret n° 2017-638 du 27 avril 2017 relatif aux licences de réutilisation à titre gratuit des informations publiques et aux modalités de leur homologation

Source Etalab > https://www.data.gouv.fr/fr/licences

Lorsqu’ aucune licence prévue dans le décret ne répond aux besoins d’une administration et qu’elle souhaiterait recourir à une licence spécifique, cette licence devra être homologuée par l’Etat, en l’occurrence la DINSIC, selon les critères fixés par le décret.

Licence Ouverte

Dans le cadre de la politique du Gouvernement en faveur de l’ouverture des données publiques (« Open Data »), Etalab a conçu la « Licence Ouverte / Open Licence ». Cette licence, élaborée en concertation avec l’ensemble des acteurs concernés, facilite et encourage la réutilisation des données publiques mises à disposition gratuitement.

La publication du décret n° 2017-638 prévu par l’article L 323-2 du CRPA fait de la LO 2.0 la licence de référence pour les administrations pour la publication de données publiques, aux côtés de l’ODbL, et permet ainsi son utilisation par l’ensemble des administrations.

La « Licence Ouverte / Open Licence » présente les caractéristiques suivantes :

  • Une grande liberté de réutilisation des informations :

    • Une licence ouverte, libre et gratuite, qui apporte la sécurité juridique nécessaire aux producteurs et aux réutilisateurs des données publiques ;

    • Une licence qui promeut la réutilisation la plus large en autorisant la reproduction, la redistribution, l’adaptation et l’exploitation commerciale des données ;

    • Une licence qui s’inscrit dans un contexte international en étant compatible avec les standards des licences Open Data développées à l’étranger et notamment celles du gouvernement britannique (Open Government Licence) ainsi que les autres standards internationaux (ODC-BY, CC-BY 2.0).

  • Une exigence forte de transparence de la donnée et de qualité des sources en rendant obligatoire la mention de la paternité.

  • Une opportunité de mutualisation pour les autres données publiques en mettant en place un standard réutilisable par les collectivités territoriales qui souhaiteraient se lancer dans l’ouverture des données publiques.

Le logo de la « Licence Ouverte / Open Licence » est également librement réutilisable : https://www.etalab.gouv.fr/licence-ouverte-open-licence

Le texte de la licence : https://www.etalab.gouv.fr/wp-content/uploads/2017/04/ETALAB-Licence-Ouverte-v2.0.pdf

Pour l’essentiel, cette licence indique :

Le « Concédant » concède au « Réutilisateur » un droit non exclusif et gratuit de libre « Réutilisation » de l’« Information » objet de la présente licence, à des fins commerciales ou non, dans le monde entier et pour une durée illimitée, dans les conditions exprimées ci-dessous.Le « Réutilisateur » est libre de réutiliser l‘ « Information » :

  • de la reproduire, la copier,

  • de l‘adapter, la modifier, l‘extraire et la transformer, pour créer des « Informations dérivées », des produits ou des services,

  • de la communiquer, la diffuser, la redistribuer, la publier et la transmettre,

  • de l’exploiter à titre commercial, par exemple en la combinant avec d’autres informations, ou en l’incluant dans son propre produit ou application.

Sous réserve de :

  • mentionner la paternité de l’ « Information » : sa source (au moins le nom du « Concédant ») et la date de dernière mise à jour de l’ « Information » réutilisée.

Suivi de paragraphes relatifs :

  • aux données à caractère personnel,

  • aux droits de propriété intellectuelle,

  • à la responsabilité des producteurs et des réutilisateurs

  • à la compatibilité avec d’autres licences existantes

  • au droit applicable (français)