Il est communemment admis ces derniers temps que Données Publiques rime
avec gratuité d'accès. Ou plutôt qu'un accès libre aux données publiques
implique forcemment un accès gratuit. L'argument qui revient souvent
pour affirmer cela est que les données ont déjà été payées par les
citoyens sous forme d'impôt. Je vois 2 problèmes à cet argument.
Le premier, celui que j'ai defendu sur twitter, est que ce n'est pas
l'accès aux données qui a été financé par les impôts. Les données ont
été crées pour permettre de rendre le service publique. C'est le service
publique que nous avons financé. L'accès en lui-même a un coût: édition
des données (ne serait-ce que pour la confidentialité), homogénéisation
des formats, hébergement de ces données extraites, traitement des
demandes. Ce coût n'est encore qu'en partie budgeté à ma connaissance en
France. Ansi le coût d'extraction et de distribution est déjà plus ou
moins pris en compte. Nos députés, les organisations européennes ont
déjà accès à la plupart de nos données publiques. Des circuits de
distribution existent donc bien. Ceci dit rien n'est encore prévu pour
offrir un accès plus large à tout individu. Le coût de celui-ci n'est
pas négligeable.
Le deuxième problème, est l'aspect transfrontalier d'une donnée. Une
donnée libre n'a pas de frontière. Cet accès hors de nos frontiere est
fait par des personnes qui ne reinvestissent pas forcemment dans le
pays. Avoir un accès libre impliquerait donc que les citoyens d'un pays
cotisent pour l'ensemble du monde. Les pays ne sont pas tous égaux à ce
nivau. Le coût d'accès peut, par ailleurs, rapidement devenir important.
La mise à disposition d'une donnée n'est donc pas gratuite. Comment
la financer ?
Une taxe directe est sans doute préferable à un autre impôt. La même que
nous payons pour accéder aux données des Sociétés (ou que societes.com
[2] paie pour nous) sous forme de timbre fiscal ou simple paiement. Le
problème d'une taxe directe, outre le coté éthique de la chose, est
qu'elle pourrait tendre à favoriser le "filtrage" des données mise à
disposition. Par filtrage j'entends le fait de favoriser la mise à
disposition de certaines données pour des raisons économiques. Cette
réalité existe aussi dans le cadre d'un impôt global mais peut-être plus
facilement absorbée si le budget est là. En revanche, une taxe directe
présente l'avantage de financer directement un usage plutot que comme
dans le cas d'un impôt global avoir un budget qui puisse être diminué en
fonction des urgences, orientations politiques ou budgétaires. L'autre
avantage est qu'une taxe directe est appliquée à tout le monde, citoyen
français ou non.
Une donnée est un bien immateriel. Ainsi une donnée telechargée ne coûte
plus à la source. c'est là que la notion de liberté intervient. Je
partirais d'une définition pure de la liberté à savoir la faculté d'agir
selon sa volonté en fonction des moyens dont on dispose sans être
entravé par le pouvoir d'autrui. Ici aucun accès aux données ne saurait
être interdit pour peu qu'il n'entrave pas d'autres libertés
(nécessitant par exemple de rendre anonyme certaines données).
Prenons une Société qui inclue la notion de mise à disposition libre des
données du service publique. Chose qui commence à se mettre en place de
manière légale un peu partout. Dans cette Société une donnée acquise
peut être librement utilisée et distribuée.
Dans une liberté sans entrave, en fonction des moyens dont il dispose,
un individu (personne morale ou non) ou collectif peut acquerir toute
donnée publique et l'utiliser à son gré, éventuellement la mettre à
disposition d'autrui de manière gratuite. La license de ces données lui
permet de le faire. L'acquisition peut-être eventuellement gratuite (si
le budget est prévu par la Société) ou payante. Auquel cas le prix
correspond au coût marginal de l'entretien voire de l'extraction de ces
données. Dans ce système, les données sont donc bien libres d'accès
modulo le coût marginal. Elles peuvent même devenir gratuite si un
groupe d'individus les fournit de manière gratuite. Un autre groupe
d'individu peut vouloir quand à lui offrir un service payant utilisant
ces données, il est libre de le faire.
Alors pourquoi ne pas étendre ce groupe d'individus à la Société
(collectivité) tout entière. Après tout, l'État au service de la
collectivité dispose d'un outil pour cela sous la forme de l'impôt.
L'impôt permettant ici de collecter l'ensemble des sommes nécessaires
pour l'entretien de ces données. Une Société est un ensemble
d'individus, et non un tout. Pourquoi mettre cet impôt au service d'une
minorité quand il ne s'agit pas d'une question vitale? Bien sur ces
personnes si elles sont françaises réinvestissent parfois dans la
Société sous forme d'impôts ou autres. Tout est dans le parfois. Combien
faut-il donner pour que cela ne soit pas à perte ? Où s'arrêter? Ce
n'est pas le rôle d'une Société que d'aider à l'enrichissement
personnel. Elle est là pour permettre que cela soit possible en offrant
un cadre aux individus leur permettant d'interagir en toute quiétude,
mais son rôle devrait s'arrêter là.
D'un point de vue éthique, on pourrait considérer qu'une donnée
collectée dans le cadre la mission du service publique fait partie du
patrimoine. Partant de là l'accès à ces données doit être libre. Libre
oui mais gratuit ?
Payer pour accéder aux richesses de notre patrimoine n'est pas quelque
chose de nouveau. Le citoyen français paie au moins deux fois l'accès à
son patrimoine. La première par l'impôt qui est est redistribué par le
ministère de la culture [3] et la deuxieme quand nous payons par
exemple, un droit d'entrée aux musées. Ces mêmes musées font aussi
parfois payer d'autres Sociétés ou musées pour pouvoir utiliser ce
patrimoine. Ce coût correspond au financement de l'entretien du
patrimoine ainsi qu'au financement de nouvelles decouvertes/recherches.
Payer pour l'entretien est donc quelque chose d'usuel non quelque chose
de nouveau. Pourquoi ne pas faire de même avec les données ?
Certains argumentent que faire payer l'accès aux données est un frein à
l'innovation. Outre le coté malsain de cet argument (cela consisterait à
dire que le modèles d'affaires de ces entreprises "innovatrices" ne peut
pas fonctionner si elles devaient acheter ces données), en quoi payer
le cout de la mise à disposition de ces données peut freiner
l'innovation si l'accès à cette donnée est libre ? - c'est à dire non
restreinte à une minorité - Ne pas payer ce coût et le laisser à la
Société peut au contraire à terme nuire à l'innovation, car la mise à
disposition de ces données serait dépendante de la volonté politique
d'allouer un budget à celle-ci. Les exemples anglais et américains
montrent que cette volonté peut être moins forte au cours du temps ou en
fonction du contexte économique.
Associer liberté et gratuité est abscons. Toute liberté a un coût que
celui-ci soit assumé par la Société, un individu ou un groupe
d'individus. Dans le cas des Données Publiques, il semble normal que le
ou les individus qui souhaitent accéder à ces données participent à
l'entretien de celles-ci. Les personnes non directement interessées
n'ont pas à en supporter le coût. D'autant qu'elles participent déjà à
cet effort en partie en permettant au service public de collecter des
données et à leurs députés de les exploiter via leurs impôts. Ce qui est
important au final est que cet accès soit libre et non reservé à une
minorité. Un coût juste doit être trouvé pour garantir l'égalité d'accès
mais c'est une autre discussion. Cessons déjà d'associer Données
Publiques et plus généralement Open Data à gratuité.
- benoît
[1] https://convore.com/opendata-france/lacces-aux-donnees-liberees-doit-il-etre-payant/
[2] http://societes.com
[3] http://www.culture.gouv.fr/mcc/Le-ministere/Missions-et-organisation/Themes/La-direction-generale-des-patrimoines
Le coôut ets loin d'être nul même en utilisant bitorrent ou aws (et
surtout aws). Et nous parlons que du cout de distribution. Reste les
coûts d'entretien, gestion des demandes etc. Pourquoi la collectivité
devrait le supporter ? Qu'est-ce qui effraie donc tant dans le fait de
payer quelque chose qui a un coût?
Je ne suis pas naïf. Si tu suis mon propos le fait que ce soit
accessible ailleurs ensuite n'est pas important, ce qui est important
c'est de financer l'entretien. Car cela pourra se trouver ailleurs
tant que ces données sont disponibles. Il est facile de dire de tte
façon ce sera disponible sur internet. OK. mais qui aura au préalable
mis ces données sur internet? Comment les rendre disponibles à tous si
ce n'est via un point connu de tous ?
- benoît
Tu ne réduis tout qu'l'aspect distribution finale. Ce qui coute c'est
la mise à disposition. Les demandes ? Les demandes de données non
encore disponibles. ? La mise en place de ormat lisibles par tous ?
LA verification des données mises à disposition ? L'extraction des
outils ? Nous parlons de rendre accesible des données. Pas d'un simple
datastore non classée. C'est aussi cela.
Un service public comme data.gov [1] coute tres cher. Par ailleurs
cette infrastructure technique dont tu parles n'est pas aussi
évidente. et le cout loin d'être nul.
[1] http://data.gov
Le portail est payé par les impots. Les états unis sont plus grand que
la france, donc le budget plus important. cqfd.
Le site data.gov est né d'une volonté politique et y reste soumis.
Rien ne garantit que les données continueront à couler. D'ailleurs le
flux s'est ralenti.
>> Les demandes
> Sur data.gov je ne vois pas de sections "demandes". Il faut savoir que
> chaque document produit par les services de l'Etat sont déjà classés
> (secret, publique etc) donc il n'y a qu'à uploader les documents déjà
> classés comme publiable.
Ces demandes ne sont pas faites sur le site mais tu peux ouvrir des
requêtes auprès des differentes institutions.
"Il n'y a quà". Uploader des données n'est pas suffisant. D'après ce
que j'en sais et aies vu le classement de ces données n'est pas si
évident. Ni les formats utilisés. Bref ce n'est pas aussi simple.
Un document interessant qui montre les conditions nécessaires pour
libérerer des données :
L'architecture de data.gov :
http://ideascale.com/userimages/sub-1/736312/ConOpsFinal.pdf
Tout ceci implique un certain budget.
- benoît
Merci pour ton mail, c'est un point de vue enrichissant :) Je reviens
sur quelques unes des points évoqués en essayant d'être plus clair :)
Si l'on reprend la défintion d'Open Data tel que définie par l'OKD:
""" A piece of content or data is open if anyone is free to use, reuse,
and redistribute it — subject only, at most, to the requirement to
attribute and share-alike """ http://www.opendefinition.org/
Elle ne fait pas mention de gratuit, mais bien de libre (free != gratis). Je
ne partage pas par contre cette idée de share-alike, qui va en
l'encontre de l'idée même de liberté car posant une restriction mais
c'est un autre sujet.
Sinon je pense que vous m'avez mal lu ou que je n'ai pas été assez clair
:) Mon propos ici est de montrer que Données publiques != gratuit. Je
suis contre un prix d'accès basé sur le CA, dans mon message. Cette
notion de coût marginal que j'évoque est en droite ligne avec les textes
metteant en place la CADA [1]. Mettre en place l'infrastructure a un
coût. Vous me citez un budget de 10000 euros pour la mairie de renne.
Celui-ci est ridiculeusement bas, mais reflète bien ce qu'il y a
actuellemnt en ligne. Je pense que vous sous-estimez le coût réeel de la
mise en place d'une infrastructure nationale capable d'héberger et de
mettre à disposition des données au cours des années auprès d'une
population toujours plus importante. Il est d'ailleurs dommage que pour
l'instant chaque projet se fasse au niveau des villes, on aimerait avoir
un systeme un peu plus centralisé proposant par exemple un ensemble de
logiciels (histoire de diminuer les coûts). Y-a-t-il déjà une volonté en
ce sens ?
Il est clair qu'avoir un réferentiel et point d'accès commun aux
administrations va permettre aux administrations de faire des économies.
Ceci dit la mise en place de ce point n'est pas directement lié au
concept d'Open Data. C'est une nécessité pour les administrations que
de le mettre en place pour pallier à un budget restreint. Et sinon
nécessité, un devoir envers la société. Ceci dit les 2 sont évidemment
liés, le concept de données publiques est plus vieux que le buzz word
actuel sur l'OpenData La CADA existant par exemple depuis 1978,
le RGI [2] a été voté en 2005, etc... Ceci dit la résurgence du concept
d'Open Data permet d'accélerer ces économies, en impliquant plus de
personnes exterieures à l'administration.
Faire payer le coût de la mise en place d'un referentiel et d'une
plateforme commune d'accès aux données est raisonnable. Elle permet à
terme de diminuer le coût du service publique.
Mais pourquoi faire payer au citoyen tout le coût de cette mise à disposition
des données auprès de tiers exterieurs au service publique (Etat,
Députés, associations d'uitlités publiques, ...) ?
Vous revenez sur l'innovation induite par un la liberalisation des
données. Celle-ci est en effet réelle en angleterre [3]. Et l'exemple
que vous citez très prometteur. Par contre il est encore trop tôt pour
dire si c'est un phénomène ponctuel due à une brusque libération des
données attendues par nombre de personne ou si c'est un mouvement de
fond. Je penche pour le second. En revanche vous prenez un raccourci en
disant que c'est le coût nul de ces données qui est la cause de
l'innovation. Cela doit en partie jouer. Cela dit, avant la mise en
place de politiques incitants à la transparence il était très difficile
voire impossible d'avoir accès à ces données, rien ne dit qu'un coût
marginal aurait bloqué ces entreprises. Je ne parle pas d'un coût de
12000 euros (c'est une donnée publique?) mais plutôt d'un coût de 1 à 10
euros l'acces au systeme. Ce coût directe permettant de financer un
minimum l'infrastructure et ayant l'avantage d'être applicable à des
personnes au niveau international. C'est très proche du système de
gestion du patrimoine que nous avons en place en France. Compte tenu du
contexte ce coût n'est peut-être valable cependant que pour accéder aux
dernieres données/mises à jour. Auquel cas le coût que je donne est
peut-être un peu bas si il se contente à cela. Peut-être peut-on
imaginer une infrastructure mixte en ayant un coût d'acces à des données
récentes plus importantes payés par quelques compagnies et le reste
disponible gratuitement. Un peu sur le modèle d'accès aux fichiers des
sociétés avec Euridil, societes.com ... ? À voir. Il est évident en tous
cas que dans le temps ces données seront mises à disposition d'une
maniere ou d'une autre sur le reseau de manière gratuite, voir même
immediatement au niveau d'un portail.
En tous cas le débat est loin d'être clos :) Je ne suis pas aussi
optimiste que vous sur l'impact benefique de l'innovation sur la
société, l'histoire montre que ce n'est pas une vérité mais pour le
reste on se rejoint plus ou moins sur ce qu'induit l'accès libre aux
données publiques.
[1] http://www.cada.fr/
[2] http://www.references.modernisation.gouv.fr/rgi-interoperabilite
[3] http://blog.actuvisu.fr/opendata-lecons-des-experiences-angosaxonnes/
Hum, Il était tard, ce que je voulais dire c'est qu'il est plus facile
pour les americains de mettre en place ce genre de site (certains
coûts ne sont pas du au volume) que pour nous ayant un budget
forcemement plus important. J'espère que cela est plus clair :)
- benoît