82
rapport d’activité 2012
Informer et éduquer / Conseiller et réglementer / Accompagner la conformité / Protéger les citoyens /
Toutes les données du cloud sontelles utilisables ?
C’est un véritable sujet de débat parmi
les chercheurs comme pour la CNIL qui
s’interrogent sur le statut à accorder à
ces informations considérées comme
« publiques », parce qu’elles sont accessibles au travers des réseaux sociaux et
donc facilement « agrégeables » avec
les technologies du Big Data. Peuventelles être simplement utilisées, sans en
demander la permission ? Des traitements
et analyses peuvent-ils se faire à l’insu des
personnes ?
90 %
des données créées
l’ont été ces
2 dernières années
L’analyse de micro-conversations peut
par exemple permettre d’avoir des informations assez fines sur les orientations
politiques d’un individu.
L’architecture en cloud pose également des questions sur la manière dont
les données circulent, sur leur stockage
et leur analyse en continu. Comment les
sécuriser ? Est-il possible, souhaitable de
limiter les recoupements, l’interconnexion
et la centralisation de toutes ces données
potentiellement sensibles ?
Finalement, tous prévisibles ?
Toutes ces données sont in fine traitées par des algorithmes pour les transformer en informations capables de déduire
ou de prédire des comportements. C’est
d’ailleurs ce qui inquiète certains dans ce
passage du déductif à un inductif purement statistique, une forme de nouvelle
science sans hypothèse. Laisser ainsi des
systèmes automatisés définir ce qui est
suspect et ce qui ne l’est pas ne va pas
sans poser des questions sérieuses sur un
plan éthique.
En particulier, est-il acceptable de vouloir définir et détecter des comportements
« anormaux » sur une logique statistique ?
Se pose également la question de
la légitimité de la prise de décision sur
la base d’un traitement automatique
dont les individus ne connaissent pas
la logique. Dans la mesure où ces algorithmes sont de véritables boîtes noires,
Big Data : une nouvelle
science sans hypothèse ?
comment les informer sur les conditions
d’exploitation de données au départ anonymes et dont on ne connaît pas a priori
l’usage qui en sera fait ? Comment assurer le respect de leurs droits ? Comment
pourraient-ils contester la logique qui
sous tend une décision prise sur la base
d’un tel traitement ? Ou, à l’inverse les
individus sont-ils susceptibles d’adopter
certains comportements en anticipant des
traitements de ce type ?
Au final, comment appliquer le principe de proportionnalité et de pertinence
des données dans un contexte où il est de
l’essence même du Big Data de recueillir
toujours plus de données ?
Alors que les Big Data commencent à
émerger en tant que champ de recherche
et que ces technologies se diffusent à
l’ensemble de l’économie, beaucoup de
questions restent en suspens quant aux
implications éthiques de leurs usages.
L’intérêt pour ces questions a été appuyé
par les experts rencontrés pour le premier numéro des Cahiers IP et lors de
la journée d’études « vie privée 2020 ».
Elles sont à l’ordre du jour du programme
d’études de la CNIL en 2013.