80
rapport d’activité 2012
Informer et éduquer / Conseiller et réglementer / Accompagner la conformité / Protéger les citoyens /
BIG DATA, TOUS CALCULÉS ?
Jusqu’à récemment, les traitements massifs de données semblaient réservés à des acteurs
disposant d’infrastructures informatiques importantes. La quantité exponentielle de
données désormais disponibles et le cloud « démocratisent » aujourd’hui l’accès à ces
traitements de masse et offrent des possibilités nouvelles de valorisation des données.
focus
Les 3 V du Big Data
Le Volume : La masse de
données informatiques
et numériques produites
en 2008 sur Internet
représentait 480 milliards de
gigagoctets. En 2010, ce furent
800 milliards soit l’équivalent
de ce que l’humanité avait
écrit, imprimé, gravé, ou
enregistré jusqu’en 2003.
90 % des données ont ainsi
été créées ces deux dernières
années et on s’attend à une
croissance annuelle de 40 %
dans le monde entre 2011 et
20201.
La Variété : le volume et la
variété sont intrinsèquement
liés à l’évolution des usages :
les utilisateurs partagent des
données issues de tout une
diversité de contenus (photos2,
vidéos, billets de blog,
micro-conversations, objets et
capteurs connectés);
La Vélocité : le traitement
de grande masse de données
est aujourd’hui simplifié. De
nouvelles générations de
technologies et d’algorithmes
offrant toujours plus de
puissance et d’analyse de
calcul permettent de traiter de
nouveaux types de données, en
particulier non-structurées, et
ont favorisé l’émergence d’une
industrie qui pesait près de
700 milliards d’euros en 20123.
L
e concept de Big Data est certainement l’un des thèmes les plus
en vogue lorsque l’on s’intéresse
aux évolutions technologiques pouvant
avoir le plus d’impact dans les 10 prochaines années, aussi bien sur un plan
économique que sociétal. Le Big Data est
souvent caractérisé par la formule dite des
« trois V » : volume et variété dans un premier temps, car on amasse des sommes
de données de plus en plus considérables
par des moyens variés ; vélocité dans un
second temps, car la masse des données
recueillies doit être traitée en temps réel.
Ainsi, l’avènement du Big Data vat-il permettre l’émergence d’une nouvelle
forme de science, sans hypothèse ? Une
nouvelle manière de prendre des décisions qui ne s’appuierait que sur du pur
calcul, autour de modèles de comportements ? Quels enjeux nouveaux pose-t-il
en termes « Informatique et Libertés » ?
Nouvelles données, nouveaux
champs, le Big Data s’invite partout…
Les opportunités offertes par le
Big Data sont aujourd’hui majoritairement
valorisées dans le domaine du marketing
et de la publicité pour des usages d’analyse des données sur le comportement
des consommateurs dans le but de mieux
anticiper leurs attentes. La publicité en
ligne constitue sans doute la meilleure
illustration au travers du développement
de techniques permettant d’affiner le
ciblage publicitaire en fonction du profil
avec des adaptations en temps réel4 du
message affiché, ou le recours à des
techniques de « re-targeting » ou reciblage
publicitaire pour améliorer l’efficacité
d’une campagne.
Les applications sont nombreuses
dans le domaine scientifique : géologie, météorologie, par l’intermédiaire
de capteurs pour surveiller et prévoir le
déclenchement de phénomènes naturels.
De la même manière on retrouve des
applications dans des domaines d’intérêts publics comme l’aide au diagnostic
médical ou la veille sanitaire.
De grandes sociétés informatiques
développent aussi des projets pour
accompagner des villes avec la promesse
de les rendre plus « intelligentes », en
adaptant les ressources aux besoins au
moyen d’algorithmes de prévision de
trafic par exemple. Dans le domaine de
la sécurité publique, il s’agit d’agréger et
d’analyser un ensemble de données dans
le but de détecter les comportements
« anormaux » et d’anticiper les menaces
criminelles.
À une période où le coût d’accès à
des ressources sur le cloud ne cesse de
baisser, les technologies du Big Data
s’étendent à de nombreux secteurs de
l’économie, fort consommateurs de données, et sont principalement mobilisées
pour leurs vertus prédictives.
McKinsey 2011 / 2 Cf. gros plan du chapitre 1 La place des photos dans la vie numérique / 3 Étude IDATE Cloud
et Big Data, mai 2012 / 4 On parle de RTB Real Time Bidding pour décrire les enchères en temps réel offertes aux
annonceurs, et rendues possibles par la vélocité des systèmes de traitement.
1