5.2.2. Dans les traitements automatiques
L’analyse automatique des données — des contenus — est, le plus souvent, périlleuse
voire aléatoire. Dans le cas des échanges téléphoniques, il faut commencer par supposer
que le logiciel de reconnaissance vocale sera capable de faire une transcription fiable
d’un locuteur qui ne fait aucun effort pour être compris de la machine. Mais, même en
supposant que l’échange soit déjà un texte écrit (textos, courriers électroniques, etc.),
l’analyse automatique pour extirper une information structurée est complexe : il faut
comprendre les allusions, les sous-entendus, le second degré, les non-dits implicites d’une
conversation à l’autre, etc.
À l’exact opposé, les métadonnées disent presque tout sur l’individu, et sont d’une
analyse automatique beaucoup plus simple, parce qu’elles sont déjà structurées. Deux
personnes, qui ne communiquaient pas ensemble, ou très peu, se mettent à échanger
des dizaines de messages, tous les jours, par exemple. Quel que soit le contenu de leurs
échanges, il s’agit d’un signe fort qu’une relation vient de se créer. Il pourrait être plus
délicat de déterminer si cette relation est intime ou non. Mais les données de géolocalisation des téléphones mobiles peuvent être très explicites : présence simultanée, dans un
même lieu, des deux individus, heures de présence, durée de la rencontre — tout y est.
Au final, les métadonnées disent des choses plus claires et plus facilement analysables
par un ordinateur que les données elles-mêmes. La taille des messages, les heures d’envoi,
leur fréquence, disent plus de choses que « On dîne ce soir ? » ou « Je serai en retard ».

5.2.3. Différences entre intermédiaires techniques
Les métadonnées peuvent être collectées auprès de deux sortes d’acteurs de l’environnement des communications électroniques, à savoir l’opérateur de communications
électroniques (dont les fournisseurs d’accès à Internet, de téléphone, mail, texto, tchat,
etc.), l’hébergeur de site web, mais aussi d’autres services de la société de l’information
qui sont moins directement liés aux activités de surveillance.
5.2.3.1.

Opérateurs de communications électroniques

La métadonnée la plus pauvre est celle fournie par le fournisseur d’accès à Internet :
Monsieur X a redémarré sa box le 12 avril à 22h35, elle est restée allumée jusqu’au 15
mai à 15h30. Au mieux, une information plus fine, mais équivalente : il a eu l’adresse IP
numéro x le 12 avril de 12h35 à 23h55, puis l’adresse y jusqu’au 13 avril à 19h27, etc. Les
seules informations pertinentes qui puissent être tirées de ces informations sont faibles :
l’individu laisse sa box allumée ou pas, les heures auxquelles il l’allume.
Si la notion « informations ou documents » est interprétée de sorte à permettre le
recueil auprès des fournisseurs d’accès d’informations sur les volumes de données échangées (beaucoup de trafic Internet à telle heure, peu de trafic à tel autre moment, etc.), il
devient possible de savoir s’il est plutôt consommateur de vidéos ou de textes, et à quelles
heures il utilise le réseau.
La métadonnée fournie par l’opérateur de communication électronique, c’est-à-dire par
le fournisseur du service (téléphonie mobile, courrier électronique, messagerie instantanée,
40

Select target paragraph3