Les interventions de la CNIL

épars ou de nature différente. Ainsi, dès lors qu’une personne est citée dans
une décision de justice diffusée sur le réseau, et dans la mesure où cette décision aura été indexée par un moteur de recherche, elle deviendra directement accessible à tout utilisateur, alors même que tel n’était pas l’objet de la
recherche et sans que l’internaute ait eu à se connecter à un site spécialisé.
Une réflexion que les performances des moteurs de recherche
rendent plus aiguë encore
Les évolutions technologiques ont, depuis quelques années, modifié considérablement le mode de fonctionnement des moteurs de recherche sur Internet.
Initialement peu puissants, les moteurs de recherche de première génération
n’étaient en mesure de retrouver les pages Internet que si ces pages avaient
été préalablement référencées auprès d’eux par le responsable du site, à
partir d’une liste de mots clés. Ainsi, s’agissant des sites diffusant de la jurisprudence, dès lors que les noms des personnes physiques n’avaient pas été
préalablement référencés auprès des moteurs de recherche, aucune requête
lancée à partir du nom d’une personne ne permettait d’avoir accès à une
éventuelle décision de justice nominative la concernant.
Dans un deuxième temps, des moteurs de recherche, beaucoup plus puissants, ont permis de « balayer » les pages Web, en texte intégral, sans être
alors limités par une indexation préalable de mots clés. Ainsi, ces moteurs
de recherche peuvent indexer toute décision de justice comportant le nom
d’une personne, même si l’auteur du site s’est attaché à ne pas référencer les
décisions diffusées. Ces moteurs « de deuxième génération » connaissaient
cependant une limite : seules les données diffusées au format html, langage de
programmation universel sur Internet, étaient indexables, ces moteurs demeurant impuissants à rechercher des documents diffusés sous un autre format.
C’est cette dernière limite dont se sont affranchis les moteurs de recherche de
la « troisième génération » actuellement disponibles sur le réseau. Très puissants et rapides, ils effectuent une recherche en texte intégral, sur tous les sites et, quel que soit le format de diffusion des données. Ainsi, le format pdf
— format graphique de diffusion d’un texte sous la présentation d’une image
— n’échappe plus à l’indexation. En outre, ces moteurs, qui effectuent une
copie de l’intégralité des informations, lesquelles se trouvent ainsi conserv��es dans leur mémoire cache, permettent de consulter des informations diffusées sur un site alors même que ces informations ne seraient plus en ligne et
n’auraient pas été dupliquées par un tiers. Ayant recherché et indexé une
fois l’information, ces moteurs la conservent systématiquement.
Ces quelques éléments d’ordre technique donnent la mesure de ce qui est en
cause : quels que soient la volonté ou le choix du responsable d’un site de jurisprudence sur Internet, accessible à tous, toutes les décisions de justice qui
comportent l’identité des parties peuvent être indexées par les moteurs de recherche, qu’il y ait ou non référencement préalable de la décision, quel que
soit le format de diffusion de celle-ci et même dans la circonstance où la mise
en ligne aurait cessé.
C’est là que réside la véritable « révolution » provoquée par Internet, laquelle nécessite que des précautions particulières soient prises afin de préserver la vie privée des personnes : ce qui est techniquement possible
lorsqu’une recherche documentaire via Internet est entreprise sur RABELAIS,
l’est aussi lorsqu’il s’agit de se renseigner sur un candidat à l’emploi, à un lo-

e

CNIL 22 rapport d'activité 2001

79

Select target paragraph3