− des durées de conservation imposées par les dispositions des articles L. 822-2 du code
de la sécurité intérieure et strictement encadrées.
Dès lors, il n’est pas possible de conserver des renseignements, même dépourvus de tout
élément d’identification permettant de les rattacher aux objectifs au titre desquels ils ont été
recueillis, à des fins de développement ou de formation.
2.2. OBJECTIFS POURSUIVIS
Le but des actions de recherche qui seraient mises en œuvre par les services de renseignement
est l’optimisation d’une fonction mathématique à partir d’un jeu souvent très volumineux de
données, qualifié de jeu d’apprentissage. Ces modèles d’apprentissage visent à améliorer les
capacités d’analyse des services et à apporter une aide à l’enquêteur dans l’exploitation de
volumes souvent conséquents de données collectées.
Lors de la phase d’entraînement, des données réalistes, tirées d’exemples opérationnels
concrets, sont utiles voire indispensables pour construire des modèles d’apprentissage puis
entraîner les capacités de recueil et d’exploitation.
A titre d’illustration, l’élaboration d’un traducteur automatique dans une paire de langues peu
fréquente, comme l’albanais et le français, par exemple, nécessite le plus d’échantillons
possibles.
Il en va de même pour un modèle qui permettrait d’éliminer les bruits parasites d’une bande
son (bruits d’eau, de télévision, musique, etc.) : c’est à partir d’une masse importante de
données les plus opérationnelles donc pertinentes que l’on pourra modéliser le bruit et ensuite
l’éliminer sur les bandes sons afin de faciliter l’exploitation.
Les données d’entraînement étant coûteuses à produire, à annoter, à stocker, et demeurant,
dans certains cas, peu nombreuses, il est indispensable de les conserver sur une longue durée :
cela permet de pouvoir tester ou ré-entraîner les algorithmes régulièrement, de comparer la
performance relative de plusieurs algorithmes, et de ne pas dupliquer les coûts lorsqu’un
nouvel algorithme étalonné comme plus performant est disponible pour remplacer le
précédent.
Cette activité de recherche doit demeurer entièrement distincte de l’activité de surveillance
mise en œuvre par les services et à cette fin, les données qu’elle utilise ne doivent en aucune
manière pouvoir être exploitées à des fins de renseignement. En tout état de cause, l’intérêt de
ces données réside dans leur variété et leur nombre, permettant de constituer de manière
rigoureuse des jeux d’apprentissage, puis de validation de ces modèles. Ne sont en revanche
en rien pertinents pour la conduite d’actions de perfectionnement des techniques de recueil de
renseignement, l’identité des personnes ou la possibilité de la retrouver, ni les finalités au titre
desquelles les données utilisées pour ces actions ont été recueillies.

148

Select target paragraph3