— 104 —

cadre juridique permettant le développement d’outils incorporant des algorithmes
d’intelligence artificielle, même à titre expérimental, pour leurs propres besoins
ou pour l’écosystème dans lequel ils agissent. » C’est d’ailleurs l’un des objets du
livre blanc de la sécurité intérieure en cours d’élaboration.
Ce besoin d’encadrement juridique a également été souligné par la
secrétaire générale de la défense et de la sécurité nationale (SGDSN), Mme Claire
Landais, qui a indiqué que l’Agence nationale de la sécurité des systèmes
d’information (ANSSI) menait elle aussi une réflexion sur le sujet.
a. La modélisation par les données suppose leur conservation pendant
une longue durée dans la phase d’entraînement des outils d’IA
L’automatisation par l’intelligence artificielle suppose de recourir à la
modélisation par les données. Cette modélisation s’opère en deux phases bien
distinctes :
– la phase d’apprentissage, d’entraînement et de test, d’une part ;
– la phase opérationnelle, dite de production, d’autre part.
● La phase d’entraînement
Lors de la phase d’entraînement, des données personnelles réalistes,
tirées d’exemples opérationnels, sont utiles, voire indispensables, pour
construire un algorithme (1) performant. À l’issue du processus d’entraînement,
l’algorithme ne conserve plus de données personnelles. « Il s’agit », a expliqué
M. Renaud Vedel, « d’un objet mathématique dont toute la valeur économique et
opérationnelle réside dans la convergence réussie des paramètres ». Les données
d’entraînement étant coûteuses à produire, à annoter et à stocker, il est très
souhaitable de les conserver pendant une longue durée : cela permet de tester ou
de ré-entraîner les algorithmes régulièrement, de comparer la performance relative
de plusieurs algorithmes différents applicables à une tâche donnée et de ne pas
dupliquer les coûts lorsqu’un nouvel algorithme étalonné comme plus performant
est disponible pour remplacer le précédent. Il importe d’insister sur le fait que les
données personnelles utilisées dans la phase d’entraînement n’ont aucune
conséquence opérationnelle sur les personnes concernées.
● La phase opérationnelle
Lors de la phase opérationnelle, ce sont des données nouvelles, totalement
indépendantes des données d’apprentissage, que l’on utilise. Ces données sont
tirées des missions de recherche et d’investigation en cours. Comme l’a indiqué le
coordonnateur ministériel précité, « le traitement peut légitimement entraîner des
(1) On entend par là une série d’instructions d’exécution d’un calcul ou de résolution d’un problème, en
particulier à l’aide d’un ordinateur. Ces instructions forment le fondement de toutes les opérations
réalisables par un ordinateur et, par conséquent, constituent un aspect fondamental de tous les systèmes
d’IA.

Select target paragraph3