L’apprentissage automatique permet d’entraîner un programme
informatique sur des données (lors de la phase d’apprentissage ou
d’entraînement) afin de définir leur comportement ultérieur (lors de la phase
dite d’inférence ou de prédiction). Cet apprentissage peut être supervisé
ou non. Lorsqu’il est supervisé, il consiste à entraîner le programme sur des
données préalablement « annotées » ou « étiquetées » par une intervention
humaine avant de lui soumettre des données inconnues de nature similaire
sur lesquelles il doit formuler des propositions d’annotation.
Selon les informations fournies à la CNCTR, la phase d’apprentissage
est longue et, surtout, l’apprentissage est continu. Entre deux phases
d’inférence, le programme doit à nouveau être entraîné sur les données
initiales afin de ne pas perdre les capacités précédemment acquises. Les
allers et retours permanents entre les données initiales annotées et des
données nouvelles nécessitent un délai de conservation de plusieurs
années des données initiales.
Compte-tenu de ces éléments et eu égard aux précautions prévues pour
éviter que les données conservées ne soient associées aux personnes
concernées, la CNCTR estime que le délai maximal de conservation de
cinq ans opère une conciliation équilibrée entre l’objectif d’amélioration
des capacités techniques de recueil et d’exploitation des données issues
de techniques de renseignement et le risque d’atteinte à la vie privée des
personnes auxquelles ces données se rapportent.
Toutefois, le caractère proportionné du délai de conservation des données,
dans la limite de cinq ans, devra être apprécié pour chaque programme en
fonction de ses caractéristiques. La commission renvoie sur ce point aux
développements du point 4.1.4 ci-dessous.
4.1.4 L’article 11 du projet de loi prévoit que les paramètres techniques
applicables à chaque programme de recherche sont soumis à une
autorisation préalable du Premier ministre, délivrée après avis de la CNCTR.
a) La commission estime qu’un contrôle préalable de chaque programme
est en effet nécessaire pour s’assurer que la conservation de données issues
de techniques de renseignement à des fins de recherche et développement
est effectivement justifiée par les caractéristiques du programme.