Les débats en cours

Les systèmes de reconnaissance de visage peuvent grossièrement être classés en deux grandes catégories : les méthodes basées sur la reconnaissance des
caractéristiques d’un visage humain, d’une part, les méthodes dites globales, d’autre
part.
Les méthodes basées sur les caractéristiques du visage recherchent et analysent les éléments caractéristiques d’un visage tels que les yeux, la bouche, le nez, les
joues... Après le traitement de chacun de ces éléments, l’ensemble des résultats obtenus est combiné pour procéder à la reconnaissance du visage. On peut par exemple
déterminer la géométrie du visage à partir de ces éléments, notamment en calculant
les distances les séparant (distance entre les deux yeux, entre les deux joues etc.),
leurs proportions respectives comme en anthropométrie. Cette catégorie de méthodes est robuste par rapport aux variations de la position du visage dans l’image.
Les méthodes dites globales, elles, traitent l’image dans son ensemble, sans
essayer d’isoler explicitement chacune de ses « régions ». Les méthodes globales utilisent par exemple des techniques d’analyse statistique, d’analyse spectrale etc. La
force des méthodes globales tient à ce qu’elles utilisent la totalité des caractéristiques
du visage, en ne réservant pas un traitement préférentiel à certaines « régions ». Bien
entendu, si nous prenons l’exemple d’une méthode basée sur l’analyse statistique, le
« poids » d’un œil, du nez ou de la bouche dans le résultat final devrait être supérieur à celui d’une tache de rousseur située sur la joue, mais c’est l’analyse statistique
des pixels de l’image qui le découvrira « naturellement ». En général, les méthodes
globales fournissent de bons taux de reconnaissance, mais nécessitent que le visage
soit présenté dans un cadre simple : visage présenté à peu près de face, éclairage
régulier, arrière-plan simple. Les performances se dégradent rapidement dès qu’il y a
des changements d’orientation du visage, que l’éclairage varie brusquement où que
l’arrière-plan est trop chargé.
Pour les produits les plus performants, la qualité de la reconnaissance est
relativement insensible aux changements dans l’expression du visage, y compris le
clignement des yeux, un air renfrogné ou le sourire. La croissance des barbes et des
moustaches est compensée par la collecte d’autres éléments du visage suffisamment
redondants et fiables. Le style de la coiffure n’a pas d’influence car les cheveux ne
font pas partie des éléments pris en compte dans les calculs.
S’agissant de la posture, une orientation de moins de 10-15° par rapport à
la position de face ne provoque aucune dégradation des performances. De 15 à
35°, les performances décroissent. Au-delà de 35°, la reconnaissance n’est pas
bonne, mais les visages peuvent toujours être comparés avec d’autres visages tournés d’un même angle tant que les yeux restent clairement visibles.
Certains produits mettent en valeur le fait que les performances ne sont pas
diminuées lors de la croissance de l’enfant entre l’adolescence et l’âge adulte.
Pour détecter que la personne ne présente pas à la caméra la photographie
d’un visage au lieu du visage lui-même, la présence de caractéristiques géométriques
que l’on retrouve dans une photographie est recherchée, comme par exemple la bordure rectangulaire. L’usager peut également être invité à sourire ou à faire un clignement d’œil. Le test d’un visage « vivant » dure en moyenne deux à trois secondes.

164

e

CNIL 22 rapport d'activité 2001

Select target paragraph3