Résumé | La reconnaissance faciale dans une séquence vidéo est un exemple d'un problème qui est résolu par excellence par les humains, comparativement aux performances des systèmes de reconnaissance artificiels. Ce phénomène est généralement attribué aux trois facteurs principaux suivants qui ont trait à la façon dont le cerveau humain traite et mémorise l'information et qu'on peut désigner brièvement comme 1) traitement non linéaire; 2) prise de décision collective massivement répartie; et 3) plasticité synaptique. Au cours des cinq dernières décennies, de nombreux modèles mathématiques ont été développés pour simuler ces facteurs dans des systèmes informatisés.Cette présentation formalise le processus de reconnaissance, à mesure qu'il se déroule dans le cerveau, faisant appel à un de ces modèles mathématiques, à l'intérieur duquel l'apprentissage par projection semble être une amélioration naturelle de l'apprentissage par mise en corrélation. Nous montrons que, tout comme l'apprentissage par mise en corrélation, l'apprentissage par projection peut être peut également être exprimé en forme incrémentale. En tenant compte des données antérieures et en étant non locale, cette règle offre un moyen d'accentuer automatiquement les attributs et les données d'apprentissage plus importants par rapport aux moins importants. Le modèle présenté, qui offre une simple façon d'intégrer les trois facteurs principaux de mémorisation biologiques énumérés ci-dessus, est très puissant. Cela est démontré par son incorporation dans un système de reconnaissance faciale dont la capacité de reconnaître des visages dans une séquence vidéo est démontrée dans des conditions dont on sait qu'elles sont très difficiles pour les systèmes de reconnaissance classiques du type Von Neumann. |
---|