Résumé | La recherche en matière de reconnaissance automatique de la parole (RAP) a été très intense au cours des quelques dernières années, l'accent étant mis sur la précision et le débit. Afin d'obtenir un bon niveau de précision, les techniques employées dépendent d'habitude d'importants calculs. Agbago et Barrière [2] ont défini plus tôt un cadre d'architecture en trois étapes (TSA) pour la RAP, soit : (1) étape de pré-traitement; (2) étape de reconnaissance des phonèmes; (3) étape de post-processeur en langage naturel. Dans le cadre de la TSA, nous nous concentrons ici sur la façon d'accroître le débit à l'étape 2, étape qui porte plus précisément sur la comparaison d'unités de parole de bas niveau. La démarche se distingue de plusieurs systèmes qui intègrent des processus HMM à cette étape (p. ex. celle de Shawn [5]). Nous présentons un nouvel algorithme, appelé reconnaisseur en parallèle, qui est 320 fois plus rapide que la programmation dynamique standard à deux niveaux (TLDP) [3]. En comparaison, pour un débit à bas niveau, Nkagawa [4] a pu réduire de 4 à 6 fois le temps nécessaire au calcul des distances locales pour l'algorithme DG amélioré de Sakoe [6]. |
---|