Auteur | Rechercher : Fiala, Mark; Rechercher : Green, David; Rechercher : Roth, Gerhard |
---|
Format | Texte, Article |
---|
Conférence | IEEE International Workshop on Haptic Audio Visual Environments and their Applications (HAVE'2004), October 2-3, 2004, Ottawa, Ontario, Canada |
---|
Résumé | Les systèmes de vidéoconférence utilisés de nos jours comprennent habituellement des caméras fixes ou à réglage panoramique/inclinaison/zoom pour l'acquisition des images ainsi que des microphones de proximité pour un enregistrement audio de bonne qualité. Ces capteurs ne conviennent pas aux scénarios dans lesquels interviennent plusieurs utilisateurs assis à une table de réunion ou des utilisateurs en déplacement. Dans ces cas, la caméra doit pouvoir passer d'un intervenant au suivant et, si possible, suivre les intervenants dans leurs déplacements. Ce document décrit un système perceptif multi modal utilisant des signaux à la fois vidéo et audio dans un système de vidéoconférence de ce genre. Une caméra vidéo omnidirectionnelle et un réseau conformateur de faisceaux audio sont intégrés en un dispositif placé au centre d'une table de réunion. Les données vidéo et audio sont traitées afin de déterminer dans quelle direction se trouve la personne qui parle, puis une vue en perspective virtuelle et un faisceau audio directionnel sont créés. Des algorithmes de vision par ordinateur sont utilisés pour repérer des personnes par détection de mouvement, de visages et de marqueurs. Le conformateur de faisceaux fusionne les signaux provenant d'un réseau circulaire de microphones afin de fournir des mesures de puissance audio dans différentes directions simultanément. Les repères vidéo et audio sont combinés pour déterminer l'endroit où se trouve le locuteur. Le système a été intégré avec OpenH.323 et sert de nœud dans Microsoft NetMeeting. |
---|
Date de publication | 2004 |
---|
Dans | |
---|
Langue | anglais |
---|
Numéro du CNRC | NRCC 47364 |
---|
Numéro NPARC | 5765480 |
---|
Exporter la notice | Exporter en format RIS |
---|
Signaler une correction | Signaler une correction (s'ouvre dans un nouvel onglet) |
---|
Identificateur de l’enregistrement | b885afad-d7da-44ea-a52d-e8f3cd94a567 |
---|
Enregistrement créé | 2009-03-29 |
---|
Enregistrement modifié | 2021-01-05 |
---|