Accéder directement au contenu Accéder directement à la navigation
Communication dans un congrès

Détection de parole superposée distante à l’aide d’une antenne de microphones

Résumé : La parole superposée correspond à l'activité simultanée de plusieurs locuteurs dans un enregistrement audio. Elle est source de dégradation des performances des modèles de traitement automatique de la parole. C'est notamment le cas dans le contexte de la segmentation et du regroupement en locuteurs. La détection de parole superposée détermine les instants où ces évènements interviennent. La généralisation de l'utilisation des réseaux de neurones a permis un gain significatif en performances sur cette tâche. La détection tend cependant à se dégrader en conditions de parole distante. Les travaux présentés étudient l'utilisation de mécanismes d'auto-attention pour combiner les canaux issus des différents microphones d'une antenne. Cette approche est mise en \oe uvre dans le contexte de la détection de parole superposée distante et permet de s'approcher des performances obtenues en champ proche.
Liste complète des métadonnées

https://hal-univ-lemans.archives-ouvertes.fr/hal-03700008
Contributeur : Théo Mariotte Connectez-vous pour contacter le contributeur
Soumis le : lundi 20 juin 2022 - 17:20:21
Dernière modification le : vendredi 24 juin 2022 - 03:41:46

Fichier

211210_JEP2022_vf.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-03700008, version 1

Collections

Citation

Théo Mariotte, Anthony Larcher, Jean-Hugh Thomas, Silvio Montrésor. Détection de parole superposée distante à l’aide d’une antenne de microphones. 34e Journées d'Étude sur la Parole, Jun 2022, Île de Noirmoutier, France. ⟨hal-03700008⟩

Partager

Métriques

Consultations de la notice

0

Téléchargements de fichiers

0