Impact de la détection de la parole pour différentes tâches de traitement automatique de la parole

Résumé : Dans cet article, nous proposons de comparer plusieurs systèmes de détection de la parole et leurs impacts sur deux tâches du traitement de la parole : la Segmentation et le Regroupement de Locuteurs (SRL) et la Reconnaissance Automatique de la Parole (RAP). Des systèmes à base de mixtures de Gaussiennes (GMM), de réseaux de neurones profonds (DNN) et récurrents (RNN) sont comparés, ainsi que l'utilisation d'un système de RAP pour détecter la frontière des mots. Les expériences présentées ici ont été conduites sur les corpus issus des campagnes d'évaluation ESTER1 et 2, ETAPE et REPERE1, constitués d'émissions de radio et de télévision française.
Liste complète des métadonnées

Littérature citée [22 références]  Voir  Masquer  Télécharger

https://hal-univ-lemans.archives-ouvertes.fr/hal-01817898
Contributeur : Florent Desnous <>
Soumis le : vendredi 6 juillet 2018 - 10:41:20
Dernière modification le : vendredi 26 avril 2019 - 13:36:20
Document(s) archivé(s) le : lundi 1 octobre 2018 - 02:33:18

Fichier

jep2018-sads(2).pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

Collections

Citation

Florent Desnous, Anthony Larcher, Sylvain Meignier. Impact de la détection de la parole pour différentes tâches de traitement automatique de la parole. XXXIIe Journées d’Études sur la Parole, Jun 2018, Aix-en-Provence, France. ⟨10.21437/JEP.2018-63⟩. ⟨hal-01817898⟩

Partager

Métriques

Consultations de la notice

170

Téléchargements de fichiers

119