{"title":"Reconnaissance automatique de la parole","authors":"J. Haton","doi":"10.51257/a-v2-h3728","DOIUrl":null,"url":null,"abstract":"Des progres importants ont ete faits au cours des dernieres annees en ce qui concerne les taux de reconnaissance de la parole (proches de ceux d’un etre humain), mais le niveau de comprehension demeure tres faible. Les systemes sont fondes sur une modelisation statistique de la langue parlee : modeles acoustiques de Markov caches (Hidden Markov Models, HMM) et modeles n-grammes memorisant les probabilites conditionnelles de sequences d’unites linguistiques. Les progres recents proviennent du couplage de ces modeles statistiques a des modeles neuronaux profonds, comportant un grand nombre de couches cachees, entraines a l’aide d’enorme quantite de donnees. Les applications concernent la dictee vocale, la transcription de medias (radio, television) et surtout la telematique vocale (assistants vocaux).","PeriodicalId":230934,"journal":{"name":"[Archives] Documents numériques - Gestion de contenu","volume":"102 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2016-02-01","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"12","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"[Archives] Documents numériques - Gestion de contenu","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.51257/a-v2-h3728","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 12
Abstract
Des progres importants ont ete faits au cours des dernieres annees en ce qui concerne les taux de reconnaissance de la parole (proches de ceux d’un etre humain), mais le niveau de comprehension demeure tres faible. Les systemes sont fondes sur une modelisation statistique de la langue parlee : modeles acoustiques de Markov caches (Hidden Markov Models, HMM) et modeles n-grammes memorisant les probabilites conditionnelles de sequences d’unites linguistiques. Les progres recents proviennent du couplage de ces modeles statistiques a des modeles neuronaux profonds, comportant un grand nombre de couches cachees, entraines a l’aide d’enorme quantite de donnees. Les applications concernent la dictee vocale, la transcription de medias (radio, television) et surtout la telematique vocale (assistants vocaux).