{"title":"Thésaurus distributionnels pour la recherche d'information et vice-versa","authors":"V. Claveau, Ewa Kijak","doi":"10.24348/coria.2015.79","DOIUrl":null,"url":null,"abstract":"Les thesaurus distributionnels sont utiles a de nombreuses tâches du traitement automatique des langues. Dans cet article, nous abordons les problemes de leur construction et de leur evaluation sous l’angle de la recherche d’information. Deux contributions sont proposees. D’une part, en poursuite des travaux inities par Claveau et al., 2014, nous montrons comment les techniques de RI peuvent etre utilisees avec succes pour construire ces thesaurus. Au moyen d’une evaluation directe par comparaison avec des lexiques de reference et au travers de plusieurs experimentations, nous montrons que les resultats obtenus par des modeles de RI depassent les performances des systemes etat de l’art. D’autre part, nous utilisons la RI comme cadre applicatif pour proposer une evaluation indirecte des thesaurus produits. La encore, cette evaluation valide l’approche. Mais surtout, elle permet de mettre en regard les performances obtenues sur cette tâche avec celles des evaluations directes utilisees dans la litterature. Les differences constatees remettent en cause en partie ces pratiques d’evaluation.","PeriodicalId":390974,"journal":{"name":"Conférence en Recherche d'Infomations et Applications","volume":"38 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2015-03-18","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"9","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Conférence en Recherche d'Infomations et Applications","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.24348/coria.2015.79","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 9
Abstract
Les thesaurus distributionnels sont utiles a de nombreuses tâches du traitement automatique des langues. Dans cet article, nous abordons les problemes de leur construction et de leur evaluation sous l’angle de la recherche d’information. Deux contributions sont proposees. D’une part, en poursuite des travaux inities par Claveau et al., 2014, nous montrons comment les techniques de RI peuvent etre utilisees avec succes pour construire ces thesaurus. Au moyen d’une evaluation directe par comparaison avec des lexiques de reference et au travers de plusieurs experimentations, nous montrons que les resultats obtenus par des modeles de RI depassent les performances des systemes etat de l’art. D’autre part, nous utilisons la RI comme cadre applicatif pour proposer une evaluation indirecte des thesaurus produits. La encore, cette evaluation valide l’approche. Mais surtout, elle permet de mettre en regard les performances obtenues sur cette tâche avec celles des evaluations directes utilisees dans la litterature. Les differences constatees remettent en cause en partie ces pratiques d’evaluation.
分布式同义词典在自动语言处理的许多任务中是有用的。本文从信息检索的角度探讨了它们的构建和评价问题。提出了两项贡献。一方面,继续由Claveau et al., 2014发起的工作,我们展示了ir技术可以成功地用于构建这些同义词典。通过与参考词典的直接比较评估和几个实验,我们表明ir模型的结果超过了最先进的系统的性能。另一方面,我们使用ir作为一个应用框架,以提出一个间接评价的同义词典产生。同样,该评估验证了该方法。但最重要的是,它使我们能够将这项任务的表现与文献中使用的直接评价的表现进行比较。观察到的差异在一定程度上对这些评估实践提出了质疑。