{"title":"De l’évaluation et ses ressources en traitement automatique des langues","authors":"Patrick Paroubek, J. Mariani","doi":"10.3917/rfla.241.0095","DOIUrl":null,"url":null,"abstract":"Le traitement informatique du langage a privilegie depuis trente ans les methodes d’apprentissage automatique qui ont permis des avancees technologiques operationnelles dans un nombre croissant d’applications. Celles-ci ont ete rendues possibles par la disponibilite de corpus d’apprentissage, par le developpement du paradigme d’evaluation (shared tasks) et par la creation d’infrastructures d’evaluation de technologie. Mais les corpus doivent etre de taille suffisante pour representer la realite linguistique et toutes les langues ne disposent pas des ressources appropriees ni des moyens pour les produire. Les experiences ont montre que la taille des donnees d’apprentissage peut remplacer la complexite algorithmique ou les connaissances expertes, mais a-t-on atteint les limites de ce type d’approche ?","PeriodicalId":42780,"journal":{"name":"Revue Francaise de Linguistique Appliquee","volume":"1 1","pages":""},"PeriodicalIF":0.0000,"publicationDate":"2019-01-01","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Revue Francaise de Linguistique Appliquee","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.3917/rfla.241.0095","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"Q2","JCRName":"Arts and Humanities","Score":null,"Total":0}
引用次数: 0
Abstract
Le traitement informatique du langage a privilegie depuis trente ans les methodes d’apprentissage automatique qui ont permis des avancees technologiques operationnelles dans un nombre croissant d’applications. Celles-ci ont ete rendues possibles par la disponibilite de corpus d’apprentissage, par le developpement du paradigme d’evaluation (shared tasks) et par la creation d’infrastructures d’evaluation de technologie. Mais les corpus doivent etre de taille suffisante pour representer la realite linguistique et toutes les langues ne disposent pas des ressources appropriees ni des moyens pour les produire. Les experiences ont montre que la taille des donnees d’apprentissage peut remplacer la complexite algorithmique ou les connaissances expertes, mais a-t-on atteint les limites de ce type d’approche ?