{"title":"文档-请求匹配过程的矢量化","authors":"V. Claveau, Romain Tavenard, Laurent Amsaleg","doi":"10.24348/coria.2010.313","DOIUrl":null,"url":null,"abstract":"Dans la plupart des applications de RI, calculer rapidement la proximite entre documents et requetes est crucial. Avec les modeles vectoriels, ce calcul se fait generalement de maniere tres efficace. Cependant, lorsque les requetes sont tres longues ou dans le cas de SRI bases sur des modeles plus avances, ce calcul devient plus complexe et couteux. Dans cet article, nous proposons une technique simple pour transformer n'importe quel processus d'appariement requete-document fournissant un score en un probleme de calcul de distance entre vecteurs. Cette approche peut ainsi beneficier des bonnes performances des outils existants d'indexation et de recherche approximative dans des espaces de grandes dimensions. Au travers de quelques experiences, nous montrons par ailleurs que cette representation n'entraine pas de baisse importante de qualite des resultats, et, lorsque de nombreux documents sont a retourner, ameliore meme le rappel par rapport au SRI original, a taille de resultat egal.","PeriodicalId":390974,"journal":{"name":"Conférence en Recherche d'Infomations et Applications","volume":"27 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2010-03-18","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"15","resultStr":"{\"title\":\"Vectorisation des processus d'appariement document-requête\",\"authors\":\"V. Claveau, Romain Tavenard, Laurent Amsaleg\",\"doi\":\"10.24348/coria.2010.313\",\"DOIUrl\":null,\"url\":null,\"abstract\":\"Dans la plupart des applications de RI, calculer rapidement la proximite entre documents et requetes est crucial. Avec les modeles vectoriels, ce calcul se fait generalement de maniere tres efficace. Cependant, lorsque les requetes sont tres longues ou dans le cas de SRI bases sur des modeles plus avances, ce calcul devient plus complexe et couteux. Dans cet article, nous proposons une technique simple pour transformer n'importe quel processus d'appariement requete-document fournissant un score en un probleme de calcul de distance entre vecteurs. Cette approche peut ainsi beneficier des bonnes performances des outils existants d'indexation et de recherche approximative dans des espaces de grandes dimensions. Au travers de quelques experiences, nous montrons par ailleurs que cette representation n'entraine pas de baisse importante de qualite des resultats, et, lorsque de nombreux documents sont a retourner, ameliore meme le rappel par rapport au SRI original, a taille de resultat egal.\",\"PeriodicalId\":390974,\"journal\":{\"name\":\"Conférence en Recherche d'Infomations et Applications\",\"volume\":\"27 1\",\"pages\":\"0\"},\"PeriodicalIF\":0.0000,\"publicationDate\":\"2010-03-18\",\"publicationTypes\":\"Journal Article\",\"fieldsOfStudy\":null,\"isOpenAccess\":false,\"openAccessPdf\":\"\",\"citationCount\":\"15\",\"resultStr\":null,\"platform\":\"Semanticscholar\",\"paperid\":null,\"PeriodicalName\":\"Conférence en Recherche d'Infomations et Applications\",\"FirstCategoryId\":\"1085\",\"ListUrlMain\":\"https://doi.org/10.24348/coria.2010.313\",\"RegionNum\":0,\"RegionCategory\":null,\"ArticlePicture\":[],\"TitleCN\":null,\"AbstractTextCN\":null,\"PMCID\":null,\"EPubDate\":\"\",\"PubModel\":\"\",\"JCR\":\"\",\"JCRName\":\"\",\"Score\":null,\"Total\":0}","platform":"Semanticscholar","paperid":null,"PeriodicalName":"Conférence en Recherche d'Infomations et Applications","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.24348/coria.2010.313","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
Vectorisation des processus d'appariement document-requête
Dans la plupart des applications de RI, calculer rapidement la proximite entre documents et requetes est crucial. Avec les modeles vectoriels, ce calcul se fait generalement de maniere tres efficace. Cependant, lorsque les requetes sont tres longues ou dans le cas de SRI bases sur des modeles plus avances, ce calcul devient plus complexe et couteux. Dans cet article, nous proposons une technique simple pour transformer n'importe quel processus d'appariement requete-document fournissant un score en un probleme de calcul de distance entre vecteurs. Cette approche peut ainsi beneficier des bonnes performances des outils existants d'indexation et de recherche approximative dans des espaces de grandes dimensions. Au travers de quelques experiences, nous montrons par ailleurs que cette representation n'entraine pas de baisse importante de qualite des resultats, et, lorsque de nombreux documents sont a retourner, ameliore meme le rappel par rapport au SRI original, a taille de resultat egal.