Conférence en Recherche d'Infomations et Applications最新文献

筛选
英文 中文
Ordonnancement d'entités appliqué à la construction de snippets sémantiques 实体调度应用于构建语义片段
Conférence en Recherche d'Infomations et Applications Pub Date : 2015-03-18 DOI: 10.24348/coria.2015.69
Mazen Alsarem, Pierre-Edouard Portier, Sylvie Calabretto, H. Kosch
{"title":"Ordonnancement d'entités appliqué à la construction de snippets sémantiques","authors":"Mazen Alsarem, Pierre-Edouard Portier, Sylvie Calabretto, H. Kosch","doi":"10.24348/coria.2015.69","DOIUrl":"https://doi.org/10.24348/coria.2015.69","url":null,"abstract":"RESUME. Les avancees de l'initiative Linked Open Data (LOD) ont permis de mieux structurer le Web des donnees. En effet, quelques jeux de donnees servent de centralisateurs (par exemple, DBpedia) et permettent ainsi de maintenir les differentes sources de donnees du LOD liees entre elles. Ces jeux de donnees ont egalement permis le developpement de services de detection des entites du Web des donnees dans une page du Web des documents (par exemple, DBpedia Spotlight). Ainsi, pour permettre l'emergence de nouveaux usages qui combineront les deux Webs, nous proposons un algorithme qui ordonne les entites detectees dans une page Web en fonc-tion d'une requete exprimant un besoin d'information. Nous montrons que cet algorithme est significativement meilleur que les approches de l'etat de l'art. Enfin, nous utilisons cet algo-rithme pour construire un systeme de generation de snippets semantiques dont nous montrons experimentalement l'utilite et l'utilisabilite. ABSTRACT. The advances of the Linked Open Data (LOD) initiative are giving rise to a more structured Web of data. Indeed, a few datasets act as hubs (e.g., DBpedia) connecting many other datasets. They also made possible new Web services for entity detection inside plain text (e.g., DBpedia Spotlight), thus allowing for new applications that will benefit from a combination of the Web of documents and the Web of data. To ease the emergence of these new use-cases, we propose an algorithm for the ranking of entities, detected inside a Web page, by taking into account an information need expressed as a query. We show that this algorithm is significantly more efficient than the state of the art. Finally, we use this algorithm for the construction of semantic snippets for which we evaluate the usability and the usefulness on a panel of users.","PeriodicalId":390974,"journal":{"name":"Conférence en Recherche d'Infomations et Applications","volume":"491 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2015-03-18","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"115883429","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
引用次数: 1
Clustering Spectral semi-supervisé avec propagation automatique des contraintes par paires 具有自动成对约束传播的半监督光谱聚类
Conférence en Recherche d'Infomations et Applications Pub Date : 2015-03-18 DOI: 10.24348/coria.2015.20
Nicolas Voiron, A. Benoit, Andrei Filip, P. Lambert, B. Ionescu
{"title":"Clustering Spectral semi-supervisé avec propagation automatique des contraintes par paires","authors":"Nicolas Voiron, A. Benoit, Andrei Filip, P. Lambert, B. Ionescu","doi":"10.24348/coria.2015.20","DOIUrl":"https://doi.org/10.24348/coria.2015.20","url":null,"abstract":"Dans un monde guide par les donnees, la classification est un outil essentiel pour aider les utilisateurs a apprehender la structure de ces donnees. Les techniques d’apprentissage supervise permettent d’obtenir de tres bonnes performances lorsque l’on dispose d’une base annotee, mais un risque de sur-apprentissage existe toujours. Il existe de nombreuses techniques de classification non supervisee qui cherchent a construire la structure des donnees sans disposer de donnees d’entrainement. Mais dans des contextes difficiles les resultats sont moins bons que ceux de l’apprentissage supervise. Pour ameliorer les performances, un bon compromis est d’apporter de la connaissance seulement sur les elements (classes et objets) ambigues. Dans ce contexte, cet article s’interesse au Clustering Spectral et a l’ajout de contrainte par paires. Nous introduisons une nouvelle generalisation de la propagation des contraintes qui maximise la qualite de partitionnement tout en reduisant les couts d’annotation.","PeriodicalId":390974,"journal":{"name":"Conférence en Recherche d'Infomations et Applications","volume":"47 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2015-03-18","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"132012409","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
引用次数: 0
SC-LSH: Une Méthode d'Indexation pour une Recherche de Similarité Approximative dans l'Espace Multidimensionnel SC-LSH:一种在多维空间中搜索近似相似度的索引方法
Conférence en Recherche d'Infomations et Applications Pub Date : 2015-03-18 DOI: 10.24348/coria.2015.47
Sanaa Chafik, Mounim A. El-Yacoubi, I. Daoudi, Hamid El Ouardi
{"title":"SC-LSH: Une Méthode d'Indexation pour une Recherche de Similarité Approximative dans l'Espace Multidimensionnel","authors":"Sanaa Chafik, Mounim A. El-Yacoubi, I. Daoudi, Hamid El Ouardi","doi":"10.24348/coria.2015.47","DOIUrl":"https://doi.org/10.24348/coria.2015.47","url":null,"abstract":"Locality Sensitive Hashing (LSH) est l'une des techniques les plus prometteuses pour la resolution des problemes de la recherche des plus proches voisins dans l'espace de grande dimension. Euclidien Exact LSH (E2LSH) est la variante la plus populaire du LSH qui a ete appliquee avec succes dans de nombreuses applications multimedia. Toutefois, l'E2LSH presente des limitations qui affectent les performances de recherche. La principale limitation de l'E2LSH est l'espace memoire important utilise. Afin de parvenir a une bonne qualite de recherche, un grand nombre de tables de hachage est necessaire. Ce papier propose un nouvel algorithme de hachage pour remedier au probleme d'espace de stockage, tout en conservant la bonne qualite de recherche et un meilleur temps de calcul. Les resultats experimentaux obtenus sur une base de donnees reelle a grand echelle montrent l'interet de notre approche","PeriodicalId":390974,"journal":{"name":"Conférence en Recherche d'Infomations et Applications","volume":"28 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2015-03-18","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"122178934","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
引用次数: 0
Dynamiques des popularités dans YouTube YouTube上的流行动态
Conférence en Recherche d'Infomations et Applications Pub Date : 2015-03-18 DOI: 10.24348/coria.2015.55
Cédric Richier, G. Linarès, Rachid El Azouzi, Tania Jiménez, Eitan Altman, Yonathan Portilla
{"title":"Dynamiques des popularités dans YouTube","authors":"Cédric Richier, G. Linarès, Rachid El Azouzi, Tania Jiménez, Eitan Altman, Yonathan Portilla","doi":"10.24348/coria.2015.55","DOIUrl":"https://doi.org/10.24348/coria.2015.55","url":null,"abstract":"RESUME. Cet article est une etude de l’evolution du nombre de vues des contenus dans YouTube. Nous proposons dans un premier temps plusieurs modeles inspires de l’economie et de la biologie pour caracteriser les courbes d’evolution des nombres de vues des videos. Dans un deuxieme temps, nous proposons une methode automatique de classification de ces courbes en les associant a l’un des differents modeles suggeres. Nous montrons, sur un large ensemble de donnees, que 90% des videos peuvent etre associees a l’un de ces modeles avec une erreur moyenne inferieure a 5%. Une etude empirique est menee au sujet de l’impact de la popularite et des categories de videos sur l’evolution des nombres de vues. Enfin, cette classification est utilisee dans un exemple de methode de prediction de la popularite des videos.","PeriodicalId":390974,"journal":{"name":"Conférence en Recherche d'Infomations et Applications","volume":"7 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2015-03-18","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"134575498","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
引用次数: 1
Thésaurus distributionnels pour la recherche d'information et vice-versa 分布同义词典的信息搜索,反之亦然
Conférence en Recherche d'Infomations et Applications Pub Date : 2015-03-18 DOI: 10.24348/coria.2015.79
V. Claveau, Ewa Kijak
{"title":"Thésaurus distributionnels pour la recherche d'information et vice-versa","authors":"V. Claveau, Ewa Kijak","doi":"10.24348/coria.2015.79","DOIUrl":"https://doi.org/10.24348/coria.2015.79","url":null,"abstract":"Les thesaurus distributionnels sont utiles a de nombreuses tâches du traitement automatique des langues. Dans cet article, nous abordons les problemes de leur construction et de leur evaluation sous l’angle de la recherche d’information. Deux contributions sont proposees. D’une part, en poursuite des travaux inities par Claveau et al., 2014, nous montrons comment les techniques de RI peuvent etre utilisees avec succes pour construire ces thesaurus. Au moyen d’une evaluation directe par comparaison avec des lexiques de reference et au travers de plusieurs experimentations, nous montrons que les resultats obtenus par des modeles de RI depassent les performances des systemes etat de l’art. D’autre part, nous utilisons la RI comme cadre applicatif pour proposer une evaluation indirecte des thesaurus produits. La encore, cette evaluation valide l’approche. Mais surtout, elle permet de mettre en regard les performances obtenues sur cette tâche avec celles des evaluations directes utilisees dans la litterature. Les differences constatees remettent en cause en partie ces pratiques d’evaluation.","PeriodicalId":390974,"journal":{"name":"Conférence en Recherche d'Infomations et Applications","volume":"38 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2015-03-18","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"115826236","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
引用次数: 9
Prédiction de la polysémie pour un terme biomédical 生物医学术语的多义词预测
Conférence en Recherche d'Infomations et Applications Pub Date : 2015-03-18 DOI: 10.24348/coria.2015.52
Juan Antonio Lossio-Ventura, Clement Jonquet, M. Roche, Maguelonne Teisseire
{"title":"Prédiction de la polysémie pour un terme biomédical","authors":"Juan Antonio Lossio-Ventura, Clement Jonquet, M. Roche, Maguelonne Teisseire","doi":"10.24348/coria.2015.52","DOIUrl":"https://doi.org/10.24348/coria.2015.52","url":null,"abstract":"La polysemie est la caracteristique d'un terme a avoir plusieurs significations. La prediction de la polysemie est une premiere etape pour l'Induction de Sens (IS), qui permet de trouver des significations differentes pour un terme, ainsi que pour les systemes d'extraction d'information. En outre, la detection de la polysemie est importante pour la construction et l'en-richissement de terminologies et d'ontologies. Dans cet article, nous presentons une nouvelle approche pour predire si un terme biomedical est polysemique ou non, avec l'objectif a long terme d'enrichir les ontologies biomedicales apres avoir desambiguiser les termes candidats. Cette approche est basee sur l'utilisation de techniques de meta-apprentissage, plus precise-ment sur des meta-descripteurs. Dans ce contexte, nous proposons la definition de nouveaux meta-descripteurs, extraits directement du texte, et d'un graphe de co-occurrences des termes. Notre methode donne des resultats tres satisfaisants, avec une exactitude et F-mesure de 0.978.","PeriodicalId":390974,"journal":{"name":"Conférence en Recherche d'Infomations et Applications","volume":"42 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2015-03-18","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"127531170","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
引用次数: 1
Extraction d'un vocabulaire de surprise par mélange de filtrage collaboratif et d'analyse de sentiments 通过协同过滤和情感分析的混合提取惊喜词汇
Conférence en Recherche d'Infomations et Applications Pub Date : 2015-03-18 DOI: 10.24348/coria.2015.21
Mickaël Poussevin, V. Guigue, P. Gallinari
{"title":"Extraction d'un vocabulaire de surprise par mélange de filtrage collaboratif et d'analyse de sentiments","authors":"Mickaël Poussevin, V. Guigue, P. Gallinari","doi":"10.24348/coria.2015.21","DOIUrl":"https://doi.org/10.24348/coria.2015.21","url":null,"abstract":"L'informatique subit actuellement une mutation profonde: les ameliorations mate- rielles et les grandes quantites de donnees disponibles fournissent un terrain fertile a la re- cherche en apprentissage automatique. Dans ce contexte, le principal defi est de tenir compte des preferences des utilisateurs pour proposer un acces personnalise a l'information. Les sys- temes de recommandation creent des profils utilisateurs et objets en utilisant les revues utilisa- teurs, et ces profils refletent les preferences des utilisateurs et les caracteristiques des objets. Nous proposons ici une analyse par combinaison de systemes de recommandation et classifieurs de polarite qui met en evidence le vocabulaire de la surprise. En effet, la recommandation ana- lyse le passe et anticipe les attentes d'un utilisateur tandis que le classifieur de polarite prend en entree une revue deja ecrite par l'utilisateur: nous montrons que l'ecart entre l'experience attendue et le retour reel sur un objet permet de construire un lexique de la surprise.","PeriodicalId":390974,"journal":{"name":"Conférence en Recherche d'Infomations et Applications","volume":"32 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2015-03-18","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"132959403","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
引用次数: 0
Apprentissage en temps réel pour la collecte d'information dans les réseaux sociaux 在社交网络中收集信息的实时学习
Conférence en Recherche d'Infomations et Applications Pub Date : 2015-03-18 DOI: 10.24348/coria.2015.34
Thibault Gisselbrecht, L. Denoyer, P. Gallinari, Sylvain Lamprier
{"title":"Apprentissage en temps réel pour la collecte d'information dans les réseaux sociaux","authors":"Thibault Gisselbrecht, L. Denoyer, P. Gallinari, Sylvain Lamprier","doi":"10.24348/coria.2015.34","DOIUrl":"https://doi.org/10.24348/coria.2015.34","url":null,"abstract":"Dans cet article nous nous interessons a la collecte d’information dans les reseaux sociaux. Cette tâche, primordiale pour de nombreuses applications, se heurte souvent a diverses contraintes liees aux ressources a disposition ou a des restrictions imposees par les API des medias consideres. Nous formulons cette tâche comme un probleme de selection dynamique de sources, pour lequel nous proposons une methode d’apprentissage pour orienter la collecte vers les donnees les plus pertinentes en fonction d’un besoin specifie. Notre methode est basee sur une extension d’un algorithme de bandit combinatoire recemment propose. Nous fournissons des garanties theoriques sur le comportement de l’algorithme, que nous evaluons ensuite sur differents jeux de donnees Twitter, a la fois hors ligne et en ligne, pour differents besoins de donnees exprimes.","PeriodicalId":390974,"journal":{"name":"Conférence en Recherche d'Infomations et Applications","volume":"1 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2015-03-18","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"130722822","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
引用次数: 1
Mesurer la proximité entre corpus par de nouveaux méta-descripteurs 用新的元描述符测量语料库之间的接近程度
Conférence en Recherche d'Infomations et Applications Pub Date : 2015-03-18 DOI: 10.24348/coria.2015.37
F. Bouillot, P. Poncelet, M. Roche
{"title":"Mesurer la proximité entre corpus par de nouveaux méta-descripteurs","authors":"F. Bouillot, P. Poncelet, M. Roche","doi":"10.24348/coria.2015.37","DOIUrl":"https://doi.org/10.24348/coria.2015.37","url":null,"abstract":"Devant le nombre d'algorithmes de classification existants, trouver l'algorithme qui sera le plus adapte pour classer un corpus de documents est une tâche difficile. La meta-classification apparait aujourd'hui tres utile pour aider a determiner, en fonction des expe-riences passees, quel devrait etre l'algorithme le plus pertinent par rapport a notre corpus. L'idee sous jacente est que \"si un algorithme s'est montre particulierement adapte pour un corpus , il devrait avoir le meme comportement sur un corpus assez similaire\". Dans cet article, nous proposons de nouveaux meta-descripteurs reposant sur les notions de similarites pour ameliorer l'etape de meta-classification. Les experimentations menees sur differents jeux de donnees reelles montrent la pertinence de nos nouveaux descripteurs.","PeriodicalId":390974,"journal":{"name":"Conférence en Recherche d'Infomations et Applications","volume":"16 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2015-03-18","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"134052644","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
引用次数: 0
Pertinence a Priori Basée sur la Diversit et la Temporalité des Signaux Sociaux 基于社会信号的多样性和时间性的先验相关性
Conférence en Recherche d'Infomations et Applications Pub Date : 2015-03-18 DOI: 10.24348/coria.2015.58
Ismail Badache, M. Boughanem
{"title":"Pertinence a Priori Basée sur la Diversit et la Temporalité des Signaux Sociaux","authors":"Ismail Badache, M. Boughanem","doi":"10.24348/coria.2015.58","DOIUrl":"https://doi.org/10.24348/coria.2015.58","url":null,"abstract":"Les signaux sociaux associes aux ressources Web peuvent etre consideres comme une information additionnelle qui peut jouer un role pour mesurer une importance a priori de la ressource independamment de la requete. Dans cet article, nous nous interessons particulierement a la temporalite associee a ces signaux ainsi que leur diversite. Nous supposons que l'importance a priori d'un document (ressource) depend non seulement de la qualite de ces signaux mais aussi de la date de leurs creations, la date de creation de la ressource ainsi que leur diversite. De ce fait, plutot que d'estimer cette importance (probabilite) a priori par un simple comptage des signaux lies au document, nous integrons egalement les dates de creation de la ressource, pour ne pas penaliser les nouvelles ressources, et des actions, ainsi qu'un facteur de diversite de ces signaux. Nous evaluons l'efficacite de notre approche sur la collection d'IMDb contenant 167438 ressources et leurs donnees sociales collectees a partir de plusieurs reseaux sociaux. Nos experiences montrent l'interet des signaux sociaux temporellement sensibilises a la selection des ressources pertinentes.","PeriodicalId":390974,"journal":{"name":"Conférence en Recherche d'Infomations et Applications","volume":"1 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2015-03-18","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"129702677","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
引用次数: 2
0
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
确定
请完成安全验证×
相关产品
×
本文献相关产品
联系我们:info@booksci.cn Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。 Copyright © 2023 布克学术 All rights reserved.
京ICP备2023020795号-1
ghs 京公网安备 11010802042870号
Book学术文献互助
Book学术文献互助群
群 号:604180095
Book学术官方微信