Thibault Gisselbrecht, L. Denoyer, P. Gallinari, Sylvain Lamprier
{"title":"Apprentissage en temps réel pour la collecte d'information dans les réseaux sociaux","authors":"Thibault Gisselbrecht, L. Denoyer, P. Gallinari, Sylvain Lamprier","doi":"10.24348/coria.2015.34","DOIUrl":null,"url":null,"abstract":"Dans cet article nous nous interessons a la collecte d’information dans les reseaux sociaux. Cette tâche, primordiale pour de nombreuses applications, se heurte souvent a diverses contraintes liees aux ressources a disposition ou a des restrictions imposees par les API des medias consideres. Nous formulons cette tâche comme un probleme de selection dynamique de sources, pour lequel nous proposons une methode d’apprentissage pour orienter la collecte vers les donnees les plus pertinentes en fonction d’un besoin specifie. Notre methode est basee sur une extension d’un algorithme de bandit combinatoire recemment propose. Nous fournissons des garanties theoriques sur le comportement de l’algorithme, que nous evaluons ensuite sur differents jeux de donnees Twitter, a la fois hors ligne et en ligne, pour differents besoins de donnees exprimes.","PeriodicalId":390974,"journal":{"name":"Conférence en Recherche d'Infomations et Applications","volume":"1 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2015-03-18","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"1","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Conférence en Recherche d'Infomations et Applications","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.24348/coria.2015.34","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 1
Abstract
Dans cet article nous nous interessons a la collecte d’information dans les reseaux sociaux. Cette tâche, primordiale pour de nombreuses applications, se heurte souvent a diverses contraintes liees aux ressources a disposition ou a des restrictions imposees par les API des medias consideres. Nous formulons cette tâche comme un probleme de selection dynamique de sources, pour lequel nous proposons une methode d’apprentissage pour orienter la collecte vers les donnees les plus pertinentes en fonction d’un besoin specifie. Notre methode est basee sur une extension d’un algorithme de bandit combinatoire recemment propose. Nous fournissons des garanties theoriques sur le comportement de l’algorithme, que nous evaluons ensuite sur differents jeux de donnees Twitter, a la fois hors ligne et en ligne, pour differents besoins de donnees exprimes.