{"title":"Recherche de conversations dans les réseaux sociaux : modélisation et expérimentations sur Twitter","authors":"Nawal Ould Amer, Philippe Mulhem, Mathias Géry","doi":"10.24348/coria.2015.6","DOIUrl":null,"url":null,"abstract":"La problematique etudiee dans cet article est celle de l'indexation et de la recherche de conversations dans les reseaux sociaux. Une conversation est un ensemble de messages echanges entre utilisateurs, a la suite d'un message initial. La demarche proposee se base sur une modelisation probabiliste, et detaille en particulier l'utilisation d'informations sociales dans le reseau Twitter. Notre proposition est evaluee sur un corpus de conversations contenant plus de 50 000 tweets, et sur un ensemble de 15 requetes tirees pour partie des campagnes TREC Microblog (Lin et Efron, 2013). Les resultats obtenus en combinant les elements de contenu et les elements sociaux sur ce corpus sont statistiquement significativement meilleurs que ceux de notre approche utilisant le contenu seul ainsi que ceux d'une approche a base de BM25.","PeriodicalId":390974,"journal":{"name":"Conférence en Recherche d'Infomations et Applications","volume":"33 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2015-03-18","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"7","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Conférence en Recherche d'Infomations et Applications","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.24348/coria.2015.6","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 7
Abstract
La problematique etudiee dans cet article est celle de l'indexation et de la recherche de conversations dans les reseaux sociaux. Une conversation est un ensemble de messages echanges entre utilisateurs, a la suite d'un message initial. La demarche proposee se base sur une modelisation probabiliste, et detaille en particulier l'utilisation d'informations sociales dans le reseau Twitter. Notre proposition est evaluee sur un corpus de conversations contenant plus de 50 000 tweets, et sur un ensemble de 15 requetes tirees pour partie des campagnes TREC Microblog (Lin et Efron, 2013). Les resultats obtenus en combinant les elements de contenu et les elements sociaux sur ce corpus sont statistiquement significativement meilleurs que ceux de notre approche utilisant le contenu seul ainsi que ceux d'une approche a base de BM25.