{"title":"Réseau de neurones profond et SVM pour la classification des sentiments","authors":"Abdelhalim Rafrafi, V. Guigue, P. Gallinari","doi":"10.24348/coria.2011.121","DOIUrl":"https://doi.org/10.24348/coria.2011.121","url":null,"abstract":"Le developpement des forums, des blogs et de la vente en ligne pousse les utilisateurs a laisser de plus en plus d’informations en libre acces sur le web. Une partie de ces informations decrit des sentiments: elles permettent de developper des modeles d’analyse d’opinions et de faire des sondages dans divers domaines en recuperant simplement ces donnees textuelles. Nous proposons d’utiliser des reseaux de neurones pour apprendre des modeles de classification d’opinions efficaces. L’architecture retenue mele des couches de neurones classiques et des couches de convolution, elle permet de projeter les mots dans un espace semantique continu. Nous avons compare notre travail avec un modele SVM sur le corpus multi-thematiques Amazon. Nos experiences aboutissent a des performances identiques aux SVM et a de l’etat de l’art. Cependant les modeles se comportent differemment et les erreurs ne concernent pas les memes documents: il est possible d’ameliorer les performances en combinant les modeles.","PeriodicalId":390974,"journal":{"name":"Conférence en Recherche d'Infomations et Applications","volume":"37 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2011-03-01","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"134350109","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
{"title":"Une approche multi-vue pour l'extraction terminologique bilingue","authors":"Raphaël Rubino, G. Linarès","doi":"10.24348/coria.2011.97","DOIUrl":"https://doi.org/10.24348/coria.2011.97","url":null,"abstract":"RESUME. Ce papier presente une approche multi-vue pour la traduction de termes de special-ite, basee sur un lexique bilingue et un corpus comparable. Nous proposons d'etudier dif-ferents niveaux de representation pour un terme : le contexte, le theme et la graphie. Ces trois approches sont tout d'abord etudiees individuellement, puis combinees afin de selection-ner les meilleures traductions. Des experiences menees sur la traduction de termes medicaux du francais vers l'anglais montrent une amelioration de l'approche classique par contexte, at-teignant une precision de 80,4% de bonnes traductions au rang 1. ABSTRACT. This paper presents a multi-view approach for term translation spotting, based on a bilingual lexicon and comparable corpora. We propose to study different levels of representation for a term: the context, the theme and the orthography. These three approaches are studied individually and combined in order to rank translation candidates. We focus our task on French-English medical terms. Experiments on our new model show a significant improvement of the classical context-based approach, with a precision score of 80.4% for the first ranked translation candidates.","PeriodicalId":390974,"journal":{"name":"Conférence en Recherche d'Infomations et Applications","volume":"212 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2011-03-01","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"131851557","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
{"title":"Apprentissage des schémas de propagation dans les multi-graphes","authors":"Y. Jacob, L. Denoyer, P. Gallinari","doi":"10.24348/coria.2011.159","DOIUrl":"https://doi.org/10.24348/coria.2011.159","url":null,"abstract":"Nous considerons le probleme de l’etiquetage de noeuds dans un multi-graphe - ou graphe multi-relationnel - dans lequel les noeuds peuvent etre connectes simultanement par differents types de relations. De nombreux problemes se modelisent ainsi, comme par exemple les reseaux sociaux ou bien les bases de donnees bibliographiques. Les relations peuvent etre explicites (par exemple amitie dans un reseau social) ou bien implicite (par exemple des similarites de contenu calculees sur les donnees). Nous proposons ici un algorithme ’apprentissage permettant d’exploiter l’information multi-relationnelle pour la tâche d’etiquetage automatique. Cette methode est capable d’apprendre a combiner de maniere optimale l’influence des differents types de relations sur la propagation des etiquettes entre les noeuds du graphe. Nous decrivons des experiences sur quatre corpus qui montrent la capacite du modele a tirer parti de l’information multi-relationnelle pour des tâches d’etiquetage complexes.","PeriodicalId":390974,"journal":{"name":"Conférence en Recherche d'Infomations et Applications","volume":"2 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2011-03-01","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"123906470","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Georges Quénot, T. Tan, V. Le, S. Ayache, Laurent Besacier, Philippe Mulhem
{"title":"Recherche par le contenu dans des documents audiovisuels multilingues","authors":"Georges Quénot, T. Tan, V. Le, S. Ayache, Laurent Besacier, Philippe Mulhem","doi":"10.24348/coria.2009.67","DOIUrl":"https://doi.org/10.24348/coria.2009.67","url":null,"abstract":"ABSTRACT. We present in this paper an approach based on the use of the International PhoneticAlphabet (IPA) for content-based indexing and retrieval of multilingual audiovisual documents.The approach works even if the languages of the document are unknown. It has been validatedin the context of the “Star Challenge” search engine competition organized by the A*STARAgency of Singapore. Our approach includes the building of an IPA-based multilingual acousticmodel and a dynamic programming based method for searching document segments by “IPAstring spotting”. Dynamic programming allows for retrieving the query string in the documentstring even with a significant transcription error rate at the phone level. The methods that wedeveloped ranked us as first and third on the monolingual (English) search task, as fifth on themultilingual search task and as first on the multimodal (audio and image) search task. MOTS-CLES : Recherche audio, Multilingue, Alphabet Phonetique International, ProgrammationDynamique, Star Challenge","PeriodicalId":390974,"journal":{"name":"Conférence en Recherche d'Infomations et Applications","volume":"4 9 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2010-08-20","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"125600888","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
{"title":"Vectorisation des processus d'appariement document-requête","authors":"V. Claveau, Romain Tavenard, Laurent Amsaleg","doi":"10.24348/coria.2010.313","DOIUrl":"https://doi.org/10.24348/coria.2010.313","url":null,"abstract":"Dans la plupart des applications de RI, calculer rapidement la proximite entre documents et requetes est crucial. Avec les modeles vectoriels, ce calcul se fait generalement de maniere tres efficace. Cependant, lorsque les requetes sont tres longues ou dans le cas de SRI bases sur des modeles plus avances, ce calcul devient plus complexe et couteux. Dans cet article, nous proposons une technique simple pour transformer n'importe quel processus d'appariement requete-document fournissant un score en un probleme de calcul de distance entre vecteurs. Cette approche peut ainsi beneficier des bonnes performances des outils existants d'indexation et de recherche approximative dans des espaces de grandes dimensions. Au travers de quelques experiences, nous montrons par ailleurs que cette representation n'entraine pas de baisse importante de qualite des resultats, et, lorsque de nombreux documents sont a retourner, ameliore meme le rappel par rapport au SRI original, a taille de resultat egal.","PeriodicalId":390974,"journal":{"name":"Conférence en Recherche d'Infomations et Applications","volume":"27 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2010-03-18","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"116970986","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Hassan Saneifar, S. Bonniol, A. Laurent, P. Poncelet, M. Roche
{"title":"Recherche de passages pertinents dans les fichiers logs par enrichissement de requêtes","authors":"Hassan Saneifar, S. Bonniol, A. Laurent, P. Poncelet, M. Roche","doi":"10.24348/coria.2010.239","DOIUrl":"https://doi.org/10.24348/coria.2010.239","url":null,"abstract":"Les systemes de question reponse sont consideres comme la prochaine generation des moteurs de recherche. Notre article s'interesse a la premiere etape d'un tel processus qui consiste a rechercher des passages pertinents possedant des reponses. Une telle tâche peut se reveler difficile en raison de la complexite des donnees traitees, des fichiers logs dans notre cas. Notre contribution repose sur un double enrichissement de requetes primitives en utilisant une methode d'apprentissage fondee sur la notion de \"monde lexical\", des connaissances morpho-syntaxiques et une nouvelle fonction de ponderation des termes. Cette fonction originale a pour objectif d'attribuer un poids eleve aux termes susceptibles d'etre correles au contexte de reponse. Les experimentations menees sur des donnees reelles montrent que notre protocole d'enrichissement des requetes permet d'extraire les passages pertinents par rapport aux questions.","PeriodicalId":390974,"journal":{"name":"Conférence en Recherche d'Infomations et Applications","volume":"34 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2010-03-18","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"127609862","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Yassine Mrabet, Nacéra Bennacer, Nathalie Pernelle, M. Thiam
{"title":"Une approche pour la recherche sémantique de l'information dans les documents semi-structurés hétérogènes","authors":"Yassine Mrabet, Nacéra Bennacer, Nathalie Pernelle, M. Thiam","doi":"10.24348/coria.2010.195","DOIUrl":"https://doi.org/10.24348/coria.2010.195","url":null,"abstract":"Ce papier presente SHIRI-Querying, une approche pour la recherche semantique de l'information dans les documents semi-structures. Nous proposons une solution pour pallier l'incompletude et l'imprecision des annotations au moment de l'interrogation. Cette solution repose sur deux types de reformulations elementaires qui exploitent la notion d'agregation et la structure des documents. Nous presentons l'algorithme DREQ qui combine ces transformations elementaires pour construire des reformulations ordonnees de la requete utilisateur. L'etude de notre approche sur deux corpus reels montre que les reformulations augmentent considerablement le rappel et que la precision est meilleure pour les premieres reponses retournees.","PeriodicalId":390974,"journal":{"name":"Conférence en Recherche d'Infomations et Applications","volume":"2 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2010-03-18","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"122857126","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
{"title":"Classification Supervisée de Questions : Rôle de l'Expansion Sémantique","authors":"A. Harb, J. Girardot, M. Beigbeder","doi":"10.24348/coria.2010.147","DOIUrl":"https://doi.org/10.24348/coria.2010.147","url":null,"abstract":"Responding correctly to a question given a large collection of textual data is not an easy task. There is a need to perceive and recognize the question at a level that permits to detect some constraints that the question imposes on possible answers. The question classification task is used in Question Answering systems. This deduces the type of the expected answer, to perform a semantic classification to the target answer. The purpose is to provide additional information to reduce the gap between answer and question. An approach to improve the effectiveness of classifiers focusing on linguistic analysis and statistical approaches. This work also proposes two methods of questions expansion. Various questions representation, term weighting and diverse machine learning algorithms are studied. Experiments conducted on actual data are presented. Of interest is the improvement in the precision on the classification of questions. MOTS-CLES : Classification, Selections des descripteurs, Expansion semantique, Apprentissage, Fouille de texte.","PeriodicalId":390974,"journal":{"name":"Conférence en Recherche d'Infomations et Applications","volume":"1 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2010-03-18","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"129476387","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
{"title":"Vers un modèle de Recherche d'Information Sociale pour l'accès aux ressources bibliographiques","authors":"Lamjed Ben Jabeur, Lynda Tamine","doi":"10.24348/coria.2010.403","DOIUrl":"https://doi.org/10.24348/coria.2010.403","url":null,"abstract":"Cet article propose une nouvelle approche, basee sur les reseaux sociaux, pour l'acces aux ressources bibliographiques. Nous introduisons un modele d'information sociale dont les auteurs sont les principales entites et les relations sont extraites a partir des liens de coauteur et de citation. En effet, ces relations sont ponderees a l'aide d'une mesure d'entropie qui tient compte des interactions au voisinage social du document et des annotations sociales produites par les utilisateurs. Dans ce modele, la pertinence d'un document est calculee par combinaison de la pertinence thematique et de la pertinence derivee de l'importance sociale des auteurs associes. Nous montrons la viabilite de notre modele par une serie d'experimentations basees sur une collection d'articles scientifiques dont les annotation sociales sont collectees depuis le reseau social academique \"CiteULike.org\".","PeriodicalId":390974,"journal":{"name":"Conférence en Recherche d'Infomations et Applications","volume":"28 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2010-03-18","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"114906776","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
{"title":"Du e-commerce au m-commerce : vers une recommandation incrémentale","authors":"Armelle Brun, A. Boyer","doi":"10.24348/coria.2010.51","DOIUrl":"https://doi.org/10.24348/coria.2010.51","url":null,"abstract":"Les systemes de recommandation, et notamment le filtrage collaboratif, sont traditionnellement utilises dans les domaines du e-commerce et de la navigation web pour suggerer des ressources pertinentes aux utilisateurs au moment adequat. Dans des approches dites \"modele\", nous pouvons trouver les modeles a base d'usage et les regles d'association. Dans la litterature, ces modeles sont presentes comme des systemes temps-reel. Ces dernieres annees, le domaine du m-commerce a emerge, dans lequel les recommandations sont diffusees sur un mobile au lieu de l'ecran d'un ordinateur. Il faut donc adapter les techniques de recommandation aux nouvelles contraintes des terminaux mobiles. En particulier, puisque le respect de la vie privee est un objectif important, une facon de la preserver est de stocker les systemes de recommandation sur le mobile. Cependant, bien que les systemes de recommandation a base d'usage sont temps-reel, la generation des recommandations est complexe, et dans le cas ou ils sont stockes sur le mobile, ils peuvent ne plus etre temps-reel. Dans cet article, nous proposons un nouveau systeme de recommandation incremental, a base d'usage, dans le but d'obtenir des recommandations instantanees dans le cadre du m-commerce","PeriodicalId":390974,"journal":{"name":"Conférence en Recherche d'Infomations et Applications","volume":"18 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2010-03-18","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"130936707","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}