{"title":"Identification Semi-Automatique de Mots-Germes pour l'Analyse de Sentiments et son Intensité","authors":"Amal Htait, S. Fournier, P. Bellot","doi":"10.24348/coria.2017.RJCRI_10","DOIUrl":null,"url":null,"abstract":"Dans le but d'exploiter les opinions dans les tweets, cet article presente une classification a partir du sentiment contenu au sein des tweets. Nous presentons une methode d'identifi-cation de nouveaux mots-germes. Ils sont utilises pour la prediction de l'intensite de sentiments des mots en co-occurrence avec ces mots-germes. Ensuite, le calcul de similarites entre sentiments est applique en utilisant: la mesure de la similarite entre deux mots et l'utilisation de plongement de mots (e.g. word2vec, GloVE) couple a la mesure cosinus. Les resultats montrent l'importance de l'utilisation de mots-germes adaptes aux tweets, ainsi que la taille et le pretrai-tement de corpus. Pour conclure, nous avons obtenu les meilleurs resultats grâce a l'application de la methode utilisant le plongement de mots couplee a la mesure cosinus. ABSTRACT. For the purpose of opinion exploring in tweets, this article presents a sentiment classification of tweets content. First, we present a method to identify new sentiment similarity seed words. These seed words are used for predicting sentiment intensity of other words and short phrases in co-occurrence. Then, for testing sentiment similarity, we use: Similarity Measures methods between words and cosine similarity measure between the word embedding representations (e.g. word2vec, GloVE). The experiments results highlight the importance of adapted for tweets seed words. In addition of the corpora size and its pre-treatement. As a conclusion, best results were achieved using cosine similarity measure between the word embedding representations. MOTS-CLES : Mots-germes, Twitter, Mesure de la Similarite, Plongement de mot, Word2vec, GloVe.","PeriodicalId":390974,"journal":{"name":"Conférence en Recherche d'Infomations et Applications","volume":"9 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2017-03-29","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"7","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Conférence en Recherche d'Infomations et Applications","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.24348/coria.2017.RJCRI_10","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 7
Abstract
Dans le but d'exploiter les opinions dans les tweets, cet article presente une classification a partir du sentiment contenu au sein des tweets. Nous presentons une methode d'identifi-cation de nouveaux mots-germes. Ils sont utilises pour la prediction de l'intensite de sentiments des mots en co-occurrence avec ces mots-germes. Ensuite, le calcul de similarites entre sentiments est applique en utilisant: la mesure de la similarite entre deux mots et l'utilisation de plongement de mots (e.g. word2vec, GloVE) couple a la mesure cosinus. Les resultats montrent l'importance de l'utilisation de mots-germes adaptes aux tweets, ainsi que la taille et le pretrai-tement de corpus. Pour conclure, nous avons obtenu les meilleurs resultats grâce a l'application de la methode utilisant le plongement de mots couplee a la mesure cosinus. ABSTRACT. For the purpose of opinion exploring in tweets, this article presents a sentiment classification of tweets content. First, we present a method to identify new sentiment similarity seed words. These seed words are used for predicting sentiment intensity of other words and short phrases in co-occurrence. Then, for testing sentiment similarity, we use: Similarity Measures methods between words and cosine similarity measure between the word embedding representations (e.g. word2vec, GloVE). The experiments results highlight the importance of adapted for tweets seed words. In addition of the corpora size and its pre-treatement. As a conclusion, best results were achieved using cosine similarity measure between the word embedding representations. MOTS-CLES : Mots-germes, Twitter, Mesure de la Similarite, Plongement de mot, Word2vec, GloVe.
为了利用推文中的观点,本文根据推文中的情绪进行了分类。我们提出了一种识别新细菌词的方法。它们被用来预测与这些胚芽词同时出现的单词的情感强度。然后,通过测量两个单词之间的相似性和使用单词跳转(如word2vec, GloVE)对余弦测量来计算感觉之间的相似性。结果表明,使用适合tweets的胚芽词的重要性,以及语料库的大小和预处理。综上所述,我们将单词浸入法应用于余弦测量,得到了最好的结果。文摘。为了探讨推文中的意见,本文提出了推文内容的情感分类。本方法,查明了First, we new similarity seed words的感觉。seed These words are used for降解感情顺利,short of other words and in co-occurrence句子。然后,为了测试感觉相似性,我们使用:单词之间的相似性测量方法和单词嵌入表示之间的cosine相似性测量方法(例如word2vec, GloVE)。= =地理= =根据美国人口普查,这个县的面积为。= =地理根据美国人口普查,这个县的总面积是土地和水。= =地理= =根据美国人口普查,这个县的面积为,其中土地面积为。关键词:细菌关键词,Twitter,相似度测量,单词潜水,Word2vec,手套。