Analiza sentimenta komentarjev hotelov z uporabo slovarjev in metode Naivni Bayes

Nina Murks, Anže Omerzu, Borko Bošković
{"title":"Analiza sentimenta komentarjev hotelov z uporabo slovarjev in metode Naivni Bayes","authors":"Nina Murks, Anže Omerzu, Borko Bošković","doi":"10.18690/978-961-286-516-0.15","DOIUrl":null,"url":null,"abstract":"V £lanku smo predstavili pristop k analizi sen-timenta komentarjev hotelskih gostov s pomo£jo slovarjev in metode Naivni Bayes. Najprej smo zgradili slovarja sentimenta, ki sta vsebovala n-grame, ter njihove verjetnosti, da pripadajo pozi-tivnemu ali negativnemu razredu. Nato smo s po-mo£jo zgrajenih slovarjev klasificirali komentarje hotelov, pri £emer smo uporabili metodo Naivni Bayes. Pri klasifikaciji komentarjev s mo ra£u-nali klasifikacijske vrednosti o z. verjetnosti, da so posamezni komentarji pozitivni ali negativni. Komentarje smo klasificirali s p omo£jo unigra-mov in bigramov, ter rezultate primerjali z re-zultati iz literature. Pri unigramih smo dosegli natan£nost 0,92, pri bigramih je natan£nost zna-šala 0,80. Klasifikacijske v rednosti posameznih komentarjev smo si shranili, pri £emer smo pri komentarjih, ki smo jih klacificirali kot negativne, dodali negativen predznak. Predzna£ene klasifi-kacijske vrednosti smo nato sešteli, za vsak hotel ter na tak na£in izra£unali hotelom pripadajo£e to£ke. To£ke hotelov so v našem primeru poka-zatelj splošnega zadovoljstva hotelskih gostov, ki ga najdemo v komentarjih. Glede na to£ke smo hotele uredili po vrsti in prišli do lestvice hote-lov, pri katerih najdemo najbolj pozitivne komen-tarje.","PeriodicalId":282591,"journal":{"name":"Proceedings of the 2021 7th Student Computer Science Research Conference (StuCoSReC)","volume":"10 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2021-09-13","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Proceedings of the 2021 7th Student Computer Science Research Conference (StuCoSReC)","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.18690/978-961-286-516-0.15","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0

Abstract

V £lanku smo predstavili pristop k analizi sen-timenta komentarjev hotelskih gostov s pomo£jo slovarjev in metode Naivni Bayes. Najprej smo zgradili slovarja sentimenta, ki sta vsebovala n-grame, ter njihove verjetnosti, da pripadajo pozi-tivnemu ali negativnemu razredu. Nato smo s po-mo£jo zgrajenih slovarjev klasificirali komentarje hotelov, pri £emer smo uporabili metodo Naivni Bayes. Pri klasifikaciji komentarjev s mo ra£u-nali klasifikacijske vrednosti o z. verjetnosti, da so posamezni komentarji pozitivni ali negativni. Komentarje smo klasificirali s p omo£jo unigra-mov in bigramov, ter rezultate primerjali z re-zultati iz literature. Pri unigramih smo dosegli natan£nost 0,92, pri bigramih je natan£nost zna-šala 0,80. Klasifikacijske v rednosti posameznih komentarjev smo si shranili, pri £emer smo pri komentarjih, ki smo jih klacificirali kot negativne, dodali negativen predznak. Predzna£ene klasifi-kacijske vrednosti smo nato sešteli, za vsak hotel ter na tak na£in izra£unali hotelom pripadajo£e to£ke. To£ke hotelov so v našem primeru poka-zatelj splošnega zadovoljstva hotelskih gostov, ki ga najdemo v komentarjih. Glede na to£ke smo hotele uredili po vrsti in prišli do lestvice hote-lov, pri katerih najdemo najbolj pozitivne komen-tarje.
在本文中,我们介绍了一种使用词典和 Naive Bayes 方法分析酒店客人评论情感的方法。首先,我们构建了情感词典,其中包含 n 个语法及其属于正面或负面类别的概率。然后,利用建立的词典,我们采用 Naive Bayes 方法对酒店评论进行分类。在对评论进行分类时,我们可以使用分类值来找出每条评论属于正面或负面的概率。我们使用单字符和双字符对评论进行了分类,并将结果与文献中的结果进行了比较。单字词分类的准确率为 0.92,双字词分类的准确率为 0.80。我们存储了单条评论的分类规律,并在分类为负面的评论上添加了负号。然后,我们将每家酒店的分类值相加,计算出分配给酒店的分数。在我们的案例中,酒店分数是酒店客人整体满意度的一个指标,可以在评论中找到。根据得分,我们对酒店进行了排序,得出了正面评论最多的酒店排名。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
求助全文
约1分钟内获得全文 求助全文
来源期刊
自引率
0.00%
发文量
0
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
确定
请完成安全验证×
copy
已复制链接
快去分享给好友吧!
我知道了
右上角分享
点击右上角分享
0
联系我们:info@booksci.cn Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。 Copyright © 2023 布克学术 All rights reserved.
京ICP备2023020795号-1
ghs 京公网安备 11010802042870号
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术官方微信