Twitter文件对Corona病毒影响的情绪分析使用了Naive Bayes Classifier的方法

Ni Made Ayu Juli Astari, D. Divayana, G. Indrawan
{"title":"Twitter文件对Corona病毒影响的情绪分析使用了Naive Bayes Classifier的方法","authors":"Ni Made Ayu Juli Astari, D. Divayana, G. Indrawan","doi":"10.30864/jsi.v15i1.332","DOIUrl":null,"url":null,"abstract":"Virus Corona menjadi permasalahan internasional pada tahun 2020. Hal ini sangat berdampak bagi kehidupan masyarakat. Pemerintah Indonesia mengambil peran dalam menekan peningkatan jumlah penderita virus Corona dengan cara membatasi kegiatan masyarakat di luar rumah. Salah satu dampak yang signifikan dari Virus Corona adalah di sektor perekonomian. Oleh karena itu, perlu dilakukan analisis sentimen untuk menentukan kecenderungan opini masyarakat terhadap dampak virus Corona. Twitter merupakan salah satu platform yang digunakan oleh masyarakat untuk mengekspresikan kondisi terkini setelah virus Corona merambah. Tujuan dari penelitian ini adalah memperoleh analisis dokumen text untuk mendapatkan sentimen positif atau negatif masyarakat. Data yang digunakan merupakan dokumen tweet dari Twitter mengenai dampak virus Corona. Data yang terkumpul dibagi untuk digunakan sebagai data latih dan data uji proses klasifikasi. Metode yang digunakan untuk klasifikasi dalam penelitian ini adalah Metode Naive Bayes Classifier. Hasil klasifikasi dievaluasi menggunakan accuracy dan error rate dengan tujuan mengetahui keakuratan dokumen setelah diklasifikasi menjadi sentimen positif atau negatif. Hasil penelitian menunjukkan metode Naive Bayes mampu mengklasifikasi dokumen tweet dengan akurasi 67% dan error rate sebesar 33%. Percobaan dengan menggunakan 3 jumlah data berbeda (100, 200, dan 500) menghasilkan selisih nilai akurasi  yang tidak jauh berbeda yaitu 0,02. Hal ini menunjukkan metode Naive Bayes untuk klasifikasi data tweet terkait dampak virus Corona menghasilkan performa yang stabil. Nilai accuracy yang diperoleh cukup baik dan penelitian selanjutnya bisa dikembangkan dengan memperhitungkan unsur semantik pada dokumen tweet.","PeriodicalId":30123,"journal":{"name":"Journal of Systems Integration","volume":null,"pages":null},"PeriodicalIF":0.0000,"publicationDate":"2020-11-30","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"23","resultStr":"{\"title\":\"Analisis Sentimen Dokumen Twitter Mengenai Dampak Virus Corona Menggunakan Metode Naive Bayes Classifier\",\"authors\":\"Ni Made Ayu Juli Astari, D. Divayana, G. Indrawan\",\"doi\":\"10.30864/jsi.v15i1.332\",\"DOIUrl\":null,\"url\":null,\"abstract\":\"Virus Corona menjadi permasalahan internasional pada tahun 2020. Hal ini sangat berdampak bagi kehidupan masyarakat. Pemerintah Indonesia mengambil peran dalam menekan peningkatan jumlah penderita virus Corona dengan cara membatasi kegiatan masyarakat di luar rumah. Salah satu dampak yang signifikan dari Virus Corona adalah di sektor perekonomian. Oleh karena itu, perlu dilakukan analisis sentimen untuk menentukan kecenderungan opini masyarakat terhadap dampak virus Corona. Twitter merupakan salah satu platform yang digunakan oleh masyarakat untuk mengekspresikan kondisi terkini setelah virus Corona merambah. Tujuan dari penelitian ini adalah memperoleh analisis dokumen text untuk mendapatkan sentimen positif atau negatif masyarakat. Data yang digunakan merupakan dokumen tweet dari Twitter mengenai dampak virus Corona. Data yang terkumpul dibagi untuk digunakan sebagai data latih dan data uji proses klasifikasi. Metode yang digunakan untuk klasifikasi dalam penelitian ini adalah Metode Naive Bayes Classifier. Hasil klasifikasi dievaluasi menggunakan accuracy dan error rate dengan tujuan mengetahui keakuratan dokumen setelah diklasifikasi menjadi sentimen positif atau negatif. Hasil penelitian menunjukkan metode Naive Bayes mampu mengklasifikasi dokumen tweet dengan akurasi 67% dan error rate sebesar 33%. Percobaan dengan menggunakan 3 jumlah data berbeda (100, 200, dan 500) menghasilkan selisih nilai akurasi  yang tidak jauh berbeda yaitu 0,02. Hal ini menunjukkan metode Naive Bayes untuk klasifikasi data tweet terkait dampak virus Corona menghasilkan performa yang stabil. Nilai accuracy yang diperoleh cukup baik dan penelitian selanjutnya bisa dikembangkan dengan memperhitungkan unsur semantik pada dokumen tweet.\",\"PeriodicalId\":30123,\"journal\":{\"name\":\"Journal of Systems Integration\",\"volume\":null,\"pages\":null},\"PeriodicalIF\":0.0000,\"publicationDate\":\"2020-11-30\",\"publicationTypes\":\"Journal Article\",\"fieldsOfStudy\":null,\"isOpenAccess\":false,\"openAccessPdf\":\"\",\"citationCount\":\"23\",\"resultStr\":null,\"platform\":\"Semanticscholar\",\"paperid\":null,\"PeriodicalName\":\"Journal of Systems Integration\",\"FirstCategoryId\":\"1085\",\"ListUrlMain\":\"https://doi.org/10.30864/jsi.v15i1.332\",\"RegionNum\":0,\"RegionCategory\":null,\"ArticlePicture\":[],\"TitleCN\":null,\"AbstractTextCN\":null,\"PMCID\":null,\"EPubDate\":\"\",\"PubModel\":\"\",\"JCR\":\"\",\"JCRName\":\"\",\"Score\":null,\"Total\":0}","platform":"Semanticscholar","paperid":null,"PeriodicalName":"Journal of Systems Integration","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.30864/jsi.v15i1.332","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 23

摘要

冠状病毒在2020年成为一个国际问题。这对社会生活产生了巨大影响。印度尼西亚政府通过限制外来人口的活动,在推动增加感染冠状病毒的人数方面发挥了作用。冠状病毒的一个重要影响是经济部门。因此,需要进行情感分析,以确定公众对冠状病毒影响的倾向。推特是人们用来表达冠状病毒崩溃后最新情况的平台之一。本研究的目的是对文本文件进行分析,以获得社会的积极或消极情绪。使用的数据是推特上关于冠状病毒影响的推文文件。收集的数据被共享,用作分类过程的训练数据和测试数据。本研究中用于分类的方法是朴素贝叶斯分类器方法。使用准确性和错误率来评估分类结果,以便在分类变成积极或消极情绪之后确定文档大小。研究表明,Naive Bayes方法能够对推特文档进行分类,准确率为67%,错误率为33%。使用3个不同数据集(100、200和500)的实验产生了一个非常不同的0,02的精度值的一小部分。这表明,Naive Bayes方法对与冠状病毒影响相关的推特数据进行分类,产生了稳定的性能。获得的准确性相当好,可以通过计算推文文档上的语义元素来进行进一步的研究。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
Analisis Sentimen Dokumen Twitter Mengenai Dampak Virus Corona Menggunakan Metode Naive Bayes Classifier
Virus Corona menjadi permasalahan internasional pada tahun 2020. Hal ini sangat berdampak bagi kehidupan masyarakat. Pemerintah Indonesia mengambil peran dalam menekan peningkatan jumlah penderita virus Corona dengan cara membatasi kegiatan masyarakat di luar rumah. Salah satu dampak yang signifikan dari Virus Corona adalah di sektor perekonomian. Oleh karena itu, perlu dilakukan analisis sentimen untuk menentukan kecenderungan opini masyarakat terhadap dampak virus Corona. Twitter merupakan salah satu platform yang digunakan oleh masyarakat untuk mengekspresikan kondisi terkini setelah virus Corona merambah. Tujuan dari penelitian ini adalah memperoleh analisis dokumen text untuk mendapatkan sentimen positif atau negatif masyarakat. Data yang digunakan merupakan dokumen tweet dari Twitter mengenai dampak virus Corona. Data yang terkumpul dibagi untuk digunakan sebagai data latih dan data uji proses klasifikasi. Metode yang digunakan untuk klasifikasi dalam penelitian ini adalah Metode Naive Bayes Classifier. Hasil klasifikasi dievaluasi menggunakan accuracy dan error rate dengan tujuan mengetahui keakuratan dokumen setelah diklasifikasi menjadi sentimen positif atau negatif. Hasil penelitian menunjukkan metode Naive Bayes mampu mengklasifikasi dokumen tweet dengan akurasi 67% dan error rate sebesar 33%. Percobaan dengan menggunakan 3 jumlah data berbeda (100, 200, dan 500) menghasilkan selisih nilai akurasi  yang tidak jauh berbeda yaitu 0,02. Hal ini menunjukkan metode Naive Bayes untuk klasifikasi data tweet terkait dampak virus Corona menghasilkan performa yang stabil. Nilai accuracy yang diperoleh cukup baik dan penelitian selanjutnya bisa dikembangkan dengan memperhitungkan unsur semantik pada dokumen tweet.
求助全文
通过发布文献求助,成功后即可免费获取论文全文。 去求助
来源期刊
自引率
0.00%
发文量
0
审稿时长
12 weeks
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
确定
请完成安全验证×
copy
已复制链接
快去分享给好友吧!
我知道了
右上角分享
点击右上角分享
0
联系我们:info@booksci.cn Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。 Copyright © 2023 布克学术 All rights reserved.
京ICP备2023020795号-1
ghs 京公网安备 11010802042870号
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术官方微信