Analisis Sentimen Vaksinasi Covid-19 Pada Twitter Menggunakan Naive Bayes Classifier Dengan Feature Selection Chi-Squared Statistic dan Particle Swarm Optimization

Ristasari Dwi Septiana, Agung Budi Susanto, Tukiyat Tukiyat
{"title":"Analisis Sentimen Vaksinasi Covid-19 Pada Twitter Menggunakan Naive Bayes Classifier Dengan Feature Selection Chi-Squared Statistic dan Particle Swarm Optimization","authors":"Ristasari Dwi Septiana, Agung Budi Susanto, Tukiyat Tukiyat","doi":"10.47970/siskom-kb.v5i1.228","DOIUrl":null,"url":null,"abstract":"Tingginya penyebaran Covid-19 semakin berdampak pada bidang kesehatan, ekonomi, bahkan bidang pendidikan di Indonesia, sehingga pemerintah Indonesia melakukan tindakan vaksinasi Covid-19 guna menekan tingkat penyebaran Covid-19 di Indonesia. Namun hal tersebut dinilai kotroversial sehingga menarik perhatian masyarakat untuk memberikan opini di berbagai media seperti media sosial twitter. Sehingga membutuhkan analisa sentimen masyarakat terhadap upaya pemerintah pada tindakan vaksinasi Covid-19 untuk mencapai hasil prediksi dengan nilai akurasi paling optimal. Proses crawling secara otomatis menggunakan tools Rapidminer akan mengambil data tweets yang mengandung 5 (lima) kata kunci, yaitu “Vaksin Sinovac”, “Vaksin Astrazeneca”, “Vaksin Moderna”, “Vaksin Merah Putih”, dan “Vaksinasi Covid-19”. Dataset tweets didapatkan dari tanggal 4 Agustus 2021 sampai 12 Agustus 2021. Dataset diperoleh sejumlah 2060 tweets dan diberi label secara manual didapatkan jumlah tweet sebanyak 1193 sentimen positif, 73 negatif, dan 794 netral. Data tersebut dianalisa dengan menggunakan Metode Feature Selection Chi-Squared Statistic dan Particle Swarm Optimization (PSO) untuk mengurangi atribut yang kurang relevan pada saat proses klasifikasi dengan algoritma Naive Bayes Classifier (NBC). Hasil pengujian menunjukan bahwa Algoritma Naive Bayes Classifier (NBC) tanpa Feature Selection mendapatkan nilai akurasi 63,69%. Hasil penelitian menunjukkan bahwa Algoritma Naive Bayes Classifier (NBC) dengan Feature Selection Chi-Squared Statistic mempunyai tingkat akurasi 69,13%. Sedangkan hasil pengujian algoritma Naive Bayes Classifier (NBC) dengan Particle Swarm Optimization mempunyai tingkat akurasi 66,02%. Dengan demikian hasil seleksi fitur Chi-Squared Statistic mendapatkan nilai akurasi yang lebih baik jika dibandingkan dengan Particle Swarm Optimization untuk proses klasifikasi algoritma Naive Bayes Classifier (NBC) dengan selisih akurasi 3,11%.","PeriodicalId":104889,"journal":{"name":"Jurnal SISKOM-KB (Sistem Komputer dan Kecerdasan Buatan)","volume":"45 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2021-09-30","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"6","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Jurnal SISKOM-KB (Sistem Komputer dan Kecerdasan Buatan)","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.47970/siskom-kb.v5i1.228","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 6

Abstract

Tingginya penyebaran Covid-19 semakin berdampak pada bidang kesehatan, ekonomi, bahkan bidang pendidikan di Indonesia, sehingga pemerintah Indonesia melakukan tindakan vaksinasi Covid-19 guna menekan tingkat penyebaran Covid-19 di Indonesia. Namun hal tersebut dinilai kotroversial sehingga menarik perhatian masyarakat untuk memberikan opini di berbagai media seperti media sosial twitter. Sehingga membutuhkan analisa sentimen masyarakat terhadap upaya pemerintah pada tindakan vaksinasi Covid-19 untuk mencapai hasil prediksi dengan nilai akurasi paling optimal. Proses crawling secara otomatis menggunakan tools Rapidminer akan mengambil data tweets yang mengandung 5 (lima) kata kunci, yaitu “Vaksin Sinovac”, “Vaksin Astrazeneca”, “Vaksin Moderna”, “Vaksin Merah Putih”, dan “Vaksinasi Covid-19”. Dataset tweets didapatkan dari tanggal 4 Agustus 2021 sampai 12 Agustus 2021. Dataset diperoleh sejumlah 2060 tweets dan diberi label secara manual didapatkan jumlah tweet sebanyak 1193 sentimen positif, 73 negatif, dan 794 netral. Data tersebut dianalisa dengan menggunakan Metode Feature Selection Chi-Squared Statistic dan Particle Swarm Optimization (PSO) untuk mengurangi atribut yang kurang relevan pada saat proses klasifikasi dengan algoritma Naive Bayes Classifier (NBC). Hasil pengujian menunjukan bahwa Algoritma Naive Bayes Classifier (NBC) tanpa Feature Selection mendapatkan nilai akurasi 63,69%. Hasil penelitian menunjukkan bahwa Algoritma Naive Bayes Classifier (NBC) dengan Feature Selection Chi-Squared Statistic mempunyai tingkat akurasi 69,13%. Sedangkan hasil pengujian algoritma Naive Bayes Classifier (NBC) dengan Particle Swarm Optimization mempunyai tingkat akurasi 66,02%. Dengan demikian hasil seleksi fitur Chi-Squared Statistic mendapatkan nilai akurasi yang lebih baik jika dibandingkan dengan Particle Swarm Optimization untuk proses klasifikasi algoritma Naive Bayes Classifier (NBC) dengan selisih akurasi 3,11%.
朴素贝叶斯分类器登安特征选择卡方统计和粒子群优化
高Covid-19传播越来越影响卫生部门、经济,甚至在印尼,印尼政府在教育领域采取Covid-19接种疫苗,以按Covid-19在印尼传播水平。但这被认为是有关联的,它吸引了公众对各种媒体(如社交twitter)发表意见。所以需要对政府的社会情绪分析Covid-19牛痘接种措施达到最佳的结果预测最准确的价值。自动爬行过程使用快速工具工具将收集包含5(5)关键字、“滑石粉疫苗”、“现代疫苗”、“红白疫苗”和“Covid-19疫苗”的推特数据。twitter数据集将于2021年8月4日至2021年8月12日访问。数据集获得大量的2.4%左右tweet和tweet数量多达1193手动标记得到积极的情绪,消极73,794中立。这些数据是用选择性选择的、次级统计和粒子优化(PSO)来分析的,以减少与nave Bayes Classifier算法分类过程中不太相关的属性。测试结果显示,天真贝叶斯算法Classifier (NBC)没有Feature Selection 63,69%准确度成绩。研究结果表明,天真贝叶斯算法Classifier (NBC)和Feature Selection Chi-Squared Statistic 69,13%准确度有合理预期。而天真贝叶斯算法测试结果Classifier (NBC)和粒子蜂群Optimization 66,02%准确度有合理预期。因此,chi - squarted统计选择的结果比Naive Bayes Classifier分类算法的粒子优先权得到了更好的准确性值,其直接准确性为3.11%。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
求助全文
约1分钟内获得全文 求助全文
来源期刊
自引率
0.00%
发文量
0
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
确定
请完成安全验证×
copy
已复制链接
快去分享给好友吧!
我知道了
右上角分享
点击右上角分享
0
联系我们:info@booksci.cn Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。 Copyright © 2023 布克学术 All rights reserved.
京ICP备2023020795号-1
ghs 京公网安备 11010802042870号
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术官方微信