Analisis Sentimen Vaksinasi Covid-19 Pada Twitter Menggunakan Naive Bayes Classifier Dengan Feature Selection Chi-Squared Statistic dan Particle Swarm Optimization
Ristasari Dwi Septiana, Agung Budi Susanto, Tukiyat Tukiyat
{"title":"Analisis Sentimen Vaksinasi Covid-19 Pada Twitter Menggunakan Naive Bayes Classifier Dengan Feature Selection Chi-Squared Statistic dan Particle Swarm Optimization","authors":"Ristasari Dwi Septiana, Agung Budi Susanto, Tukiyat Tukiyat","doi":"10.47970/siskom-kb.v5i1.228","DOIUrl":null,"url":null,"abstract":"Tingginya penyebaran Covid-19 semakin berdampak pada bidang kesehatan, ekonomi, bahkan bidang pendidikan di Indonesia, sehingga pemerintah Indonesia melakukan tindakan vaksinasi Covid-19 guna menekan tingkat penyebaran Covid-19 di Indonesia. Namun hal tersebut dinilai kotroversial sehingga menarik perhatian masyarakat untuk memberikan opini di berbagai media seperti media sosial twitter. Sehingga membutuhkan analisa sentimen masyarakat terhadap upaya pemerintah pada tindakan vaksinasi Covid-19 untuk mencapai hasil prediksi dengan nilai akurasi paling optimal. Proses crawling secara otomatis menggunakan tools Rapidminer akan mengambil data tweets yang mengandung 5 (lima) kata kunci, yaitu “Vaksin Sinovac”, “Vaksin Astrazeneca”, “Vaksin Moderna”, “Vaksin Merah Putih”, dan “Vaksinasi Covid-19”. Dataset tweets didapatkan dari tanggal 4 Agustus 2021 sampai 12 Agustus 2021. Dataset diperoleh sejumlah 2060 tweets dan diberi label secara manual didapatkan jumlah tweet sebanyak 1193 sentimen positif, 73 negatif, dan 794 netral. Data tersebut dianalisa dengan menggunakan Metode Feature Selection Chi-Squared Statistic dan Particle Swarm Optimization (PSO) untuk mengurangi atribut yang kurang relevan pada saat proses klasifikasi dengan algoritma Naive Bayes Classifier (NBC). Hasil pengujian menunjukan bahwa Algoritma Naive Bayes Classifier (NBC) tanpa Feature Selection mendapatkan nilai akurasi 63,69%. Hasil penelitian menunjukkan bahwa Algoritma Naive Bayes Classifier (NBC) dengan Feature Selection Chi-Squared Statistic mempunyai tingkat akurasi 69,13%. Sedangkan hasil pengujian algoritma Naive Bayes Classifier (NBC) dengan Particle Swarm Optimization mempunyai tingkat akurasi 66,02%. Dengan demikian hasil seleksi fitur Chi-Squared Statistic mendapatkan nilai akurasi yang lebih baik jika dibandingkan dengan Particle Swarm Optimization untuk proses klasifikasi algoritma Naive Bayes Classifier (NBC) dengan selisih akurasi 3,11%.","PeriodicalId":104889,"journal":{"name":"Jurnal SISKOM-KB (Sistem Komputer dan Kecerdasan Buatan)","volume":"45 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2021-09-30","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"6","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Jurnal SISKOM-KB (Sistem Komputer dan Kecerdasan Buatan)","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.47970/siskom-kb.v5i1.228","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 6
Abstract
Tingginya penyebaran Covid-19 semakin berdampak pada bidang kesehatan, ekonomi, bahkan bidang pendidikan di Indonesia, sehingga pemerintah Indonesia melakukan tindakan vaksinasi Covid-19 guna menekan tingkat penyebaran Covid-19 di Indonesia. Namun hal tersebut dinilai kotroversial sehingga menarik perhatian masyarakat untuk memberikan opini di berbagai media seperti media sosial twitter. Sehingga membutuhkan analisa sentimen masyarakat terhadap upaya pemerintah pada tindakan vaksinasi Covid-19 untuk mencapai hasil prediksi dengan nilai akurasi paling optimal. Proses crawling secara otomatis menggunakan tools Rapidminer akan mengambil data tweets yang mengandung 5 (lima) kata kunci, yaitu “Vaksin Sinovac”, “Vaksin Astrazeneca”, “Vaksin Moderna”, “Vaksin Merah Putih”, dan “Vaksinasi Covid-19”. Dataset tweets didapatkan dari tanggal 4 Agustus 2021 sampai 12 Agustus 2021. Dataset diperoleh sejumlah 2060 tweets dan diberi label secara manual didapatkan jumlah tweet sebanyak 1193 sentimen positif, 73 negatif, dan 794 netral. Data tersebut dianalisa dengan menggunakan Metode Feature Selection Chi-Squared Statistic dan Particle Swarm Optimization (PSO) untuk mengurangi atribut yang kurang relevan pada saat proses klasifikasi dengan algoritma Naive Bayes Classifier (NBC). Hasil pengujian menunjukan bahwa Algoritma Naive Bayes Classifier (NBC) tanpa Feature Selection mendapatkan nilai akurasi 63,69%. Hasil penelitian menunjukkan bahwa Algoritma Naive Bayes Classifier (NBC) dengan Feature Selection Chi-Squared Statistic mempunyai tingkat akurasi 69,13%. Sedangkan hasil pengujian algoritma Naive Bayes Classifier (NBC) dengan Particle Swarm Optimization mempunyai tingkat akurasi 66,02%. Dengan demikian hasil seleksi fitur Chi-Squared Statistic mendapatkan nilai akurasi yang lebih baik jika dibandingkan dengan Particle Swarm Optimization untuk proses klasifikasi algoritma Naive Bayes Classifier (NBC) dengan selisih akurasi 3,11%.