数据科学的方法是用情感分析和特征选择来衡量公众对流行病的同理心

Fika Hastarita Rachman, Imamah Imamah
{"title":"数据科学的方法是用情感分析和特征选择来衡量公众对流行病的同理心","authors":"Fika Hastarita Rachman, Imamah Imamah","doi":"10.26418/jp.v8i3.56655","DOIUrl":null,"url":null,"abstract":"Empati merupakan kemampuan seseorang untuk turut merasakan penderitaan orang lain. Pandemi covid yang melanda dunia, telah menyisakan banyak kehilangan dan keterpurukan. Penelitian ini bertujuan untuk mengetahui emosi masyarakat terhadap penderitaan sesama menggunakan pendekatan sentimen analisis. Dataset yang digunakan adalah komentar masyarakat di Twitter tentang pandemi Covid dalam rentang waktu November-Desember 2020. Data diambil dengan teknik crawling menggunakan library twint, didapatkan data sebanyak 2386 komentar, namun komentar yang mengandung empati hanya sebanyak 984 data. Dataset empati kemudian dilabeli oleh tiga orang menggunakan teknik majority voting. Hasil pengukuran dataset empati menunjukkan 55,7% komentar masyarakat indonesia mengandung empati positif (berempati), 37,4% empati negatif (tidak berempati), dan 6,9% netral. Untuk membentuk model yang dapat mendeteksi empati secara otomatis, maka digunakan  dataset empati sebanyak 400, dengan 200 kelas positif dan 200 kelas negatif, kelas netral tidak digunakan pada penelitian ini karena jumlah data sangat sedikit. Metode machine learning yang digunakan untuk membangun model adalah Support Vector Machine (SVM) dengan metode ekstraksi fitur reliefF. Berdasarkan penelitian yang dilakukan, akurasi sistem dengan metode SVM tanpa seleksi fitur ReliefF adalah 83%. Sedangkan akurasi yang diperoleh sistem dengan seleksi fitur ReliefF mencapai 93% dengan penggunaan 85% fitur dari total keseluruhan fitur.","PeriodicalId":31793,"journal":{"name":"JEPIN Jurnal Edukasi dan Penelitian Informatika","volume":"29 1","pages":""},"PeriodicalIF":0.0000,"publicationDate":"2022-12-20","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":"{\"title\":\"Pendekatan Data Science untuk Mengukur Empati Masyarakat terhadap Pandemi Menggunakan Analisis Sentimen dan Seleksi Fitur\",\"authors\":\"Fika Hastarita Rachman, Imamah Imamah\",\"doi\":\"10.26418/jp.v8i3.56655\",\"DOIUrl\":null,\"url\":null,\"abstract\":\"Empati merupakan kemampuan seseorang untuk turut merasakan penderitaan orang lain. Pandemi covid yang melanda dunia, telah menyisakan banyak kehilangan dan keterpurukan. Penelitian ini bertujuan untuk mengetahui emosi masyarakat terhadap penderitaan sesama menggunakan pendekatan sentimen analisis. Dataset yang digunakan adalah komentar masyarakat di Twitter tentang pandemi Covid dalam rentang waktu November-Desember 2020. Data diambil dengan teknik crawling menggunakan library twint, didapatkan data sebanyak 2386 komentar, namun komentar yang mengandung empati hanya sebanyak 984 data. Dataset empati kemudian dilabeli oleh tiga orang menggunakan teknik majority voting. Hasil pengukuran dataset empati menunjukkan 55,7% komentar masyarakat indonesia mengandung empati positif (berempati), 37,4% empati negatif (tidak berempati), dan 6,9% netral. Untuk membentuk model yang dapat mendeteksi empati secara otomatis, maka digunakan  dataset empati sebanyak 400, dengan 200 kelas positif dan 200 kelas negatif, kelas netral tidak digunakan pada penelitian ini karena jumlah data sangat sedikit. Metode machine learning yang digunakan untuk membangun model adalah Support Vector Machine (SVM) dengan metode ekstraksi fitur reliefF. Berdasarkan penelitian yang dilakukan, akurasi sistem dengan metode SVM tanpa seleksi fitur ReliefF adalah 83%. Sedangkan akurasi yang diperoleh sistem dengan seleksi fitur ReliefF mencapai 93% dengan penggunaan 85% fitur dari total keseluruhan fitur.\",\"PeriodicalId\":31793,\"journal\":{\"name\":\"JEPIN Jurnal Edukasi dan Penelitian Informatika\",\"volume\":\"29 1\",\"pages\":\"\"},\"PeriodicalIF\":0.0000,\"publicationDate\":\"2022-12-20\",\"publicationTypes\":\"Journal Article\",\"fieldsOfStudy\":null,\"isOpenAccess\":false,\"openAccessPdf\":\"\",\"citationCount\":\"0\",\"resultStr\":null,\"platform\":\"Semanticscholar\",\"paperid\":null,\"PeriodicalName\":\"JEPIN Jurnal Edukasi dan Penelitian Informatika\",\"FirstCategoryId\":\"1085\",\"ListUrlMain\":\"https://doi.org/10.26418/jp.v8i3.56655\",\"RegionNum\":0,\"RegionCategory\":null,\"ArticlePicture\":[],\"TitleCN\":null,\"AbstractTextCN\":null,\"PMCID\":null,\"EPubDate\":\"\",\"PubModel\":\"\",\"JCR\":\"\",\"JCRName\":\"\",\"Score\":null,\"Total\":0}","platform":"Semanticscholar","paperid":null,"PeriodicalName":"JEPIN Jurnal Edukasi dan Penelitian Informatika","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.26418/jp.v8i3.56655","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0

摘要

同理心是一个人分担他人痛苦的能力。肆虐世界的covid大流行给世界留下了巨大的损失和灾难。本研究的目的是利用情绪分析的方法,了解社会对他人苦难的情感。使用的数据是公众在Twitter上对Covid大流行的评论。通过使用twint图书馆爬取数据,获得了2386条评论,但只有984条数据具有移情。然后将移情数据拼接到三个使用投票技术的人身上。对同理心的分析显示,55.7%的印尼社会评论包含积极的同理心(同理心),37.4%的负面同理心(不感),6.9%的中立。为了创建一个自动检测同理心的模型,然后使用400个移位数据集,有200个正类和200个负类,中立类没有被用于这项研究,因为数据很少。用于构建模型的机器学习方法是一个支持向量机(SVM),其提取特性具有特定的特征。根据所进行的研究,系统在没有rff特性选择的SVM方法下的准确性为83%。然而,通过认证特性选择系统获得的准确率达到93%,使用85%的总功能。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
Pendekatan Data Science untuk Mengukur Empati Masyarakat terhadap Pandemi Menggunakan Analisis Sentimen dan Seleksi Fitur
Empati merupakan kemampuan seseorang untuk turut merasakan penderitaan orang lain. Pandemi covid yang melanda dunia, telah menyisakan banyak kehilangan dan keterpurukan. Penelitian ini bertujuan untuk mengetahui emosi masyarakat terhadap penderitaan sesama menggunakan pendekatan sentimen analisis. Dataset yang digunakan adalah komentar masyarakat di Twitter tentang pandemi Covid dalam rentang waktu November-Desember 2020. Data diambil dengan teknik crawling menggunakan library twint, didapatkan data sebanyak 2386 komentar, namun komentar yang mengandung empati hanya sebanyak 984 data. Dataset empati kemudian dilabeli oleh tiga orang menggunakan teknik majority voting. Hasil pengukuran dataset empati menunjukkan 55,7% komentar masyarakat indonesia mengandung empati positif (berempati), 37,4% empati negatif (tidak berempati), dan 6,9% netral. Untuk membentuk model yang dapat mendeteksi empati secara otomatis, maka digunakan  dataset empati sebanyak 400, dengan 200 kelas positif dan 200 kelas negatif, kelas netral tidak digunakan pada penelitian ini karena jumlah data sangat sedikit. Metode machine learning yang digunakan untuk membangun model adalah Support Vector Machine (SVM) dengan metode ekstraksi fitur reliefF. Berdasarkan penelitian yang dilakukan, akurasi sistem dengan metode SVM tanpa seleksi fitur ReliefF adalah 83%. Sedangkan akurasi yang diperoleh sistem dengan seleksi fitur ReliefF mencapai 93% dengan penggunaan 85% fitur dari total keseluruhan fitur.
求助全文
通过发布文献求助,成功后即可免费获取论文全文。 去求助
来源期刊
自引率
0.00%
发文量
1
审稿时长
10 weeks
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
确定
请完成安全验证×
copy
已复制链接
快去分享给好友吧!
我知道了
右上角分享
点击右上角分享
0
联系我们:info@booksci.cn Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。 Copyright © 2023 布克学术 All rights reserved.
京ICP备2023020795号-1
ghs 京公网安备 11010802042870号
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术官方微信