Perbandingan Ekstraksi Fitur dengan Pembobotan Supervised dan Unsupervised pada Algoritma Random Forest untuk Pemantauan Laporan Penderita COVID-19 di Twitter
Sulastri Norindah Sari, M. Faisal, Dwi Kartini, I. Budiman, Triando Hamonangan Saragih, Muliadi
{"title":"Perbandingan Ekstraksi Fitur dengan Pembobotan Supervised dan Unsupervised pada Algoritma Random Forest untuk Pemantauan Laporan Penderita COVID-19 di Twitter","authors":"Sulastri Norindah Sari, M. Faisal, Dwi Kartini, I. Budiman, Triando Hamonangan Saragih, Muliadi","doi":"10.23960/komputasi.v11i1.6650","DOIUrl":null,"url":null,"abstract":"Dimasa sekarang masyarakat sudah berani melaporkan dirinya terpapar COVID-19 melalui unggahan di media sosial seperti Twitter. Hal ini dapat dimanfaatkan oleh masyarakat sekitar atau lembaga kesehatan untuk memberikan bantuan terhadap pelapor. Pemantauan laporan penderita COVID-19 di Twitter dapat dilakukan secara otomatis dengan algoritma machine learning untuk klasifikasi teks. Pada kasus klasifikasi teks, algoritma machine learning menerima input berupa data terstruktur hasil ekstraksi fitur dengan teknik unigram dengan pembobotan. Metode pembobotan kata unsupervised merupakan pembobotan yang tidak memperhatikan letak term di kelas positif atau negatif. Kemudian metode pembobotan ini dikembangkan menjadi pembobotan supervised, karena dalam proses pembobotannya metode ini membobotkan term dengan memperhatikan letak term di kelas positif atau negatif. Pada riset ini dilakukan perbandingan kedua jenis pembobotan pada klasifikasi data tweet gejala covid dengan algoritma machine learning yaitu Random Forest. Dari hasil penelitian didapat hasil kinerja klasifikasi dengan pembobotan supervised Delta TF-IDF terbukti lebih bagus dengan akurasi sebesar 88,5% sedangkan dengan pembobotan unsupervised TF-IDF diperoleh hasil akurasi 87,9%","PeriodicalId":292117,"journal":{"name":"Jurnal Komputasi","volume":"35 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2023-04-30","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Jurnal Komputasi","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.23960/komputasi.v11i1.6650","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0
Abstract
Dimasa sekarang masyarakat sudah berani melaporkan dirinya terpapar COVID-19 melalui unggahan di media sosial seperti Twitter. Hal ini dapat dimanfaatkan oleh masyarakat sekitar atau lembaga kesehatan untuk memberikan bantuan terhadap pelapor. Pemantauan laporan penderita COVID-19 di Twitter dapat dilakukan secara otomatis dengan algoritma machine learning untuk klasifikasi teks. Pada kasus klasifikasi teks, algoritma machine learning menerima input berupa data terstruktur hasil ekstraksi fitur dengan teknik unigram dengan pembobotan. Metode pembobotan kata unsupervised merupakan pembobotan yang tidak memperhatikan letak term di kelas positif atau negatif. Kemudian metode pembobotan ini dikembangkan menjadi pembobotan supervised, karena dalam proses pembobotannya metode ini membobotkan term dengan memperhatikan letak term di kelas positif atau negatif. Pada riset ini dilakukan perbandingan kedua jenis pembobotan pada klasifikasi data tweet gejala covid dengan algoritma machine learning yaitu Random Forest. Dari hasil penelitian didapat hasil kinerja klasifikasi dengan pembobotan supervised Delta TF-IDF terbukti lebih bagus dengan akurasi sebesar 88,5% sedangkan dengan pembobotan unsupervised TF-IDF diperoleh hasil akurasi 87,9%