Perbandingan Ekstraksi Fitur dengan Pembobotan Supervised dan Unsupervised pada Algoritma Random Forest untuk Pemantauan Laporan Penderita COVID-19 di Twitter

Jurnal Komputasi Pub Date : 2023-04-30 DOI:10.23960/komputasi.v11i1.6650

Sulastri Norindah Sari, M. Faisal, Dwi Kartini, I. Budiman, Triando Hamonangan Saragih, Muliadi

{"title":"Perbandingan Ekstraksi Fitur dengan Pembobotan Supervised dan Unsupervised pada Algoritma Random Forest untuk Pemantauan Laporan Penderita COVID-19 di Twitter","authors":"Sulastri Norindah Sari, M. Faisal, Dwi Kartini, I. Budiman, Triando Hamonangan Saragih, Muliadi","doi":"10.23960/komputasi.v11i1.6650","DOIUrl":null,"url":null,"abstract":"Dimasa sekarang masyarakat sudah berani melaporkan dirinya terpapar COVID-19 melalui unggahan di media sosial seperti Twitter. Hal ini dapat dimanfaatkan oleh masyarakat sekitar atau lembaga kesehatan untuk memberikan bantuan terhadap pelapor. Pemantauan laporan penderita COVID-19 di Twitter dapat dilakukan secara otomatis dengan algoritma machine learning untuk klasifikasi teks. Pada kasus klasifikasi teks, algoritma machine learning menerima input berupa data terstruktur hasil ekstraksi fitur dengan teknik unigram dengan pembobotan. Metode pembobotan kata unsupervised merupakan pembobotan yang tidak memperhatikan letak term di kelas positif atau negatif. Kemudian metode pembobotan ini dikembangkan menjadi pembobotan supervised, karena dalam proses pembobotannya metode ini membobotkan term dengan memperhatikan letak term di kelas positif atau negatif. Pada riset ini dilakukan perbandingan kedua jenis pembobotan pada klasifikasi data tweet gejala covid dengan algoritma machine learning yaitu Random Forest. Dari hasil penelitian didapat hasil kinerja klasifikasi dengan pembobotan supervised Delta TF-IDF terbukti lebih bagus dengan akurasi sebesar 88,5% sedangkan dengan pembobotan unsupervised TF-IDF diperoleh hasil akurasi 87,9%","PeriodicalId":292117,"journal":{"name":"Jurnal Komputasi","volume":"35 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2023-04-30","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Jurnal Komputasi","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.23960/komputasi.v11i1.6650","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}

引用次数: 0

Abstract

Dimasa sekarang masyarakat sudah berani melaporkan dirinya terpapar COVID-19 melalui unggahan di media sosial seperti Twitter. Hal ini dapat dimanfaatkan oleh masyarakat sekitar atau lembaga kesehatan untuk memberikan bantuan terhadap pelapor. Pemantauan laporan penderita COVID-19 di Twitter dapat dilakukan secara otomatis dengan algoritma machine learning untuk klasifikasi teks. Pada kasus klasifikasi teks, algoritma machine learning menerima input berupa data terstruktur hasil ekstraksi fitur dengan teknik unigram dengan pembobotan. Metode pembobotan kata unsupervised merupakan pembobotan yang tidak memperhatikan letak term di kelas positif atau negatif. Kemudian metode pembobotan ini dikembangkan menjadi pembobotan supervised, karena dalam proses pembobotannya metode ini membobotkan term dengan memperhatikan letak term di kelas positif atau negatif. Pada riset ini dilakukan perbandingan kedua jenis pembobotan pada klasifikasi data tweet gejala covid dengan algoritma machine learning yaitu Random Forest. Dari hasil penelitian didapat hasil kinerja klasifikasi dengan pembobotan supervised Delta TF-IDF terbukti lebih bagus dengan akurasi sebesar 88,5% sedangkan dengan pembobotan unsupervised TF-IDF diperoleh hasil akurasi 87,9%

查看原文本刊更多论文

在现在社会已经敢报告通过上传自己暴露COVID-19 Twitter这样的社交媒体上。它可以左右或社会医疗机构用于对报告员提供救灾援助。监测报告在Twitter上COVID-19患者可以做的机器学习算法来自动文本分类。在文本分类的例子中,输入机器学习算法接受结果以一种结构化的数据特征提取与教女动物unigram技术。方法教女动物unsupervised字是不注意安全布局的教女动物期限在课堂上积极或消极。然后这种非法侵入方法被开发成侵入式侵入，因为在闯入过程中，它通过观察在正面或负面课堂上的排版来破坏term。这项研究将covid症状数据分类与随机学习算法算法Random Forest进行了对比。得到研究结果分类绩效结果的教女动物supervised三角洲TF-IDF更好的证明与准确度高达88,5%而教女动物unsupervised TF-IDF获得结果准确性87,9%

本文章由计算机程序翻译，如有差异，请以英文原文为准。

求助全文

约1分钟内获得全文求助全文

来源期刊

Jurnal Komputasi

自引率

0.00%

发文量