PENERAPAN ALGORITMA K-NEAREST NEIGHBOR DAN FITUR EKSTRAKSI N-GRAM DALAM ANALISIS SENTIMEN BERBASIS ASPEK

Robi Nurhidayat, K. Dewi
{"title":"PENERAPAN ALGORITMA K-NEAREST NEIGHBOR DAN FITUR EKSTRAKSI N-GRAM DALAM ANALISIS SENTIMEN BERBASIS ASPEK","authors":"Robi Nurhidayat, K. Dewi","doi":"10.34010/komputa.v12i1.9458","DOIUrl":null,"url":null,"abstract":"Pertumbuhan dan perkembangan teknologi yang begitu cepat dan pesat menjadikan membeli produk secara online semakin meningkat dan disukai yaitu membeli produk kecantikan. Banyak pertimbangan untuk mengetahui kualitas dari produk, salah satu caranya yaitu melihat ulasan produk kecantikan. Tujuan dari penelitian untuk mengevaluasi performansi dari metode K-Nearest Neighbor dan fitur ekstraksi N-Gram dalam melakukan analisis sentimen berbasis aspek pada produk kecantikan. Metodologi yang digunakan adalah pengumpulan data, preprocessing, ekstraksi fitur N-Gram, pembobotan kata dengan TF-IDF, klasifikasi dengan K-Nearest Neighbor ,Multi Label dengan binari ova, dan terakhir evaluasi performansi. Pembagian data dibagi menjadi tiga skenario yaitu 80:20, 70:30:, dan 60:40. Pengujian dilakukan dengan dataset original dan data yang diseimbangkan menggunakan metode Random Over Sampling. Hasil pengujian menunjukkan bahwa data yang seimbang menghasilkan nilai akurasi yang lebih baik daripada data yang tidak seimbang. Pada KNN dengan nilai k = 1 pada dataset seimbang, menghasilkan akurasi tertinggi. Akurasi pada aspek aroma, harga, kemasan dan  efektivitas secara berturut-turut adalah 91,9%; 95,4%; 98,6%; 88,8%. Berdasarkan hasil pengujian yang telah dilakukan pada setiap aspek, didapatkan akurasi tertinggi dengan nilai akurasi 98,6% dari aspek kemasan pada skenario data 80:20.","PeriodicalId":346733,"journal":{"name":"Komputa : Jurnal Ilmiah Komputer dan Informatika","volume":"72 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2023-05-18","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Komputa : Jurnal Ilmiah Komputer dan Informatika","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.34010/komputa.v12i1.9458","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0

Abstract

Pertumbuhan dan perkembangan teknologi yang begitu cepat dan pesat menjadikan membeli produk secara online semakin meningkat dan disukai yaitu membeli produk kecantikan. Banyak pertimbangan untuk mengetahui kualitas dari produk, salah satu caranya yaitu melihat ulasan produk kecantikan. Tujuan dari penelitian untuk mengevaluasi performansi dari metode K-Nearest Neighbor dan fitur ekstraksi N-Gram dalam melakukan analisis sentimen berbasis aspek pada produk kecantikan. Metodologi yang digunakan adalah pengumpulan data, preprocessing, ekstraksi fitur N-Gram, pembobotan kata dengan TF-IDF, klasifikasi dengan K-Nearest Neighbor ,Multi Label dengan binari ova, dan terakhir evaluasi performansi. Pembagian data dibagi menjadi tiga skenario yaitu 80:20, 70:30:, dan 60:40. Pengujian dilakukan dengan dataset original dan data yang diseimbangkan menggunakan metode Random Over Sampling. Hasil pengujian menunjukkan bahwa data yang seimbang menghasilkan nilai akurasi yang lebih baik daripada data yang tidak seimbang. Pada KNN dengan nilai k = 1 pada dataset seimbang, menghasilkan akurasi tertinggi. Akurasi pada aspek aroma, harga, kemasan dan  efektivitas secara berturut-turut adalah 91,9%; 95,4%; 98,6%; 88,8%. Berdasarkan hasil pengujian yang telah dilakukan pada setiap aspek, didapatkan akurasi tertinggi dengan nilai akurasi 98,6% dari aspek kemasan pada skenario data 80:20.
在基于方面的情感分析中,环境K-NEAREST算法的应用和提取N-GRAM特性
科技的快速发展和发展使得在线购买产品的吸引力和吸引力在增加,即美容产品。许多人考虑的是了解产品的质量,这是一种观察美丽产品的方式。该研究的目的是评估基于美容产品的方面的K-Nearest方法和提取N-Gram特征的绩效考核。使用的方法包括数据收集、预处理、提取n - g功能、用TF-IDF排版、对K-Nearest环境的分类、与binari ova的多标签,以及对行为的最后评估。数据片段被分成三个场景:80:20,70:30:和60:40。测试使用样本中随机分布的原始数据和数据进行。测试结果表明,平衡的数据比不平衡的数据更能带来准确的值。在数据平衡的k = 1的KNN中,得到的准确率最高。气味、价格、包装和效率方面的准确性为91.9%;95,4%;98.6%;88,8%。根据在所有方面进行的测试结果,在数据场景80:20中,可以获得最高的精确度为98.6%。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
求助全文
约1分钟内获得全文 求助全文
来源期刊
自引率
0.00%
发文量
0
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
确定
请完成安全验证×
copy
已复制链接
快去分享给好友吧!
我知道了
右上角分享
点击右上角分享
0
联系我们:info@booksci.cn Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。 Copyright © 2023 布克学术 All rights reserved.
京ICP备2023020795号-1
ghs 京公网安备 11010802042870号
Book学术文献互助
Book学术文献互助群
群 号:604180095
Book学术官方微信