PENERAPAN ALGORITMA K-NEAREST NEIGHBOR DAN FITUR EKSTRAKSI N-GRAM DALAM ANALISIS SENTIMEN BERBASIS ASPEK

Komputa : Jurnal Ilmiah Komputer dan Informatika Pub Date : 2023-05-18 DOI:10.34010/komputa.v12i1.9458

Robi Nurhidayat, K. Dewi

{"title":"PENERAPAN ALGORITMA K-NEAREST NEIGHBOR DAN FITUR EKSTRAKSI N-GRAM DALAM ANALISIS SENTIMEN BERBASIS ASPEK","authors":"Robi Nurhidayat, K. Dewi","doi":"10.34010/komputa.v12i1.9458","DOIUrl":null,"url":null,"abstract":"Pertumbuhan dan perkembangan teknologi yang begitu cepat dan pesat menjadikan membeli produk secara online semakin meningkat dan disukai yaitu membeli produk kecantikan. Banyak pertimbangan untuk mengetahui kualitas dari produk, salah satu caranya yaitu melihat ulasan produk kecantikan. Tujuan dari penelitian untuk mengevaluasi performansi dari metode K-Nearest Neighbor dan fitur ekstraksi N-Gram dalam melakukan analisis sentimen berbasis aspek pada produk kecantikan. Metodologi yang digunakan adalah pengumpulan data, preprocessing, ekstraksi fitur N-Gram, pembobotan kata dengan TF-IDF, klasifikasi dengan K-Nearest Neighbor ,Multi Label dengan binari ova, dan terakhir evaluasi performansi. Pembagian data dibagi menjadi tiga skenario yaitu 80:20, 70:30:, dan 60:40. Pengujian dilakukan dengan dataset original dan data yang diseimbangkan menggunakan metode Random Over Sampling. Hasil pengujian menunjukkan bahwa data yang seimbang menghasilkan nilai akurasi yang lebih baik daripada data yang tidak seimbang. Pada KNN dengan nilai k = 1 pada dataset seimbang, menghasilkan akurasi tertinggi. Akurasi pada aspek aroma, harga, kemasan dan efektivitas secara berturut-turut adalah 91,9%; 95,4%; 98,6%; 88,8%. Berdasarkan hasil pengujian yang telah dilakukan pada setiap aspek, didapatkan akurasi tertinggi dengan nilai akurasi 98,6% dari aspek kemasan pada skenario data 80:20.","PeriodicalId":346733,"journal":{"name":"Komputa : Jurnal Ilmiah Komputer dan Informatika","volume":"72 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2023-05-18","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Komputa : Jurnal Ilmiah Komputer dan Informatika","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.34010/komputa.v12i1.9458","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}

引用次数: 0

Abstract

Pertumbuhan dan perkembangan teknologi yang begitu cepat dan pesat menjadikan membeli produk secara online semakin meningkat dan disukai yaitu membeli produk kecantikan. Banyak pertimbangan untuk mengetahui kualitas dari produk, salah satu caranya yaitu melihat ulasan produk kecantikan. Tujuan dari penelitian untuk mengevaluasi performansi dari metode K-Nearest Neighbor dan fitur ekstraksi N-Gram dalam melakukan analisis sentimen berbasis aspek pada produk kecantikan. Metodologi yang digunakan adalah pengumpulan data, preprocessing, ekstraksi fitur N-Gram, pembobotan kata dengan TF-IDF, klasifikasi dengan K-Nearest Neighbor ,Multi Label dengan binari ova, dan terakhir evaluasi performansi. Pembagian data dibagi menjadi tiga skenario yaitu 80:20, 70:30:, dan 60:40. Pengujian dilakukan dengan dataset original dan data yang diseimbangkan menggunakan metode Random Over Sampling. Hasil pengujian menunjukkan bahwa data yang seimbang menghasilkan nilai akurasi yang lebih baik daripada data yang tidak seimbang. Pada KNN dengan nilai k = 1 pada dataset seimbang, menghasilkan akurasi tertinggi. Akurasi pada aspek aroma, harga, kemasan dan efektivitas secara berturut-turut adalah 91,9%; 95,4%; 98,6%; 88,8%. Berdasarkan hasil pengujian yang telah dilakukan pada setiap aspek, didapatkan akurasi tertinggi dengan nilai akurasi 98,6% dari aspek kemasan pada skenario data 80:20.

查看原文本刊更多论文

在基于方面的情感分析中，环境K-NEAREST算法的应用和提取N-GRAM特性

科技的快速发展和发展使得在线购买产品的吸引力和吸引力在增加，即美容产品。许多人考虑的是了解产品的质量，这是一种观察美丽产品的方式。该研究的目的是评估基于美容产品的方面的K-Nearest方法和提取N-Gram特征的绩效考核。使用的方法包括数据收集、预处理、提取n - g功能、用TF-IDF排版、对K-Nearest环境的分类、与binari ova的多标签，以及对行为的最后评估。数据片段被分成三个场景:80:20,70:30:和60:40。测试使用样本中随机分布的原始数据和数据进行。测试结果表明，平衡的数据比不平衡的数据更能带来准确的值。在数据平衡的k = 1的KNN中，得到的准确率最高。气味、价格、包装和效率方面的准确性为91.9%;95,4%;98.6%;88,8%。根据在所有方面进行的测试结果，在数据场景80:20中，可以获得最高的精确度为98.6%。

本文章由计算机程序翻译，如有差异，请以英文原文为准。

求助全文

约1分钟内获得全文求助全文

来源期刊

Komputa : Jurnal Ilmiah Komputer dan Informatika

自引率

0.00%

发文量