Analisis Sentimen Data Provider Layanan Internet Pada Twitter Menggunakan Support Vector Machine Dengan Penambahan Algoritma Levenshtein Distance

I. B. P. Manuaba, Gede Rasben Dantes, G. Indrawan
{"title":"Analisis Sentimen Data Provider Layanan Internet Pada Twitter Menggunakan Support Vector Machine Dengan Penambahan Algoritma Levenshtein Distance","authors":"I. B. P. Manuaba, Gede Rasben Dantes, G. Indrawan","doi":"10.47970/siskom-kb.v5i2.261","DOIUrl":null,"url":null,"abstract":"Komentar pada data twitter mengandung banyak opini terkait suatu objek atau topik. Dari kumpulan komentar, dapat dilakukan analisis sentimen menggunakan Support Vector Machine untuk memperoleh hasil klasifikasi positif dan negatif. Data yang digunakan berkaitan dengan provider atau penyedia jaringan internet yang ada di Indonesia. Penambahan algoritma Levenshtein Distance pada tahap text preprocessing bertujuan untuk meningkatkan hasil klasifikasi. Tahapan Proses klasifikasi meliputi, pengumpulan data menggunakan API twitter, penghapusan duplicate data, pemberian label data, tahap text preprocessing (convert emoticon, cleansing, case folding, stemming, stopword removal, and tokenizing, penerapan algoritma Levenshtein Distance, stopword removal lanjutan, convert negation), feature extraction (TF-IDF), serta proses klasifikasi menggunakan Support Vector Machine.Hasil pengujian dengan menggunakan confusion matrix, menunjukan peningkatan hasil klasifikasi yang lebih baik setelah menggunakan algoritma Levenshtein Distance pada tahap text preprocessing. Nilai accuracy mengalami peningkatan sebesar 2%, recall positif 3%, recall negatif 1%, precision positif 1%, dan precision negatif 2%. Tetapi kecepatan waktu proses pada tahap text preprocessing dengan penambahan algoritma Levenshtein Distance lebih lambat sebesar 295,606 detik, jika dibandingkan tanpa adanya penambahan algoritma Levenshtein Distance.","PeriodicalId":104889,"journal":{"name":"Jurnal SISKOM-KB (Sistem Komputer dan Kecerdasan Buatan)","volume":"91 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2022-03-30","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"2","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Jurnal SISKOM-KB (Sistem Komputer dan Kecerdasan Buatan)","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.47970/siskom-kb.v5i2.261","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 2

Abstract

Komentar pada data twitter mengandung banyak opini terkait suatu objek atau topik. Dari kumpulan komentar, dapat dilakukan analisis sentimen menggunakan Support Vector Machine untuk memperoleh hasil klasifikasi positif dan negatif. Data yang digunakan berkaitan dengan provider atau penyedia jaringan internet yang ada di Indonesia. Penambahan algoritma Levenshtein Distance pada tahap text preprocessing bertujuan untuk meningkatkan hasil klasifikasi. Tahapan Proses klasifikasi meliputi, pengumpulan data menggunakan API twitter, penghapusan duplicate data, pemberian label data, tahap text preprocessing (convert emoticon, cleansing, case folding, stemming, stopword removal, and tokenizing, penerapan algoritma Levenshtein Distance, stopword removal lanjutan, convert negation), feature extraction (TF-IDF), serta proses klasifikasi menggunakan Support Vector Machine.Hasil pengujian dengan menggunakan confusion matrix, menunjukan peningkatan hasil klasifikasi yang lebih baik setelah menggunakan algoritma Levenshtein Distance pada tahap text preprocessing. Nilai accuracy mengalami peningkatan sebesar 2%, recall positif 3%, recall negatif 1%, precision positif 1%, dan precision negatif 2%. Tetapi kecepatan waktu proses pada tahap text preprocessing dengan penambahan algoritma Levenshtein Distance lebih lambat sebesar 295,606 detik, jika dibandingkan tanpa adanya penambahan algoritma Levenshtein Distance.
情感分析数据提供者Layanan Internet pagadtwitter Menggunakan支持向量机Dengan Penambahan算法Levenshtein Distance
twitter 数据中的评论包含与某个对象或话题相关的许多观点。从收集到的评论中,可以使用支持向量机进行情感分析,从而获得正面和负面的分类结果。所使用的数据与印度尼西亚的供应商或互联网网络供应商有关。在文本预处理阶段加入莱文斯坦距离算法,旨在改善分类结果。分类过程的各个阶段包括:使用 twitter API 收集数据、删除重复数据、数据标注、文本预处理阶段(转换表情符号、清洗、大小写折叠、词干、停止词删除和标记化、应用莱文斯坦距离算法、高级停止词删除、转换否定)、特征提取(TF-IDF)以及使用支持向量机进行分类。准确率提高了 2%,正召回率提高了 3%,负召回率提高了 1%,正精度提高了 1%,负精度提高了 2%。不过,在文本预处理阶段添加列文斯坦因距离算法后,处理速度比未添加列文斯坦因距离算法时慢了 295.606 秒。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
求助全文
约1分钟内获得全文 求助全文
来源期刊
自引率
0.00%
发文量
0
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
确定
请完成安全验证×
copy
已复制链接
快去分享给好友吧!
我知道了
右上角分享
点击右上角分享
0
联系我们:info@booksci.cn Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。 Copyright © 2023 布克学术 All rights reserved.
京ICP备2023020795号-1
ghs 京公网安备 11010802042870号
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术官方微信