情感分析数据提供者Layanan Internet pagadtwitter Menggunakan支持向量机Dengan Penambahan算法Levenshtein Distance

Jurnal SISKOM-KB (Sistem Komputer dan Kecerdasan Buatan) Pub Date : 2022-03-30 DOI:10.47970/siskom-kb.v5i2.261

I. B. P. Manuaba, Gede Rasben Dantes, G. Indrawan

{"title":"情感分析数据提供者Layanan Internet pagadtwitter Menggunakan支持向量机Dengan Penambahan算法Levenshtein Distance","authors":"I. B. P. Manuaba, Gede Rasben Dantes, G. Indrawan","doi":"10.47970/siskom-kb.v5i2.261","DOIUrl":null,"url":null,"abstract":"Komentar pada data twitter mengandung banyak opini terkait suatu objek atau topik. Dari kumpulan komentar, dapat dilakukan analisis sentimen menggunakan Support Vector Machine untuk memperoleh hasil klasifikasi positif dan negatif. Data yang digunakan berkaitan dengan provider atau penyedia jaringan internet yang ada di Indonesia. Penambahan algoritma Levenshtein Distance pada tahap text preprocessing bertujuan untuk meningkatkan hasil klasifikasi. Tahapan Proses klasifikasi meliputi, pengumpulan data menggunakan API twitter, penghapusan duplicate data, pemberian label data, tahap text preprocessing (convert emoticon, cleansing, case folding, stemming, stopword removal, and tokenizing, penerapan algoritma Levenshtein Distance, stopword removal lanjutan, convert negation), feature extraction (TF-IDF), serta proses klasifikasi menggunakan Support Vector Machine.Hasil pengujian dengan menggunakan confusion matrix, menunjukan peningkatan hasil klasifikasi yang lebih baik setelah menggunakan algoritma Levenshtein Distance pada tahap text preprocessing. Nilai accuracy mengalami peningkatan sebesar 2%, recall positif 3%, recall negatif 1%, precision positif 1%, dan precision negatif 2%. Tetapi kecepatan waktu proses pada tahap text preprocessing dengan penambahan algoritma Levenshtein Distance lebih lambat sebesar 295,606 detik, jika dibandingkan tanpa adanya penambahan algoritma Levenshtein Distance.","PeriodicalId":104889,"journal":{"name":"Jurnal SISKOM-KB (Sistem Komputer dan Kecerdasan Buatan)","volume":"91 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2022-03-30","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"2","resultStr":"{\"title\":\"Analisis Sentimen Data Provider Layanan Internet Pada Twitter Menggunakan Support Vector Machine Dengan Penambahan Algoritma Levenshtein Distance\",\"authors\":\"I. B. P. Manuaba, Gede Rasben Dantes, G. Indrawan\",\"doi\":\"10.47970/siskom-kb.v5i2.261\",\"DOIUrl\":null,\"url\":null,\"abstract\":\"Komentar pada data twitter mengandung banyak opini terkait suatu objek atau topik. Dari kumpulan komentar, dapat dilakukan analisis sentimen menggunakan Support Vector Machine untuk memperoleh hasil klasifikasi positif dan negatif. Data yang digunakan berkaitan dengan provider atau penyedia jaringan internet yang ada di Indonesia. Penambahan algoritma Levenshtein Distance pada tahap text preprocessing bertujuan untuk meningkatkan hasil klasifikasi. Tahapan Proses klasifikasi meliputi, pengumpulan data menggunakan API twitter, penghapusan duplicate data, pemberian label data, tahap text preprocessing (convert emoticon, cleansing, case folding, stemming, stopword removal, and tokenizing, penerapan algoritma Levenshtein Distance, stopword removal lanjutan, convert negation), feature extraction (TF-IDF), serta proses klasifikasi menggunakan Support Vector Machine.Hasil pengujian dengan menggunakan confusion matrix, menunjukan peningkatan hasil klasifikasi yang lebih baik setelah menggunakan algoritma Levenshtein Distance pada tahap text preprocessing. Nilai accuracy mengalami peningkatan sebesar 2%, recall positif 3%, recall negatif 1%, precision positif 1%, dan precision negatif 2%. Tetapi kecepatan waktu proses pada tahap text preprocessing dengan penambahan algoritma Levenshtein Distance lebih lambat sebesar 295,606 detik, jika dibandingkan tanpa adanya penambahan algoritma Levenshtein Distance.\",\"PeriodicalId\":104889,\"journal\":{\"name\":\"Jurnal SISKOM-KB (Sistem Komputer dan Kecerdasan Buatan)\",\"volume\":\"91 1\",\"pages\":\"0\"},\"PeriodicalIF\":0.0000,\"publicationDate\":\"2022-03-30\",\"publicationTypes\":\"Journal Article\",\"fieldsOfStudy\":null,\"isOpenAccess\":false,\"openAccessPdf\":\"\",\"citationCount\":\"2\",\"resultStr\":null,\"platform\":\"Semanticscholar\",\"paperid\":null,\"PeriodicalName\":\"Jurnal SISKOM-KB (Sistem Komputer dan Kecerdasan Buatan)\",\"FirstCategoryId\":\"1085\",\"ListUrlMain\":\"https://doi.org/10.47970/siskom-kb.v5i2.261\",\"RegionNum\":0,\"RegionCategory\":null,\"ArticlePicture\":[],\"TitleCN\":null,\"AbstractTextCN\":null,\"PMCID\":null,\"EPubDate\":\"\",\"PubModel\":\"\",\"JCR\":\"\",\"JCRName\":\"\",\"Score\":null,\"Total\":0}","platform":"Semanticscholar","paperid":null,"PeriodicalName":"Jurnal SISKOM-KB (Sistem Komputer dan Kecerdasan Buatan)","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.47970/siskom-kb.v5i2.261","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}

引用次数: 2

摘要

twitter 数据中的评论包含与某个对象或话题相关的许多观点。从收集到的评论中，可以使用支持向量机进行情感分析，从而获得正面和负面的分类结果。所使用的数据与印度尼西亚的供应商或互联网网络供应商有关。在文本预处理阶段加入莱文斯坦距离算法，旨在改善分类结果。分类过程的各个阶段包括：使用 twitter API 收集数据、删除重复数据、数据标注、文本预处理阶段（转换表情符号、清洗、大小写折叠、词干、停止词删除和标记化、应用莱文斯坦距离算法、高级停止词删除、转换否定）、特征提取（TF-IDF）以及使用支持向量机进行分类。准确率提高了 2%，正召回率提高了 3%，负召回率提高了 1%，正精度提高了 1%，负精度提高了 2%。不过，在文本预处理阶段添加列文斯坦因距离算法后，处理速度比未添加列文斯坦因距离算法时慢了 295.606 秒。

本文章由计算机程序翻译，如有差异，请以英文原文为准。

查看原文本刊更多论文

Analisis Sentimen Data Provider Layanan Internet Pada Twitter Menggunakan Support Vector Machine Dengan Penambahan Algoritma Levenshtein Distance

Komentar pada data twitter mengandung banyak opini terkait suatu objek atau topik. Dari kumpulan komentar, dapat dilakukan analisis sentimen menggunakan Support Vector Machine untuk memperoleh hasil klasifikasi positif dan negatif. Data yang digunakan berkaitan dengan provider atau penyedia jaringan internet yang ada di Indonesia. Penambahan algoritma Levenshtein Distance pada tahap text preprocessing bertujuan untuk meningkatkan hasil klasifikasi. Tahapan Proses klasifikasi meliputi, pengumpulan data menggunakan API twitter, penghapusan duplicate data, pemberian label data, tahap text preprocessing (convert emoticon, cleansing, case folding, stemming, stopword removal, and tokenizing, penerapan algoritma Levenshtein Distance, stopword removal lanjutan, convert negation), feature extraction (TF-IDF), serta proses klasifikasi menggunakan Support Vector Machine.Hasil pengujian dengan menggunakan confusion matrix, menunjukan peningkatan hasil klasifikasi yang lebih baik setelah menggunakan algoritma Levenshtein Distance pada tahap text preprocessing. Nilai accuracy mengalami peningkatan sebesar 2%, recall positif 3%, recall negatif 1%, precision positif 1%, dan precision negatif 2%. Tetapi kecepatan waktu proses pada tahap text preprocessing dengan penambahan algoritma Levenshtein Distance lebih lambat sebesar 295,606 detik, jika dibandingkan tanpa adanya penambahan algoritma Levenshtein Distance.

求助全文

通过发布文献求助，成功后即可免费获取论文全文。去求助

来源期刊

Jurnal SISKOM-KB (Sistem Komputer dan Kecerdasan Buatan)

自引率

0.00%

发文量