{"title":"情感分析数据提供者Layanan Internet pagadtwitter Menggunakan支持向量机Dengan Penambahan算法Levenshtein Distance","authors":"I. B. P. Manuaba, Gede Rasben Dantes, G. Indrawan","doi":"10.47970/siskom-kb.v5i2.261","DOIUrl":null,"url":null,"abstract":"Komentar pada data twitter mengandung banyak opini terkait suatu objek atau topik. Dari kumpulan komentar, dapat dilakukan analisis sentimen menggunakan Support Vector Machine untuk memperoleh hasil klasifikasi positif dan negatif. Data yang digunakan berkaitan dengan provider atau penyedia jaringan internet yang ada di Indonesia. Penambahan algoritma Levenshtein Distance pada tahap text preprocessing bertujuan untuk meningkatkan hasil klasifikasi. Tahapan Proses klasifikasi meliputi, pengumpulan data menggunakan API twitter, penghapusan duplicate data, pemberian label data, tahap text preprocessing (convert emoticon, cleansing, case folding, stemming, stopword removal, and tokenizing, penerapan algoritma Levenshtein Distance, stopword removal lanjutan, convert negation), feature extraction (TF-IDF), serta proses klasifikasi menggunakan Support Vector Machine.Hasil pengujian dengan menggunakan confusion matrix, menunjukan peningkatan hasil klasifikasi yang lebih baik setelah menggunakan algoritma Levenshtein Distance pada tahap text preprocessing. Nilai accuracy mengalami peningkatan sebesar 2%, recall positif 3%, recall negatif 1%, precision positif 1%, dan precision negatif 2%. Tetapi kecepatan waktu proses pada tahap text preprocessing dengan penambahan algoritma Levenshtein Distance lebih lambat sebesar 295,606 detik, jika dibandingkan tanpa adanya penambahan algoritma Levenshtein Distance.","PeriodicalId":104889,"journal":{"name":"Jurnal SISKOM-KB (Sistem Komputer dan Kecerdasan Buatan)","volume":"91 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2022-03-30","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"2","resultStr":"{\"title\":\"Analisis Sentimen Data Provider Layanan Internet Pada Twitter Menggunakan Support Vector Machine Dengan Penambahan Algoritma Levenshtein Distance\",\"authors\":\"I. B. P. Manuaba, Gede Rasben Dantes, G. Indrawan\",\"doi\":\"10.47970/siskom-kb.v5i2.261\",\"DOIUrl\":null,\"url\":null,\"abstract\":\"Komentar pada data twitter mengandung banyak opini terkait suatu objek atau topik. Dari kumpulan komentar, dapat dilakukan analisis sentimen menggunakan Support Vector Machine untuk memperoleh hasil klasifikasi positif dan negatif. Data yang digunakan berkaitan dengan provider atau penyedia jaringan internet yang ada di Indonesia. Penambahan algoritma Levenshtein Distance pada tahap text preprocessing bertujuan untuk meningkatkan hasil klasifikasi. Tahapan Proses klasifikasi meliputi, pengumpulan data menggunakan API twitter, penghapusan duplicate data, pemberian label data, tahap text preprocessing (convert emoticon, cleansing, case folding, stemming, stopword removal, and tokenizing, penerapan algoritma Levenshtein Distance, stopword removal lanjutan, convert negation), feature extraction (TF-IDF), serta proses klasifikasi menggunakan Support Vector Machine.Hasil pengujian dengan menggunakan confusion matrix, menunjukan peningkatan hasil klasifikasi yang lebih baik setelah menggunakan algoritma Levenshtein Distance pada tahap text preprocessing. Nilai accuracy mengalami peningkatan sebesar 2%, recall positif 3%, recall negatif 1%, precision positif 1%, dan precision negatif 2%. Tetapi kecepatan waktu proses pada tahap text preprocessing dengan penambahan algoritma Levenshtein Distance lebih lambat sebesar 295,606 detik, jika dibandingkan tanpa adanya penambahan algoritma Levenshtein Distance.\",\"PeriodicalId\":104889,\"journal\":{\"name\":\"Jurnal SISKOM-KB (Sistem Komputer dan Kecerdasan Buatan)\",\"volume\":\"91 1\",\"pages\":\"0\"},\"PeriodicalIF\":0.0000,\"publicationDate\":\"2022-03-30\",\"publicationTypes\":\"Journal Article\",\"fieldsOfStudy\":null,\"isOpenAccess\":false,\"openAccessPdf\":\"\",\"citationCount\":\"2\",\"resultStr\":null,\"platform\":\"Semanticscholar\",\"paperid\":null,\"PeriodicalName\":\"Jurnal SISKOM-KB (Sistem Komputer dan Kecerdasan Buatan)\",\"FirstCategoryId\":\"1085\",\"ListUrlMain\":\"https://doi.org/10.47970/siskom-kb.v5i2.261\",\"RegionNum\":0,\"RegionCategory\":null,\"ArticlePicture\":[],\"TitleCN\":null,\"AbstractTextCN\":null,\"PMCID\":null,\"EPubDate\":\"\",\"PubModel\":\"\",\"JCR\":\"\",\"JCRName\":\"\",\"Score\":null,\"Total\":0}","platform":"Semanticscholar","paperid":null,"PeriodicalName":"Jurnal SISKOM-KB (Sistem Komputer dan Kecerdasan Buatan)","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.47970/siskom-kb.v5i2.261","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
Analisis Sentimen Data Provider Layanan Internet Pada Twitter Menggunakan Support Vector Machine Dengan Penambahan Algoritma Levenshtein Distance
Komentar pada data twitter mengandung banyak opini terkait suatu objek atau topik. Dari kumpulan komentar, dapat dilakukan analisis sentimen menggunakan Support Vector Machine untuk memperoleh hasil klasifikasi positif dan negatif. Data yang digunakan berkaitan dengan provider atau penyedia jaringan internet yang ada di Indonesia. Penambahan algoritma Levenshtein Distance pada tahap text preprocessing bertujuan untuk meningkatkan hasil klasifikasi. Tahapan Proses klasifikasi meliputi, pengumpulan data menggunakan API twitter, penghapusan duplicate data, pemberian label data, tahap text preprocessing (convert emoticon, cleansing, case folding, stemming, stopword removal, and tokenizing, penerapan algoritma Levenshtein Distance, stopword removal lanjutan, convert negation), feature extraction (TF-IDF), serta proses klasifikasi menggunakan Support Vector Machine.Hasil pengujian dengan menggunakan confusion matrix, menunjukan peningkatan hasil klasifikasi yang lebih baik setelah menggunakan algoritma Levenshtein Distance pada tahap text preprocessing. Nilai accuracy mengalami peningkatan sebesar 2%, recall positif 3%, recall negatif 1%, precision positif 1%, dan precision negatif 2%. Tetapi kecepatan waktu proses pada tahap text preprocessing dengan penambahan algoritma Levenshtein Distance lebih lambat sebesar 295,606 detik, jika dibandingkan tanpa adanya penambahan algoritma Levenshtein Distance.