使用天真贝叶斯方法对 twitter 平台上的电子门票系统进行情感分析

Shella Armand, Moch Hafid T, Muhammad Rafi Muttaqin
{"title":"使用天真贝叶斯方法对 twitter 平台上的电子门票系统进行情感分析","authors":"Shella Armand, Moch Hafid T, Muhammad Rafi Muttaqin","doi":"10.36040/jati.v7i3.7023","DOIUrl":null,"url":null,"abstract":"Berita yang belakangan ini menjadi sorotan di media sosial Twitter di Indonesia adalah penerapan sistem e-Tilang, yang merupakan langkah baru dari pemerintah dalam mewujudkan Good Governance. Sistem ini diharapkan dapat mendisiplinkan para pengendara kendaraan bermotor yang sering melakukan pelanggaran berlalu lintas. Banyak masyarakat memiliki pendapat yang beragam mengenai penerapan sistem ini, ada yang setuju dan ada yang tidak setuju. Dalam penelitian ini, dilakukan analisis sentimen terhadap sistem e-Tilang atau pendapat masyarakat untuk mengelompokkan komentar-komentar tersebut menjadi kesan positif, netral, dan negatif. Algoritma Naive Bayes dipilih untuk analisis karena memiliki nilai probabilitas atau peluang tertinggi untuk pengklasifikasian data. Proses pelabelan data pada Twitter menggunakan Bahasa Pemrograman Python dan Lexicon Based dengan menggunakan tools Google Colab. Data kemudian melewati empat tahapan preprocessing, yaitu transformation, tokenizing, filtering, dan stemming. Setelah data selesai dipreprocessing, dilakukan pembobotan TF-IDF untuk mengetahui banyaknya kemunculan kata dalam setiap komentar. Hasil dari pengklasifikasian data menggunakan Algoritma Naive Bayes dievaluasi menggunakan Confusion Matrix pada tools Google Colab. Hasil evaluasi menunjukkan bahwa presisi positif sebesar 43%, presisi negatif sebesar 38%, dan presisi netral sebesar 85%. Sementara itu, recall positif sebesar 43%, recall negatif 14%, dan recall netral sebesar 95%, dengan akurasi keseluruhan mencapai 80%. Dari hasil analisis ini, dapat disimpulkan bahwa tanggapan masyarakat mengenai sistem e-Tilang yang diterapkan oleh pemerintah Indonesia cenderung netral.","PeriodicalId":329787,"journal":{"name":"JATI (Jurnal Mahasiswa Teknik Informatika)","volume":"159 ","pages":""},"PeriodicalIF":0.0000,"publicationDate":"2023-11-30","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":"{\"title\":\"ANALISIS SENTIMEN SISTEM E-TILANG PADA PLATFORM TWITTER MENGGUNAKAN METODE NAIVE BAYES\",\"authors\":\"Shella Armand, Moch Hafid T, Muhammad Rafi Muttaqin\",\"doi\":\"10.36040/jati.v7i3.7023\",\"DOIUrl\":null,\"url\":null,\"abstract\":\"Berita yang belakangan ini menjadi sorotan di media sosial Twitter di Indonesia adalah penerapan sistem e-Tilang, yang merupakan langkah baru dari pemerintah dalam mewujudkan Good Governance. Sistem ini diharapkan dapat mendisiplinkan para pengendara kendaraan bermotor yang sering melakukan pelanggaran berlalu lintas. Banyak masyarakat memiliki pendapat yang beragam mengenai penerapan sistem ini, ada yang setuju dan ada yang tidak setuju. Dalam penelitian ini, dilakukan analisis sentimen terhadap sistem e-Tilang atau pendapat masyarakat untuk mengelompokkan komentar-komentar tersebut menjadi kesan positif, netral, dan negatif. Algoritma Naive Bayes dipilih untuk analisis karena memiliki nilai probabilitas atau peluang tertinggi untuk pengklasifikasian data. Proses pelabelan data pada Twitter menggunakan Bahasa Pemrograman Python dan Lexicon Based dengan menggunakan tools Google Colab. Data kemudian melewati empat tahapan preprocessing, yaitu transformation, tokenizing, filtering, dan stemming. Setelah data selesai dipreprocessing, dilakukan pembobotan TF-IDF untuk mengetahui banyaknya kemunculan kata dalam setiap komentar. Hasil dari pengklasifikasian data menggunakan Algoritma Naive Bayes dievaluasi menggunakan Confusion Matrix pada tools Google Colab. Hasil evaluasi menunjukkan bahwa presisi positif sebesar 43%, presisi negatif sebesar 38%, dan presisi netral sebesar 85%. Sementara itu, recall positif sebesar 43%, recall negatif 14%, dan recall netral sebesar 95%, dengan akurasi keseluruhan mencapai 80%. Dari hasil analisis ini, dapat disimpulkan bahwa tanggapan masyarakat mengenai sistem e-Tilang yang diterapkan oleh pemerintah Indonesia cenderung netral.\",\"PeriodicalId\":329787,\"journal\":{\"name\":\"JATI (Jurnal Mahasiswa Teknik Informatika)\",\"volume\":\"159 \",\"pages\":\"\"},\"PeriodicalIF\":0.0000,\"publicationDate\":\"2023-11-30\",\"publicationTypes\":\"Journal Article\",\"fieldsOfStudy\":null,\"isOpenAccess\":false,\"openAccessPdf\":\"\",\"citationCount\":\"0\",\"resultStr\":null,\"platform\":\"Semanticscholar\",\"paperid\":null,\"PeriodicalName\":\"JATI (Jurnal Mahasiswa Teknik Informatika)\",\"FirstCategoryId\":\"1085\",\"ListUrlMain\":\"https://doi.org/10.36040/jati.v7i3.7023\",\"RegionNum\":0,\"RegionCategory\":null,\"ArticlePicture\":[],\"TitleCN\":null,\"AbstractTextCN\":null,\"PMCID\":null,\"EPubDate\":\"\",\"PubModel\":\"\",\"JCR\":\"\",\"JCRName\":\"\",\"Score\":null,\"Total\":0}","platform":"Semanticscholar","paperid":null,"PeriodicalName":"JATI (Jurnal Mahasiswa Teknik Informatika)","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.36040/jati.v7i3.7023","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0

摘要

最近,印尼推特(Twitter)上的一则新闻引起了人们的关注,这就是印尼政府为实现善治(Good Governance)而实施的新举措--e-Tilang 系统。该系统有望对经常违反交通规则的驾驶员进行惩戒。许多人对该系统的实施持有不同意见,有些人同意,有些人不同意。本研究对 e-Tilang 系统或公众意见进行了情感分析,将评论分为正面、中性和负面印象。之所以选择 Naive Bayes 算法进行分析,是因为该算法具有最高的数据分类概率值。给 Twitter 上的数据贴标签的过程使用了 Python 编程语言和基于词典的 Google Colab 工具。然后,数据会经过四个预处理阶段,即转换、标记化、过滤和词干化。数据预处理完成后,将进行 TF-IDF 加权,以确定每条评论中单词的出现次数。使用 Naive Bayes 算法的数据分类结果是通过 Google Colab 工具上的混淆矩阵进行评估的。评估结果显示,正向精确度为 43%,负向精确度为 38%,中性精确度为 85%。同时,正召回率为 43%,负召回率为 14%,中性召回率为 95%,总体准确率达到 80%。从分析结果可以得出结论,公众对印尼政府实施的电子票务系统的反应趋于中性。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
ANALISIS SENTIMEN SISTEM E-TILANG PADA PLATFORM TWITTER MENGGUNAKAN METODE NAIVE BAYES
Berita yang belakangan ini menjadi sorotan di media sosial Twitter di Indonesia adalah penerapan sistem e-Tilang, yang merupakan langkah baru dari pemerintah dalam mewujudkan Good Governance. Sistem ini diharapkan dapat mendisiplinkan para pengendara kendaraan bermotor yang sering melakukan pelanggaran berlalu lintas. Banyak masyarakat memiliki pendapat yang beragam mengenai penerapan sistem ini, ada yang setuju dan ada yang tidak setuju. Dalam penelitian ini, dilakukan analisis sentimen terhadap sistem e-Tilang atau pendapat masyarakat untuk mengelompokkan komentar-komentar tersebut menjadi kesan positif, netral, dan negatif. Algoritma Naive Bayes dipilih untuk analisis karena memiliki nilai probabilitas atau peluang tertinggi untuk pengklasifikasian data. Proses pelabelan data pada Twitter menggunakan Bahasa Pemrograman Python dan Lexicon Based dengan menggunakan tools Google Colab. Data kemudian melewati empat tahapan preprocessing, yaitu transformation, tokenizing, filtering, dan stemming. Setelah data selesai dipreprocessing, dilakukan pembobotan TF-IDF untuk mengetahui banyaknya kemunculan kata dalam setiap komentar. Hasil dari pengklasifikasian data menggunakan Algoritma Naive Bayes dievaluasi menggunakan Confusion Matrix pada tools Google Colab. Hasil evaluasi menunjukkan bahwa presisi positif sebesar 43%, presisi negatif sebesar 38%, dan presisi netral sebesar 85%. Sementara itu, recall positif sebesar 43%, recall negatif 14%, dan recall netral sebesar 95%, dengan akurasi keseluruhan mencapai 80%. Dari hasil analisis ini, dapat disimpulkan bahwa tanggapan masyarakat mengenai sistem e-Tilang yang diterapkan oleh pemerintah Indonesia cenderung netral.
求助全文
通过发布文献求助,成功后即可免费获取论文全文。 去求助
来源期刊
自引率
0.00%
发文量
0
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
确定
请完成安全验证×
copy
已复制链接
快去分享给好友吧!
我知道了
右上角分享
点击右上角分享
0
联系我们:info@booksci.cn Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。 Copyright © 2023 布克学术 All rights reserved.
京ICP备2023020795号-1
ghs 京公网安备 11010802042870号
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术官方微信