Deteksi Komentar Cyberbullying Pada YouTube Dengan Metode Convolutional Neural Network – Long Short-Term Memory Network (CNN-LSTM)

Teknika Pub Date : 2023-10-16 DOI:10.34148/teknika.v12i3.677
Albertus Josef Andika, Yosi Kristian, Esther Irawati Setiawan
{"title":"Deteksi Komentar Cyberbullying Pada YouTube Dengan Metode Convolutional Neural Network – Long Short-Term Memory Network (CNN-LSTM)","authors":"Albertus Josef Andika, Yosi Kristian, Esther Irawati Setiawan","doi":"10.34148/teknika.v12i3.677","DOIUrl":null,"url":null,"abstract":"Pada era digital seperti sekarang cyberbullying kerapkali terjadi di berbagai belahan dunia termasuk di Indonesia, hal ini dapat terjadi pada siapa saja dan dimana saja terutama media sosial seperti YouTube melalui fitur komentar semua pengguna yang memiliki akun dapat dengan mudah terlibat cyberbullying hanya melalui berbalas komentar. Penelitian ini bertujuan untuk melakukan deteksi adanya cyberbullying melalui pengumpulan serta pengklasifikasian komentar negatif video pada kanal YouTube dengan konten tertentu berbasis bahasa Indonesia (serta bahasa-bahasa daerah tertentu, seperti Jawa dan Surabaya) melalui metode deep-learning Convolutional Neural Network – Long Short-Term Memory Network (CNN-LSTM). Dataset komentar yang dipakai dalam penelitian dikumpulkan dengan menggunakan Application Program Interface (API) yang telah disediakan oleh Youtube secara gratis dan berbatas kuota secara kumulatif. Terkumpul data komentar total sebanyak 26.918 komentar dengan perincian 9.834 komentar terklasifikasi cyberbullying dan 17.084 komentar terklasifikasi sebagai bukan cyberbullying. Setelah dataset dipakai dalam proses training pada model CNN-LSTM dan menghasilkan sebuah model dengan nilai F1-score sebesar 0,84, model tersebut dipakai dalam sebuah API sederhana yang menerima input beberapa kalimat yang akan dideteksi konten cyberbullying dan menghasilkan output berupa JSON yang berisi hasil klasifikasi dari setiap kalimat yang akan dideteksi.","PeriodicalId":52620,"journal":{"name":"Teknika","volume":"61 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2023-10-16","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Teknika","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.34148/teknika.v12i3.677","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0

Abstract

Pada era digital seperti sekarang cyberbullying kerapkali terjadi di berbagai belahan dunia termasuk di Indonesia, hal ini dapat terjadi pada siapa saja dan dimana saja terutama media sosial seperti YouTube melalui fitur komentar semua pengguna yang memiliki akun dapat dengan mudah terlibat cyberbullying hanya melalui berbalas komentar. Penelitian ini bertujuan untuk melakukan deteksi adanya cyberbullying melalui pengumpulan serta pengklasifikasian komentar negatif video pada kanal YouTube dengan konten tertentu berbasis bahasa Indonesia (serta bahasa-bahasa daerah tertentu, seperti Jawa dan Surabaya) melalui metode deep-learning Convolutional Neural Network – Long Short-Term Memory Network (CNN-LSTM). Dataset komentar yang dipakai dalam penelitian dikumpulkan dengan menggunakan Application Program Interface (API) yang telah disediakan oleh Youtube secara gratis dan berbatas kuota secara kumulatif. Terkumpul data komentar total sebanyak 26.918 komentar dengan perincian 9.834 komentar terklasifikasi cyberbullying dan 17.084 komentar terklasifikasi sebagai bukan cyberbullying. Setelah dataset dipakai dalam proses training pada model CNN-LSTM dan menghasilkan sebuah model dengan nilai F1-score sebesar 0,84, model tersebut dipakai dalam sebuah API sederhana yang menerima input beberapa kalimat yang akan dideteksi konten cyberbullying dan menghasilkan output berupa JSON yang berisi hasil klasifikasi dari setiap kalimat yang akan dideteksi.
卷积神经网络-长短期记忆网络(CNN-LSTM)
在像今天这样的数字时代,网络欺凌经常发生在世界各地,包括印度尼西亚,这可能发生在任何人和任何地方,尤其是YouTube等社交媒体上,通过所有有账号的用户的评论功能,很容易通过评论卷入网络欺凌。这项研究的目的是通过通过深度学习网络(以及某些地区语言,如java和泗水)的视频收集和分类来检测网络欺凌的存在。使用Youtube免费提供的应用程序界面程序和累积配额数据收集研究中使用的评论数据。共收集了26918条评论数据,其中包含详细的9834条被归类为“网络欺凌”的评论,以及17,084条被归类为“非网络欺凌”的评论。在CNN-LSTM模型的培训过程中使用了数据集,产生了价值为0.84的F1-score值的模型后,该模型被用于一个简单的火焰中,接受了一些句子输入,这些输入将检测到网络欺凌内容,并产生JSON,其中包含每个句子的分类结果。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
求助全文
约1分钟内获得全文 求助全文
来源期刊
自引率
0.00%
发文量
22
审稿时长
6 weeks
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
确定
请完成安全验证×
copy
已复制链接
快去分享给好友吧!
我知道了
右上角分享
点击右上角分享
0
联系我们:info@booksci.cn Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。 Copyright © 2023 布克学术 All rights reserved.
京ICP备2023020795号-1
ghs 京公网安备 11010802042870号
Book学术文献互助
Book学术文献互助群
群 号:604180095
Book学术官方微信