Deteksi Komentar Cyberbullying Pada YouTube Dengan Metode Convolutional Neural Network – Long Short-Term Memory Network (CNN-LSTM)

Teknika Pub Date : 2023-10-16 DOI:10.34148/teknika.v12i3.677

Albertus Josef Andika, Yosi Kristian, Esther Irawati Setiawan

{"title":"Deteksi Komentar Cyberbullying Pada YouTube Dengan Metode Convolutional Neural Network – Long Short-Term Memory Network (CNN-LSTM)","authors":"Albertus Josef Andika, Yosi Kristian, Esther Irawati Setiawan","doi":"10.34148/teknika.v12i3.677","DOIUrl":null,"url":null,"abstract":"Pada era digital seperti sekarang cyberbullying kerapkali terjadi di berbagai belahan dunia termasuk di Indonesia, hal ini dapat terjadi pada siapa saja dan dimana saja terutama media sosial seperti YouTube melalui fitur komentar semua pengguna yang memiliki akun dapat dengan mudah terlibat cyberbullying hanya melalui berbalas komentar. Penelitian ini bertujuan untuk melakukan deteksi adanya cyberbullying melalui pengumpulan serta pengklasifikasian komentar negatif video pada kanal YouTube dengan konten tertentu berbasis bahasa Indonesia (serta bahasa-bahasa daerah tertentu, seperti Jawa dan Surabaya) melalui metode deep-learning Convolutional Neural Network – Long Short-Term Memory Network (CNN-LSTM). Dataset komentar yang dipakai dalam penelitian dikumpulkan dengan menggunakan Application Program Interface (API) yang telah disediakan oleh Youtube secara gratis dan berbatas kuota secara kumulatif. Terkumpul data komentar total sebanyak 26.918 komentar dengan perincian 9.834 komentar terklasifikasi cyberbullying dan 17.084 komentar terklasifikasi sebagai bukan cyberbullying. Setelah dataset dipakai dalam proses training pada model CNN-LSTM dan menghasilkan sebuah model dengan nilai F1-score sebesar 0,84, model tersebut dipakai dalam sebuah API sederhana yang menerima input beberapa kalimat yang akan dideteksi konten cyberbullying dan menghasilkan output berupa JSON yang berisi hasil klasifikasi dari setiap kalimat yang akan dideteksi.","PeriodicalId":52620,"journal":{"name":"Teknika","volume":"61 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2023-10-16","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Teknika","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.34148/teknika.v12i3.677","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}

引用次数: 0

Abstract

Pada era digital seperti sekarang cyberbullying kerapkali terjadi di berbagai belahan dunia termasuk di Indonesia, hal ini dapat terjadi pada siapa saja dan dimana saja terutama media sosial seperti YouTube melalui fitur komentar semua pengguna yang memiliki akun dapat dengan mudah terlibat cyberbullying hanya melalui berbalas komentar. Penelitian ini bertujuan untuk melakukan deteksi adanya cyberbullying melalui pengumpulan serta pengklasifikasian komentar negatif video pada kanal YouTube dengan konten tertentu berbasis bahasa Indonesia (serta bahasa-bahasa daerah tertentu, seperti Jawa dan Surabaya) melalui metode deep-learning Convolutional Neural Network – Long Short-Term Memory Network (CNN-LSTM). Dataset komentar yang dipakai dalam penelitian dikumpulkan dengan menggunakan Application Program Interface (API) yang telah disediakan oleh Youtube secara gratis dan berbatas kuota secara kumulatif. Terkumpul data komentar total sebanyak 26.918 komentar dengan perincian 9.834 komentar terklasifikasi cyberbullying dan 17.084 komentar terklasifikasi sebagai bukan cyberbullying. Setelah dataset dipakai dalam proses training pada model CNN-LSTM dan menghasilkan sebuah model dengan nilai F1-score sebesar 0,84, model tersebut dipakai dalam sebuah API sederhana yang menerima input beberapa kalimat yang akan dideteksi konten cyberbullying dan menghasilkan output berupa JSON yang berisi hasil klasifikasi dari setiap kalimat yang akan dideteksi.

查看原文本刊更多论文

卷积神经网络-长短期记忆网络(CNN-LSTM)

在像今天这样的数字时代，网络欺凌经常发生在世界各地，包括印度尼西亚，这可能发生在任何人和任何地方，尤其是YouTube等社交媒体上，通过所有有账号的用户的评论功能，很容易通过评论卷入网络欺凌。这项研究的目的是通过通过深度学习网络(以及某些地区语言，如java和泗水)的视频收集和分类来检测网络欺凌的存在。使用Youtube免费提供的应用程序界面程序和累积配额数据收集研究中使用的评论数据。共收集了26918条评论数据，其中包含详细的9834条被归类为“网络欺凌”的评论，以及17,084条被归类为“非网络欺凌”的评论。在CNN-LSTM模型的培训过程中使用了数据集，产生了价值为0.84的F1-score值的模型后，该模型被用于一个简单的火焰中，接受了一些句子输入，这些输入将检测到网络欺凌内容，并产生JSON，其中包含每个句子的分类结果。

本文章由计算机程序翻译，如有差异，请以英文原文为准。

求助全文

约1分钟内获得全文求助全文

来源期刊

Teknika

自引率

0.00%

发文量

审稿时长

6 weeks