基于情感的印尼旅游新闻标题分类器模型

Ni Putu Ety Lismaya Dewi, I. Wijaya, I. K. Purnamawan, Ni Wayan Marti
{"title":"基于情感的印尼旅游新闻标题分类器模型","authors":"Ni Putu Ety Lismaya Dewi, I. Wijaya, I. K. Purnamawan, Ni Wayan Marti","doi":"10.25126/jtiik.20241117617","DOIUrl":null,"url":null,"abstract":"Kemajuan teknologi dan platform digital telah menyebabkan perubahan penting dalam industri pariwisata, termasuk penyebaran berita pariwisata. Artikel-artikel berita yang kerap dipublikasikan melalui portal media online dapat berdampak besar pada persepsi positif maupun negatif bagi pembaca. Oleh sebab itu, penelitian ini bertujuan untuk mengembangkan sebuah classifier yang mampu melakukan klasifikasi terhadap judul berita pariwisata berdasarkan sentimen. Sebelumnya, penelitian serupa biasanya lebih berfokus pada klasifikasi berita pariwisata Indonesia dengan menggunakan data dari platform Twitter. Namun, dalam penelitian ini, penulis melakukan pendekatan yang berbeda dengan menggunakan data dari portal berita online, dengan hanya mengambil judul berita sebagai sumber datanya. Penelitian berfokus pada analisis dan klasifikasi sentimen atau sikap emosional yang terkandung dalam judul-judul berita pariwisata. Dalam penelitian ini, digunakan metode machine learning Support Vector Machine (SVM). Data dikumpulkan dari situs berita Detik.com dan diberi label secara manual sesuai dengan sentimen yang terkandung dalamnya. Proses preprocessing teks digunakan untuk mempersiapkan data judul berita pariwisata Indonesia sehingga fiturnya dapat diekstraksi dengan pendekatan Binary Term Presence. Data penelitian dibagi menjadi dua bagian, yaitu 90% untuk proses pelatihan (training proses) dan 10% untuk pengujian, menerapkan teknik K-Fold Cross Validation untuk membagi data dalam proses pelatihan. Hasil penelitian menunjukkan bahwa pendekatan Binary Term Presence berhasil mencapai akurasi sebesar 87,80% dengan kernel RBF. Penelitian ini memberikan kontribusi penting dalam memahami respon publik terhadap topik atau isu pariwisata yang dipublikasikan oleh media. Metode dan pendekatan yang dikembangkan diharapkan dapat menjadi panduan dalam menganalisis sentimen terkini terkait industri pariwisata dan berita yang terkait dengannya.","PeriodicalId":32501,"journal":{"name":"Jurnal Teknologi Informasi dan Ilmu Komputer","volume":"5 8","pages":""},"PeriodicalIF":0.0000,"publicationDate":"2024-02-29","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":"{\"title\":\"Model Classifer Judul Berita Pariwisata Indonesia Berdasarkan Sentimen\",\"authors\":\"Ni Putu Ety Lismaya Dewi, I. Wijaya, I. K. Purnamawan, Ni Wayan Marti\",\"doi\":\"10.25126/jtiik.20241117617\",\"DOIUrl\":null,\"url\":null,\"abstract\":\"Kemajuan teknologi dan platform digital telah menyebabkan perubahan penting dalam industri pariwisata, termasuk penyebaran berita pariwisata. Artikel-artikel berita yang kerap dipublikasikan melalui portal media online dapat berdampak besar pada persepsi positif maupun negatif bagi pembaca. Oleh sebab itu, penelitian ini bertujuan untuk mengembangkan sebuah classifier yang mampu melakukan klasifikasi terhadap judul berita pariwisata berdasarkan sentimen. Sebelumnya, penelitian serupa biasanya lebih berfokus pada klasifikasi berita pariwisata Indonesia dengan menggunakan data dari platform Twitter. Namun, dalam penelitian ini, penulis melakukan pendekatan yang berbeda dengan menggunakan data dari portal berita online, dengan hanya mengambil judul berita sebagai sumber datanya. Penelitian berfokus pada analisis dan klasifikasi sentimen atau sikap emosional yang terkandung dalam judul-judul berita pariwisata. Dalam penelitian ini, digunakan metode machine learning Support Vector Machine (SVM). Data dikumpulkan dari situs berita Detik.com dan diberi label secara manual sesuai dengan sentimen yang terkandung dalamnya. Proses preprocessing teks digunakan untuk mempersiapkan data judul berita pariwisata Indonesia sehingga fiturnya dapat diekstraksi dengan pendekatan Binary Term Presence. Data penelitian dibagi menjadi dua bagian, yaitu 90% untuk proses pelatihan (training proses) dan 10% untuk pengujian, menerapkan teknik K-Fold Cross Validation untuk membagi data dalam proses pelatihan. Hasil penelitian menunjukkan bahwa pendekatan Binary Term Presence berhasil mencapai akurasi sebesar 87,80% dengan kernel RBF. Penelitian ini memberikan kontribusi penting dalam memahami respon publik terhadap topik atau isu pariwisata yang dipublikasikan oleh media. Metode dan pendekatan yang dikembangkan diharapkan dapat menjadi panduan dalam menganalisis sentimen terkini terkait industri pariwisata dan berita yang terkait dengannya.\",\"PeriodicalId\":32501,\"journal\":{\"name\":\"Jurnal Teknologi Informasi dan Ilmu Komputer\",\"volume\":\"5 8\",\"pages\":\"\"},\"PeriodicalIF\":0.0000,\"publicationDate\":\"2024-02-29\",\"publicationTypes\":\"Journal Article\",\"fieldsOfStudy\":null,\"isOpenAccess\":false,\"openAccessPdf\":\"\",\"citationCount\":\"0\",\"resultStr\":null,\"platform\":\"Semanticscholar\",\"paperid\":null,\"PeriodicalName\":\"Jurnal Teknologi Informasi dan Ilmu Komputer\",\"FirstCategoryId\":\"1085\",\"ListUrlMain\":\"https://doi.org/10.25126/jtiik.20241117617\",\"RegionNum\":0,\"RegionCategory\":null,\"ArticlePicture\":[],\"TitleCN\":null,\"AbstractTextCN\":null,\"PMCID\":null,\"EPubDate\":\"\",\"PubModel\":\"\",\"JCR\":\"\",\"JCRName\":\"\",\"Score\":null,\"Total\":0}","platform":"Semanticscholar","paperid":null,"PeriodicalName":"Jurnal Teknologi Informasi dan Ilmu Komputer","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.25126/jtiik.20241117617","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0

摘要

技术和数字平台的进步给旅游业带来了重大变化,包括旅游新闻的传播。通常通过网络媒体门户发布的新闻文章会对读者的正面或负面看法产生重大影响。因此,本研究旨在开发一种能够根据情感对旅游新闻标题进行分类的分类器。此前,类似的研究通常更多地侧重于利用 Twitter 平台的数据对印尼旅游新闻进行分类。然而,在本研究中,作者采用了不同的方法,仅将新闻标题作为数据源,使用在线新闻门户网站的数据。研究重点是对旅游新闻标题中包含的情感或情感态度进行分析和分类。本研究使用了机器学习方法支持向量机(SVM)。数据收集自 Detik.com 新闻网站,并根据其中包含的情感进行人工标注。文本预处理过程用于准备印尼旅游新闻标题数据,以便使用二元术语存在性方法提取其特征。研究数据分为两部分,即 90% 用于训练过程,10% 用于测试,在训练过程中采用 K 折交叉验证技术对数据进行划分。结果表明,使用 RBF 内核的二进制 Term Presence 方法成功地达到了 87.80% 的准确率。这项研究为了解公众对媒体发布的旅游话题或问题的反应做出了重要贡献。所开发的方法和途径有望成为分析当前与旅游业和相关新闻有关的情绪的指南。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
Model Classifer Judul Berita Pariwisata Indonesia Berdasarkan Sentimen
Kemajuan teknologi dan platform digital telah menyebabkan perubahan penting dalam industri pariwisata, termasuk penyebaran berita pariwisata. Artikel-artikel berita yang kerap dipublikasikan melalui portal media online dapat berdampak besar pada persepsi positif maupun negatif bagi pembaca. Oleh sebab itu, penelitian ini bertujuan untuk mengembangkan sebuah classifier yang mampu melakukan klasifikasi terhadap judul berita pariwisata berdasarkan sentimen. Sebelumnya, penelitian serupa biasanya lebih berfokus pada klasifikasi berita pariwisata Indonesia dengan menggunakan data dari platform Twitter. Namun, dalam penelitian ini, penulis melakukan pendekatan yang berbeda dengan menggunakan data dari portal berita online, dengan hanya mengambil judul berita sebagai sumber datanya. Penelitian berfokus pada analisis dan klasifikasi sentimen atau sikap emosional yang terkandung dalam judul-judul berita pariwisata. Dalam penelitian ini, digunakan metode machine learning Support Vector Machine (SVM). Data dikumpulkan dari situs berita Detik.com dan diberi label secara manual sesuai dengan sentimen yang terkandung dalamnya. Proses preprocessing teks digunakan untuk mempersiapkan data judul berita pariwisata Indonesia sehingga fiturnya dapat diekstraksi dengan pendekatan Binary Term Presence. Data penelitian dibagi menjadi dua bagian, yaitu 90% untuk proses pelatihan (training proses) dan 10% untuk pengujian, menerapkan teknik K-Fold Cross Validation untuk membagi data dalam proses pelatihan. Hasil penelitian menunjukkan bahwa pendekatan Binary Term Presence berhasil mencapai akurasi sebesar 87,80% dengan kernel RBF. Penelitian ini memberikan kontribusi penting dalam memahami respon publik terhadap topik atau isu pariwisata yang dipublikasikan oleh media. Metode dan pendekatan yang dikembangkan diharapkan dapat menjadi panduan dalam menganalisis sentimen terkini terkait industri pariwisata dan berita yang terkait dengannya.
求助全文
通过发布文献求助,成功后即可免费获取论文全文。 去求助
来源期刊
自引率
0.00%
发文量
0
审稿时长
16 weeks
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
确定
请完成安全验证×
copy
已复制链接
快去分享给好友吧!
我知道了
右上角分享
点击右上角分享
0
联系我们:info@booksci.cn Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。 Copyright © 2023 布克学术 All rights reserved.
京ICP备2023020795号-1
ghs 京公网安备 11010802042870号
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术官方微信