Klasifikasi Intensi dengan Metode Ling Short-Term Memory pada Chatbot Bahasa Indonesia

Faiz Aulia Al Farisi, R. Perdana, Putra Pandu Adikara
{"title":"Klasifikasi Intensi dengan Metode Ling Short-Term Memory pada Chatbot Bahasa Indonesia","authors":"Faiz Aulia Al Farisi, R. Perdana, Putra Pandu Adikara","doi":"10.25126/jtiik.1078000","DOIUrl":null,"url":null,"abstract":"E-government merupakan sebuah konsep pemerintahan yang menyelenggarakan layanan publik secara digital yang didukung oleh teknologi informasi, sehingga menjadi lebih prima. Salah satu bentuk layanan publik digital yang umum ada di berbagai sektor adalah helpdesk. Helpdesk memungkinkan pengguna dapat bertanya atau melaporkan sesuatu untuk kemudian dijawab oleh staf. Permasalahan yang ada adalah ketersediaan staf yang hanya dapat menjawab pada jam kerja, sedangkan pengguna bisa jadi menemukan permasalahan yang urgent di luar jam kerja. Oleh karena itu, solusi yang ditawarkan adalah penerapan chatbot, sehingga dapat melayani kapan pun, sekaligus meringankan kerja dari staf. Penelitian ini mencoba untuk merancang salah satu komponen pada chatbot, yaitu model klasifikasi intensi, dengan metode Long Short-Term Memory. Data yang digunakan merupakan 501 teks riwayat pertanyaan dari database Helpdesk TIK UB yang termasuk ke dalam 7 kelas intensi yang ditentukan. Data akan melalui beberapa tahap prapemrosesan sebelum kemudian dilakukan pemodelan dan beberapa pengujian. Tahap pengujian meliputi pemilihan embedding yang digunakan, pemilihan teknik augmentasi data, dan penyetelan hyperparameter. Hasil dari keseluruhan pengujian, didapatkan model terbaik yang mampu menghasilkan akurasi sempurna untuk data latih dan data uji, serta loss 0,004 untuk data latih dan 0,044 untuk data uji.   Abstract   E-government is a government concept that organizes digital public services supported by information technology, so that they become more excellent. One form of digital public service that is common in various sectors is the helpdesk. Helpdesk allows users to ask questions or report something to be answered by staff. The problem that exists is the availability of staff who can only answer during working hours, while users may find urgent problems outside of working hours. Therefore, the solution offered is the implementation of a chatbot, so that it can serve at any time, while easing the work of staff. This study attempts to design one of the components of the chatbot, namely the intention classification model, using the Long Short-Term Memory method. The data used are 501 question history texts from the Helpdesk TIK UB database which fall into the 7 specified intensity classes. The data will go through several pre-processing stages before then being modeled and tested. The testing phase includes selecting the embedding used, data augmentation techniques selection, and hyperparameter tuning. The best model is obtained which can produce perfect accuracy for training data and test data, as well as a loss of 0.004 for training data and 0.044 for test data.","PeriodicalId":32501,"journal":{"name":"Jurnal Teknologi Informasi dan Ilmu Komputer","volume":"28 51","pages":""},"PeriodicalIF":0.0000,"publicationDate":"2023-12-29","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Jurnal Teknologi Informasi dan Ilmu Komputer","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.25126/jtiik.1078000","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0

Abstract

E-government merupakan sebuah konsep pemerintahan yang menyelenggarakan layanan publik secara digital yang didukung oleh teknologi informasi, sehingga menjadi lebih prima. Salah satu bentuk layanan publik digital yang umum ada di berbagai sektor adalah helpdesk. Helpdesk memungkinkan pengguna dapat bertanya atau melaporkan sesuatu untuk kemudian dijawab oleh staf. Permasalahan yang ada adalah ketersediaan staf yang hanya dapat menjawab pada jam kerja, sedangkan pengguna bisa jadi menemukan permasalahan yang urgent di luar jam kerja. Oleh karena itu, solusi yang ditawarkan adalah penerapan chatbot, sehingga dapat melayani kapan pun, sekaligus meringankan kerja dari staf. Penelitian ini mencoba untuk merancang salah satu komponen pada chatbot, yaitu model klasifikasi intensi, dengan metode Long Short-Term Memory. Data yang digunakan merupakan 501 teks riwayat pertanyaan dari database Helpdesk TIK UB yang termasuk ke dalam 7 kelas intensi yang ditentukan. Data akan melalui beberapa tahap prapemrosesan sebelum kemudian dilakukan pemodelan dan beberapa pengujian. Tahap pengujian meliputi pemilihan embedding yang digunakan, pemilihan teknik augmentasi data, dan penyetelan hyperparameter. Hasil dari keseluruhan pengujian, didapatkan model terbaik yang mampu menghasilkan akurasi sempurna untuk data latih dan data uji, serta loss 0,004 untuk data latih dan 0,044 untuk data uji.   Abstract   E-government is a government concept that organizes digital public services supported by information technology, so that they become more excellent. One form of digital public service that is common in various sectors is the helpdesk. Helpdesk allows users to ask questions or report something to be answered by staff. The problem that exists is the availability of staff who can only answer during working hours, while users may find urgent problems outside of working hours. Therefore, the solution offered is the implementation of a chatbot, so that it can serve at any time, while easing the work of staff. This study attempts to design one of the components of the chatbot, namely the intention classification model, using the Long Short-Term Memory method. The data used are 501 question history texts from the Helpdesk TIK UB database which fall into the 7 specified intensity classes. The data will go through several pre-processing stages before then being modeled and tested. The testing phase includes selecting the embedding used, data augmentation techniques selection, and hyperparameter tuning. The best model is obtained which can produce perfect accuracy for training data and test data, as well as a loss of 0.004 for training data and 0.044 for test data.
在印尼聊天机器人上使用凌短期记忆法进行意图分类
电子政务是一种政府理念,它以信息技术为支撑,组织数字化的公共服务,使其变得更加卓越。各行各业常见的一种数字化公共服务形式是服务台。服务台允许用户提出问题或报告,由工作人员回答。目前存在的问题是,工作人员只能在工作时间回答问题,而用户可能会在工作时间之外发现紧急问题。因此,提供的解决方案是安装一个聊天机器人,使其可以随时提供服务,同时减轻工作人员的工作负担。本研究试图利用长短期记忆法设计聊天机器人的一个组成部分,即意图分类模型。使用的数据是 UB ICT 服务台数据库中的 501 个问题历史文本,这些文本属于 7 个指定的意向类别。在建模和测试之前,数据将经过几个预处理阶段。测试阶段包括所使用嵌入的选择、数据增强技术的选择和超参数的调整。所有测试的结果都表明,最佳模型能够为训练数据和测试数据提供完美的准确性,并且训练数据的损失为 0.004,测试数据的损失为 0.044。 摘 要 电子政务是一种政府理念,它以信息技术为支撑,组织数字化的公共服务,使其变得更加卓越。服务台是各部门普遍采用的一种数字化公共服务形式。服务台允许用户提出问题或报告,由工作人员进行解答。目前存在的问题是,工作人员只能在工作时间回答问题,而用户可能会在工作时间之外发现紧急问题。因此,提供的解决方案是实施聊天机器人,使其可以随时提供服务,同时减轻工作人员的工作。本研究试图利用长短期记忆法设计聊天机器人的一个组成部分,即意图分类模型。使用的数据是来自帮助台 TIK UB 数据库的 501 个问题历史文本,这些文本属于 7 个指定的强度类别。数据将经过几个预处理阶段,然后进行建模和测试。测试阶段包括选择所使用的嵌入、数据增强技术选择和超参数调整。最终会得到一个最佳模型,该模型可以为训练数据和测试数据带来完美的准确性,并且训练数据的损失为 0.004,测试数据的损失为 0.044。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
求助全文
约1分钟内获得全文 求助全文
来源期刊
自引率
0.00%
发文量
0
审稿时长
16 weeks
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
确定
请完成安全验证×
copy
已复制链接
快去分享给好友吧!
我知道了
右上角分享
点击右上角分享
0
联系我们:info@booksci.cn Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。 Copyright © 2023 布克学术 All rights reserved.
京ICP备2023020795号-1
ghs 京公网安备 11010802042870号
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术官方微信