Pemilihan Kata Benda Bahasa Indonesia Berdasarkan Cakupan Suku Kata Menggunakan Genetic Algoritma untuk Dataset Audio Visual

Eka Rahayu Setyaningsih, Anik Nur Handayani, Wahyu Sakti Gunawan Irianto, Yosi Kristian
{"title":"Pemilihan Kata Benda Bahasa Indonesia Berdasarkan Cakupan Suku Kata Menggunakan Genetic Algoritma untuk Dataset Audio Visual","authors":"Eka Rahayu Setyaningsih, Anik Nur Handayani, Wahyu Sakti Gunawan Irianto, Yosi Kristian","doi":"10.26418/jp.v9i1.63970","DOIUrl":null,"url":null,"abstract":"Dalam pembentukan model Kecerdasan Buatan yang menggunakan pendekatan Deep Learning, dataset memegang peranan yang sangat penting. Memahami dan memilih kumpulan data yang tepat, sangatlah penting untuk memastikan keberhasilan sebuah model Kecerdasan Buatan. Salah satu topik yang cukup baru adalah mempelajari bagaimana pembentukan suara dari hasil pembacaan gerakan bibir manusia, dengan cakupan variasi bunyi dan bentuk bibir yang diharapkan dapat membantu pembelajaran sistem. Mayoritas dataset audio visual, yang biasa digunakan untuk pembangunan model pembentukan suara ataupun pembacaan gerakan bibir tidak memperhatikan keluasan cakupan variasi bunyi yang ada. AVID, salah satu dari dataset audio visual berbahasa Indonesia, mengadopsi susunan kata dalam dataset GRID, yang mengubah setiap kata penyusunnya dari Bahasa Inggris ke bahasa Indonesia. Sedangkan pada Bahasa Indonesia sendiri terdapat banyak ragam bunyi yang dibentuk dari satu atau sederet rangkaian fonem. Penelitian yang dilakukan penulis dengan memanfaatkan Genetic Algorithm untuk mendapatkan susunan kombinasi kata benda guna memperoleh nilai cakupan yang optimal. Dengan cakupan kombinasi suku kata yang lebih baik, maka dapat dihasilkan dataset untuk Deep Learning yang lebih baik lagi. Dalam penelitian ini, kata benda yang diproses, diperoleh dari KBBI edisi 2008, baru kemudian difilter untuk mendapatkan kata benda yang tepat mengandung 3 suku kata, yang bukan nama kota, tokoh maupun lokasi. Dari 39.070 kata benda yang ada, diperoleh 2936 kata benda yang akan digunakan. Ujicoba yang telah dilakukan pada 10.000 hingga 200.000 epoch, diperoleh rata-rata cakupan suku kata 72%-75% dengan batasan 26 variasi kata benda penyusunnya.","PeriodicalId":31793,"journal":{"name":"JEPIN Jurnal Edukasi dan Penelitian Informatika","volume":"26 1","pages":""},"PeriodicalIF":0.0000,"publicationDate":"2023-04-29","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"JEPIN Jurnal Edukasi dan Penelitian Informatika","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.26418/jp.v9i1.63970","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0

Abstract

Dalam pembentukan model Kecerdasan Buatan yang menggunakan pendekatan Deep Learning, dataset memegang peranan yang sangat penting. Memahami dan memilih kumpulan data yang tepat, sangatlah penting untuk memastikan keberhasilan sebuah model Kecerdasan Buatan. Salah satu topik yang cukup baru adalah mempelajari bagaimana pembentukan suara dari hasil pembacaan gerakan bibir manusia, dengan cakupan variasi bunyi dan bentuk bibir yang diharapkan dapat membantu pembelajaran sistem. Mayoritas dataset audio visual, yang biasa digunakan untuk pembangunan model pembentukan suara ataupun pembacaan gerakan bibir tidak memperhatikan keluasan cakupan variasi bunyi yang ada. AVID, salah satu dari dataset audio visual berbahasa Indonesia, mengadopsi susunan kata dalam dataset GRID, yang mengubah setiap kata penyusunnya dari Bahasa Inggris ke bahasa Indonesia. Sedangkan pada Bahasa Indonesia sendiri terdapat banyak ragam bunyi yang dibentuk dari satu atau sederet rangkaian fonem. Penelitian yang dilakukan penulis dengan memanfaatkan Genetic Algorithm untuk mendapatkan susunan kombinasi kata benda guna memperoleh nilai cakupan yang optimal. Dengan cakupan kombinasi suku kata yang lebih baik, maka dapat dihasilkan dataset untuk Deep Learning yang lebih baik lagi. Dalam penelitian ini, kata benda yang diproses, diperoleh dari KBBI edisi 2008, baru kemudian difilter untuk mendapatkan kata benda yang tepat mengandung 3 suku kata, yang bukan nama kota, tokoh maupun lokasi. Dari 39.070 kata benda yang ada, diperoleh 2936 kata benda yang akan digunakan. Ujicoba yang telah dilakukan pada 10.000 hingga 200.000 epoch, diperoleh rata-rata cakupan suku kata 72%-75% dengan batasan 26 variasi kata benda penyusunnya.
在利用深度学习方法创建人工智能模型的过程中,数据构建起了至关重要的作用。理解和选择正确的数据集是确保人工智能模型成功的关键。一个新的主题是研究人类嘴唇运动的结果如何形成声音,其声音的范围和嘴唇的变化可能有助于系统学习。大多数用于声音形成模型或唇读读数的可视化音频数据都没有考虑到声音变化的范围。阿维德是印尼的视觉音频分析人员之一,他在数据集中使用了单词结构,将每个组成词从英语改为印尼语。而在英语中,声音从一个或一系列的音素中呈现出来。作者通过利用遗传算法获取名词组合以获得最佳覆盖值进行的研究。有了更好的音节组合,就可以生成更深入学习的数据。在本研究中,经过处理的名词从2008年版的KBBI中获得,然后过滤以获得包含三个音节的专有名词,这些音节不是城市名称、人物或地点。在现有的39070个名词中,获得了2936个名词供使用。已经进行的试验在1万到20万epoch中,平均有72%到75%的表面积和26种组成名词的限制。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
求助全文
约1分钟内获得全文 求助全文
来源期刊
自引率
0.00%
发文量
1
审稿时长
10 weeks
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
确定
请完成安全验证×
copy
已复制链接
快去分享给好友吧!
我知道了
右上角分享
点击右上角分享
0
联系我们:info@booksci.cn Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。 Copyright © 2023 布克学术 All rights reserved.
京ICP备2023020795号-1
ghs 京公网安备 11010802042870号
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术官方微信