Jurnal Linguistik Komputasional (JLK)最新文献

筛选
英文 中文
Analisis Morfologi untuk Menangani Out-of-Vocabulary Words pada Part-of-Speech Tagger Bahasa Indonesia Menggunakan Hidden Markov Model 印尼语词性标注器的词性分析。蒙古纳坎隐马尔科夫模型
Jurnal Linguistik Komputasional (JLK) Pub Date : 2019-03-25 DOI: 10.26418/JLK.V2I1.13
Febyana Ramadhanti, Yudi Wibisono, R. Sukamto
{"title":"Analisis Morfologi untuk Menangani Out-of-Vocabulary Words pada Part-of-Speech Tagger Bahasa Indonesia Menggunakan Hidden Markov Model","authors":"Febyana Ramadhanti, Yudi Wibisono, R. Sukamto","doi":"10.26418/JLK.V2I1.13","DOIUrl":"https://doi.org/10.26418/JLK.V2I1.13","url":null,"abstract":"Part-of-speech (PoS) tagger merupakan salah satu task dalam bidang natural language processing (NLP) sebagai proses penandaan kategori kata (part-of-speech) untuk setiap kata pada teks kalimat masukan. Hidden markov model (HMM) merupakan algoritma PoS tagger berbasis probabilistik, sehingga sangat tergantung pada train corpus. Terbatasnya komponen dalam train corpus dan luasnya kata dalam bahasa Indonesia menimbulkan masalah yang disebut out-of-vocabulary (OOV) words. Penelitian ini membandingkan PoS tagger yang menggunakan HMM+AM (analisis morfologi) dan PoS tagger HMM tanpa AM, dengan menggunakan train corpus dan testing corpus yang sama. Testing corpus mengandung 30% tingkat OOV dari 6.676 token atau 740 kalimat masukan. Hasil yang diperoleh dari sistem HMM saja memiliki akurasi 97.54%, sedangkan sistem HMM dengan metode analisis morfologi memiliki akurasi tertinggi 99.14%. ","PeriodicalId":418646,"journal":{"name":"Jurnal Linguistik Komputasional (JLK)","volume":"12 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2019-03-25","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"123663968","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
引用次数: 6
Corpus Quality Improvement to Improve the Quality of Statistical Translator Machines (Case Study of Indonesian Language to Java Krama) 提高语料库质量提高统计翻译机质量(以印尼语转Java克拉玛语为例)
Jurnal Linguistik Komputasional (JLK) Pub Date : 2018-09-28 DOI: 10.26418/JLK.V1I2.12
Muhammad Gerdy Asparilla, Herry Sujaini, Rudy Dwi Nyoto
{"title":"Corpus Quality Improvement to Improve the Quality of Statistical Translator Machines (Case Study of Indonesian Language to Java Krama)","authors":"Muhammad Gerdy Asparilla, Herry Sujaini, Rudy Dwi Nyoto","doi":"10.26418/JLK.V1I2.12","DOIUrl":"https://doi.org/10.26418/JLK.V1I2.12","url":null,"abstract":"Bahasa merupakan alat komunikasi yang dijadikan sarana untuk berinteraksi dengan masyarakat sekitar.Kemampuan akan penguasaan banyak bahasa tentunya akan mempermudah untuk berinteraksi dengan orang lain dari berbagai daerah yang berbeda. Oleh karena itu, diperlukan penerjemah untuk menambah pengetahuan akan berbagai bahasa yang ada. Mesin Penerjemah Statistik (Statistical Machine Translation) merupakan sebuah pendekatan mesin penerjemah dengan hasil terjemahan yang dihasilkan atas dasar model statistik yang parameter-parameternya diambil dari hasil analisis korpus paralel. Korpus paralel adalah pasangan korpus yang berisi kalimat-kalimat dalam suatu bahasa dan terjemahannya. Salah satu fitur yang digunakan untuk meningkatkan kualitas hasil terjemahan adalah dengan optimasi korpus. Tujuan yang ingin dicapai dalam penelitian ini adalah melakukan untuk melihat pengaruh kualitas korpus dengan memfilter pasangan kalimat-kalimat dengan terjemahan berkualitas. Filter yang digunakan adalah nilai minimal setiap kalimat yang di uji dengan metode Bilingual Evaluation Understudy (BLEU). Pengujian dilakukan dengan membandingkan nilai akurasi hasil terjemahan sebelum dan setelah optimasi korpus. Dari hasil penelitian, penggunaan optimasi korpus dapat meningkatkan kualitas terjemahan untuk mesin penerjemah bahasa Indonesia ke bahasa Jawa krama. Hal itu terlihat dari hasil pengujian dengan menambahkan optimasi korpus pada 15 kalimat uji diluar korpus terdapat peningkatan rata - rata nilai BLEU sebesar 10.53% dan dengan menggunakan 100 kalimat uji yang berasal dari korpus optimasi terdapat peningkatan rata-rata nilai BLEU sebesar 11.63%  pada pengujian otomatis serta 0.03% pada pengujian oleh ahli bahasa. Berdasarkan hal tersebut, mesin penerjemah statistik bahasa Indonesia ke bahasa Jawa krama dengan penggunaan fitur optimasi korpus dapat meningkatkan nilai akurasi hasil terjemahan.","PeriodicalId":418646,"journal":{"name":"Jurnal Linguistik Komputasional (JLK)","volume":"1 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2018-09-28","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"130659370","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
引用次数: 1
Pembangunan Monolingual Word Alignment Pada Terjemahan Al-Quran Berbahasa Indonesia
Jurnal Linguistik Komputasional (JLK) Pub Date : 2018-09-24 DOI: 10.26418/JLK.V1I2.11
Galih Rizky Prabowo
{"title":"Pembangunan Monolingual Word Alignment Pada Terjemahan Al-Quran Berbahasa Indonesia","authors":"Galih Rizky Prabowo","doi":"10.26418/JLK.V1I2.11","DOIUrl":"https://doi.org/10.26418/JLK.V1I2.11","url":null,"abstract":"Telah berabad-abad Al-Qur’an hadir di tengah-tengah peradaban dan pergaulan umat manusia yang terdiri dari 6236 ayat. Untuk mengukur kesamaan semantik antar terjemahan ayat Al-Quran yang bertujuan untuk memahami lebih dalam terhadap makna yang terkait pada ayat Al-Quran dibutuhkan suatu metode salah satunya dengan monolingual word alignment. Monolingual alignment adalah metode penyejajaran kata yang mengidentifikasi kesamaan antar kata dalam pasangan kalimat yang ada. Selain penggunaan metode monolingual alignment dalam pengukuran kesamaan kata yang ada, dibutuhkan pula sebuah dataset yang di align yang berfungsi sebagai kumpulan dari objek yang isinya adalah hubungan semantik antar sets yang ada. Namun dataset monolingual word alignment untuk bahasa Indonesia berformat MSR masih sangat terbatas volumenya. Dalam penelitian ini, diaplikasikan beberapa fitur dalam metode monolingual alignment dalam pembangunan dataset monolingual word alignment bahasa Indonesia berformat MSR yaitu align identical words, align PFA dan align word sequences dengan menghasilkan nilai F1 86.94 %. Untuk hasil F1 terbaik dihasilkan dari beberapa gabungan fitur alignment yaitu dengan fitur align identical words dan align PFA dengan hasil F1 sebesar 88.83 %. \u0000Kata kunci— Al-Quran, Monolingual Alignment, MSR","PeriodicalId":418646,"journal":{"name":"Jurnal Linguistik Komputasional (JLK)","volume":"25 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2018-09-24","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"123392835","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
引用次数: 1
0
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
确定
请完成安全验证×
相关产品
×
本文献相关产品
联系我们:info@booksci.cn Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。 Copyright © 2023 布克学术 All rights reserved.
京ICP备2023020795号-1
ghs 京公网安备 11010802042870号
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术官方微信