Penerapan Algoritma Cosine Similarity pada Text Mining Terjemah Al-Qur’an Berdasarkan Keterkaitan Topik

Semesta Teknika Pub Date : 2019-09-03 DOI:10.18196/ST.221235
M. Wahyudi
{"title":"Penerapan Algoritma Cosine Similarity pada Text Mining Terjemah Al-Qur’an Berdasarkan Keterkaitan Topik","authors":"M. Wahyudi","doi":"10.18196/ST.221235","DOIUrl":null,"url":null,"abstract":"Abstrak Al-Qur’an merupakan sumber hukum dan panduan dalam pemecahan berbagai masalah umat Islam dalam menjalani kehidupan beragama, bermasyarakat, dan bernegara. Pemecaham masalah di dalam Al-Qur’an tidak hanya mengacu pada satu atau dua ayat. Jumlah ayat dan surat Al-Qur’an yang sangat banyak menyebabkan pencarian suatu ayat Al-Qur’an menggunakan cara konvensional akan memerlukan waktu lama. Oleh karena itu, dibutuhkan sebuah sistem untuk mengenali, mencari topik, dan mengelompokkan suatu permasalahan. Pencarian topik dalam terjemahan Al-Qur’an merupakan salah satu penerapan dari metode klasifikasi pengelompokan teks yang melakukan proses secara otomatis menempatkan dokumen teks ke dalam suatu kategori berdasarkan isi teks tersebut. Pengelompokan terjemah ayat Al-Qur'an berbahasa Indonesia dapat dilakukan berdasarkan tingkat kemiripan antar ayat. Algoritma yang bisa dipergunakan dalam permasalahan ini adalah Cosine Similarity. Algoritma ini akan menghitung tingkat kemiripan antar ayat yang akan menghasilkan beberapa kelompok ayat yang diambil untuk dibandingkan dengan index Al-Qur'an. Hasil penelitian menunjukkan bahwa tingkat kemiripan antar ayat sebesar 20% memberikan hasil terbaik pada pengelompokan index Al-Qur’an rata-rata sebesar 46,42%. Tingkat kemiripan antar terjemah ayat Al-Qur’an sebesar 40% memberikan rata-rata sebesar 15, 39% pada pengelompokan index Al-Qur’an. Untuk tingkat kemiripan antar ayat diatas 40%, ada kelompok similaritas ayat yang tidak masuk dalam index Al-Qur’an. Abstract Al-Qur’an as a Muslim holy book, contains life guidance and instructions on how to solve various problems faced by humans on earth. The Qur'an also discusses how life after death fetches every human being. The Qur'an has specific methods in grouping specific themes or problems. There are groupings based on the themes of the stories of previous people, groupings based on verses, juz, and groupings based on the place where the verses or letters of the Qur'an are revealed. In-text mining, grouping a text object can be done in various ways. One of them is based on the level of similarity. This text grouping method, of course, can be implemented in the Qur'an to find out specific patterns. The grouping of Indonesian verses in the Qur'an can be based on the level of similarity between verses using the Cosine Similarity algorithm. This algorithm will calculate the level of similarity between verses. This process will produce several groups of verses that will be taken to compare with the index of the Qur'an. The results showed that the similarity between verses was 20%, giving the best results with an average of 46.42%. The highest level of similarity where each group can still be included in the Al-Qur'an index is 40% with an average of 15, 39%. For the level of similarity between verses above 40%, there is a similarity group of verses that are not included in the Qur'anic index.","PeriodicalId":33667,"journal":{"name":"Semesta Teknika","volume":"1 1","pages":""},"PeriodicalIF":0.0000,"publicationDate":"2019-09-03","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"10","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Semesta Teknika","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.18196/ST.221235","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 10

Abstract

Abstrak Al-Qur’an merupakan sumber hukum dan panduan dalam pemecahan berbagai masalah umat Islam dalam menjalani kehidupan beragama, bermasyarakat, dan bernegara. Pemecaham masalah di dalam Al-Qur’an tidak hanya mengacu pada satu atau dua ayat. Jumlah ayat dan surat Al-Qur’an yang sangat banyak menyebabkan pencarian suatu ayat Al-Qur’an menggunakan cara konvensional akan memerlukan waktu lama. Oleh karena itu, dibutuhkan sebuah sistem untuk mengenali, mencari topik, dan mengelompokkan suatu permasalahan. Pencarian topik dalam terjemahan Al-Qur’an merupakan salah satu penerapan dari metode klasifikasi pengelompokan teks yang melakukan proses secara otomatis menempatkan dokumen teks ke dalam suatu kategori berdasarkan isi teks tersebut. Pengelompokan terjemah ayat Al-Qur'an berbahasa Indonesia dapat dilakukan berdasarkan tingkat kemiripan antar ayat. Algoritma yang bisa dipergunakan dalam permasalahan ini adalah Cosine Similarity. Algoritma ini akan menghitung tingkat kemiripan antar ayat yang akan menghasilkan beberapa kelompok ayat yang diambil untuk dibandingkan dengan index Al-Qur'an. Hasil penelitian menunjukkan bahwa tingkat kemiripan antar ayat sebesar 20% memberikan hasil terbaik pada pengelompokan index Al-Qur’an rata-rata sebesar 46,42%. Tingkat kemiripan antar terjemah ayat Al-Qur’an sebesar 40% memberikan rata-rata sebesar 15, 39% pada pengelompokan index Al-Qur’an. Untuk tingkat kemiripan antar ayat diatas 40%, ada kelompok similaritas ayat yang tidak masuk dalam index Al-Qur’an. Abstract Al-Qur’an as a Muslim holy book, contains life guidance and instructions on how to solve various problems faced by humans on earth. The Qur'an also discusses how life after death fetches every human being. The Qur'an has specific methods in grouping specific themes or problems. There are groupings based on the themes of the stories of previous people, groupings based on verses, juz, and groupings based on the place where the verses or letters of the Qur'an are revealed. In-text mining, grouping a text object can be done in various ways. One of them is based on the level of similarity. This text grouping method, of course, can be implemented in the Qur'an to find out specific patterns. The grouping of Indonesian verses in the Qur'an can be based on the level of similarity between verses using the Cosine Similarity algorithm. This algorithm will calculate the level of similarity between verses. This process will produce several groups of verses that will be taken to compare with the index of the Qur'an. The results showed that the similarity between verses was 20%, giving the best results with an average of 46.42%. The highest level of similarity where each group can still be included in the Al-Qur'an index is 40% with an average of 15, 39%. For the level of similarity between verses above 40%, there is a similarity group of verses that are not included in the Qur'anic index.
抽象的古兰经是穆斯林生活中解决宗教、社区和国家问题的法律和指导来源。古兰经中问题的解决不仅仅是一两段经文。大量的经文和书信导致对传统经文的搜索需要很长时间。因此,它需要一个系统来识别、定位和分类一个主题。根据经文的内容,在古兰经翻译中寻找主题是对文本分类方法的一种应用。翻译的印尼语古兰经文本可以根据经文之间的相似程度来完成。在这个问题上可以使用的算法是相似的余弦。这个算法将计算经文之间的相似性,这将产生一些经文组,用于比较古兰经索引。研究表明,20%的诗歌相似性使得古兰经索引率的最佳增长平均为46,42%。可兰经文本之间的相似性为40%,平均为15%,39%。对于40%以上经文之间的相似性,有一组诗句不属于《古兰经》索引。将《古兰经》作为穆斯林的圣书,接触到如何用地球上的人来解决各种问题的生活指引和指导。古兰经还讨论了死后的生活如何折磨每一个人。古兰经有各种各样的方法,有的有问题,有的有问题。有许多人是建立在前暴行人民的主题上的,有基于verses、juz和古兰经文字被揭示的地方的。在文本挖掘中,在不同的方式中编纂文本对象。其中一个基于相似的水平。这篇短信的编纂方法,当然,可以在古兰经中找到特定的模式。古兰经中印尼的词曲可以建立在相似的句点上这个算法会计算出动词之间相似的程度。这个过程将会产生几个版本的版本,这些版本将会与古兰经的索引相比较。结果表明,verses之间的相似之处是20%,以46.42%的平均成绩提供最佳推荐。同样的高度,每个群体仍然可以在古兰经中包含的最高水平是40%,平均为15%,39%。在《古兰经索引》中不包括的
本文章由计算机程序翻译,如有差异,请以英文原文为准。
求助全文
约1分钟内获得全文 求助全文
来源期刊
自引率
0.00%
发文量
10
审稿时长
12 weeks
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
确定
请完成安全验证×
copy
已复制链接
快去分享给好友吧!
我知道了
右上角分享
点击右上角分享
0
联系我们:info@booksci.cn Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。 Copyright © 2023 布克学术 All rights reserved.
京ICP备2023020795号-1
ghs 京公网安备 11010802042870号
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术官方微信