{"title":"Penerapan Algoritma Cosine Similarity pada Text Mining Terjemah Al-Qur’an Berdasarkan Keterkaitan Topik","authors":"M. Wahyudi","doi":"10.18196/ST.221235","DOIUrl":null,"url":null,"abstract":"Abstrak Al-Qur’an merupakan sumber hukum dan panduan dalam pemecahan berbagai masalah umat Islam dalam menjalani kehidupan beragama, bermasyarakat, dan bernegara. Pemecaham masalah di dalam Al-Qur’an tidak hanya mengacu pada satu atau dua ayat. Jumlah ayat dan surat Al-Qur’an yang sangat banyak menyebabkan pencarian suatu ayat Al-Qur’an menggunakan cara konvensional akan memerlukan waktu lama. Oleh karena itu, dibutuhkan sebuah sistem untuk mengenali, mencari topik, dan mengelompokkan suatu permasalahan. Pencarian topik dalam terjemahan Al-Qur’an merupakan salah satu penerapan dari metode klasifikasi pengelompokan teks yang melakukan proses secara otomatis menempatkan dokumen teks ke dalam suatu kategori berdasarkan isi teks tersebut. Pengelompokan terjemah ayat Al-Qur'an berbahasa Indonesia dapat dilakukan berdasarkan tingkat kemiripan antar ayat. Algoritma yang bisa dipergunakan dalam permasalahan ini adalah Cosine Similarity. Algoritma ini akan menghitung tingkat kemiripan antar ayat yang akan menghasilkan beberapa kelompok ayat yang diambil untuk dibandingkan dengan index Al-Qur'an. Hasil penelitian menunjukkan bahwa tingkat kemiripan antar ayat sebesar 20% memberikan hasil terbaik pada pengelompokan index Al-Qur’an rata-rata sebesar 46,42%. Tingkat kemiripan antar terjemah ayat Al-Qur’an sebesar 40% memberikan rata-rata sebesar 15, 39% pada pengelompokan index Al-Qur’an. Untuk tingkat kemiripan antar ayat diatas 40%, ada kelompok similaritas ayat yang tidak masuk dalam index Al-Qur’an. Abstract Al-Qur’an as a Muslim holy book, contains life guidance and instructions on how to solve various problems faced by humans on earth. The Qur'an also discusses how life after death fetches every human being. The Qur'an has specific methods in grouping specific themes or problems. There are groupings based on the themes of the stories of previous people, groupings based on verses, juz, and groupings based on the place where the verses or letters of the Qur'an are revealed. In-text mining, grouping a text object can be done in various ways. One of them is based on the level of similarity. This text grouping method, of course, can be implemented in the Qur'an to find out specific patterns. The grouping of Indonesian verses in the Qur'an can be based on the level of similarity between verses using the Cosine Similarity algorithm. This algorithm will calculate the level of similarity between verses. This process will produce several groups of verses that will be taken to compare with the index of the Qur'an. The results showed that the similarity between verses was 20%, giving the best results with an average of 46.42%. The highest level of similarity where each group can still be included in the Al-Qur'an index is 40% with an average of 15, 39%. For the level of similarity between verses above 40%, there is a similarity group of verses that are not included in the Qur'anic index.","PeriodicalId":33667,"journal":{"name":"Semesta Teknika","volume":"1 1","pages":""},"PeriodicalIF":0.0000,"publicationDate":"2019-09-03","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"10","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Semesta Teknika","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.18196/ST.221235","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
Penerapan Algoritma Cosine Similarity pada Text Mining Terjemah Al-Qur’an Berdasarkan Keterkaitan Topik
Abstrak Al-Qur’an merupakan sumber hukum dan panduan dalam pemecahan berbagai masalah umat Islam dalam menjalani kehidupan beragama, bermasyarakat, dan bernegara. Pemecaham masalah di dalam Al-Qur’an tidak hanya mengacu pada satu atau dua ayat. Jumlah ayat dan surat Al-Qur’an yang sangat banyak menyebabkan pencarian suatu ayat Al-Qur’an menggunakan cara konvensional akan memerlukan waktu lama. Oleh karena itu, dibutuhkan sebuah sistem untuk mengenali, mencari topik, dan mengelompokkan suatu permasalahan. Pencarian topik dalam terjemahan Al-Qur’an merupakan salah satu penerapan dari metode klasifikasi pengelompokan teks yang melakukan proses secara otomatis menempatkan dokumen teks ke dalam suatu kategori berdasarkan isi teks tersebut. Pengelompokan terjemah ayat Al-Qur'an berbahasa Indonesia dapat dilakukan berdasarkan tingkat kemiripan antar ayat. Algoritma yang bisa dipergunakan dalam permasalahan ini adalah Cosine Similarity. Algoritma ini akan menghitung tingkat kemiripan antar ayat yang akan menghasilkan beberapa kelompok ayat yang diambil untuk dibandingkan dengan index Al-Qur'an. Hasil penelitian menunjukkan bahwa tingkat kemiripan antar ayat sebesar 20% memberikan hasil terbaik pada pengelompokan index Al-Qur’an rata-rata sebesar 46,42%. Tingkat kemiripan antar terjemah ayat Al-Qur’an sebesar 40% memberikan rata-rata sebesar 15, 39% pada pengelompokan index Al-Qur’an. Untuk tingkat kemiripan antar ayat diatas 40%, ada kelompok similaritas ayat yang tidak masuk dalam index Al-Qur’an. Abstract Al-Qur’an as a Muslim holy book, contains life guidance and instructions on how to solve various problems faced by humans on earth. The Qur'an also discusses how life after death fetches every human being. The Qur'an has specific methods in grouping specific themes or problems. There are groupings based on the themes of the stories of previous people, groupings based on verses, juz, and groupings based on the place where the verses or letters of the Qur'an are revealed. In-text mining, grouping a text object can be done in various ways. One of them is based on the level of similarity. This text grouping method, of course, can be implemented in the Qur'an to find out specific patterns. The grouping of Indonesian verses in the Qur'an can be based on the level of similarity between verses using the Cosine Similarity algorithm. This algorithm will calculate the level of similarity between verses. This process will produce several groups of verses that will be taken to compare with the index of the Qur'an. The results showed that the similarity between verses was 20%, giving the best results with an average of 46.42%. The highest level of similarity where each group can still be included in the Al-Qur'an index is 40% with an average of 15, 39%. For the level of similarity between verses above 40%, there is a similarity group of verses that are not included in the Qur'anic index.