M. Bahrul Subkhi, Chastine Fatichah, Agus Zaenal Arifin
{"title":"使用混合二元灰狼优化器为阿拉伯文本圣训分类选择特征","authors":"M. Bahrul Subkhi, Chastine Fatichah, Agus Zaenal Arifin","doi":"10.25126/jtiik.2023106375","DOIUrl":null,"url":null,"abstract":"Seleksi fitur pada teks Arab merupakan tugas yang menantang karena sifat Bahasa Arab yang kompleks dan kaya. Dala klasifikasi hadist teks Arab membutuhkan seleksi fitur, karena hadist teks Arab berbeda dengan dokumen teks arab. Hadist teks Arab memiliki sanat dan matan yang menjadi pertimbangan dalam klasifikasi hadist teks arab. Penelitian ini mengusulkan metode seleksi fitur menggunakan Hybrid Binary Grey Wolf Optimizer untuk klasifikasi hadist teks arab. Metode HBGWO mengkombinasikan kemampuan pencarian lokal atau eksplorasi pyg dimiliki BGWO, dan kemampuan pencarian di sekitar solusi terbaik atau eksploitasi yang dimiliki PSO. Data set yang digunakan berupa teks Arab diambil dari islambook.com. yang terdiri dari lima kitab yaitu Shahih Bukhari, Shahih Muslim, Sunan Ibnu Majah, Sunan Abu Dawud dan Suann at-Tirmidzi. Pada kumpulan kitab tersebut diambil 5 kelas yaitu Tuhid, Sholat, Zakat, Puasa dan Haji berjumlah 844. Hasil penelitian menunjukkan bahwa pemilihan fitur BGWOPSO dengan mencari fungsi fitnes dan klasifikasi menggunakan SVM mendapatkan 84%, dapat mengungkapkan kinerja yang unggul dibandingkan dengan menggunakan klasifikasi KNN 76% dalam soal mengklasifikasikan teks hadits Arab dengan data yang tidak seimbang. Abstract Feature selection in Arabic text is a challenging task due to the complex and rich nature of Arabic. In the classification of Arabic text hadith requires feature selection, because Arabic text hadith is different from Arabic text documents. Arabic text hadith has sanat and matan which are considered in the classification of Arabic text hadith. This study proposes a feature selection method using the Hybrid Binary Gray Wolf Optimizer for Arabic text hadith classification. The HBGWO method combines the local search or pyg exploration capabilities of the BGWO, and the search capabilities around the best solutions or exploits that PSO has. The data set used in the form of Arabic text is taken from islambook.com. which consists of five books, namely Sahih Bukhari, Sahih Muslim, Sunan Ibn Majah, Sunan Abu Dawud and Suann at-Tirmidhi. In this collection of books, 5 classes were taken, namely Tuhid, Prayer, Zakat, Fasting and Hajj totaling 844. The results showed that the selection of BGWOPSO features by looking for fitness functions and classification using SVM obtained 84%, can reveal superior performance compared to using KNN classification 76% in terms of classifying Arabic hadith texts with unbalanced data.","PeriodicalId":32501,"journal":{"name":"Jurnal Teknologi Informasi dan Ilmu Komputer","volume":"52 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2023-10-17","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":"{\"title\":\"Seleksi Fitur Menggunakan Hybrid Binary Grey Wolf Optimizer untuk Klasifikasi Hadist Teks Arab\",\"authors\":\"M. Bahrul Subkhi, Chastine Fatichah, Agus Zaenal Arifin\",\"doi\":\"10.25126/jtiik.2023106375\",\"DOIUrl\":null,\"url\":null,\"abstract\":\"Seleksi fitur pada teks Arab merupakan tugas yang menantang karena sifat Bahasa Arab yang kompleks dan kaya. Dala klasifikasi hadist teks Arab membutuhkan seleksi fitur, karena hadist teks Arab berbeda dengan dokumen teks arab. Hadist teks Arab memiliki sanat dan matan yang menjadi pertimbangan dalam klasifikasi hadist teks arab. Penelitian ini mengusulkan metode seleksi fitur menggunakan Hybrid Binary Grey Wolf Optimizer untuk klasifikasi hadist teks arab. Metode HBGWO mengkombinasikan kemampuan pencarian lokal atau eksplorasi pyg dimiliki BGWO, dan kemampuan pencarian di sekitar solusi terbaik atau eksploitasi yang dimiliki PSO. Data set yang digunakan berupa teks Arab diambil dari islambook.com. yang terdiri dari lima kitab yaitu Shahih Bukhari, Shahih Muslim, Sunan Ibnu Majah, Sunan Abu Dawud dan Suann at-Tirmidzi. Pada kumpulan kitab tersebut diambil 5 kelas yaitu Tuhid, Sholat, Zakat, Puasa dan Haji berjumlah 844. Hasil penelitian menunjukkan bahwa pemilihan fitur BGWOPSO dengan mencari fungsi fitnes dan klasifikasi menggunakan SVM mendapatkan 84%, dapat mengungkapkan kinerja yang unggul dibandingkan dengan menggunakan klasifikasi KNN 76% dalam soal mengklasifikasikan teks hadits Arab dengan data yang tidak seimbang. Abstract Feature selection in Arabic text is a challenging task due to the complex and rich nature of Arabic. In the classification of Arabic text hadith requires feature selection, because Arabic text hadith is different from Arabic text documents. Arabic text hadith has sanat and matan which are considered in the classification of Arabic text hadith. This study proposes a feature selection method using the Hybrid Binary Gray Wolf Optimizer for Arabic text hadith classification. The HBGWO method combines the local search or pyg exploration capabilities of the BGWO, and the search capabilities around the best solutions or exploits that PSO has. The data set used in the form of Arabic text is taken from islambook.com. which consists of five books, namely Sahih Bukhari, Sahih Muslim, Sunan Ibn Majah, Sunan Abu Dawud and Suann at-Tirmidhi. In this collection of books, 5 classes were taken, namely Tuhid, Prayer, Zakat, Fasting and Hajj totaling 844. The results showed that the selection of BGWOPSO features by looking for fitness functions and classification using SVM obtained 84%, can reveal superior performance compared to using KNN classification 76% in terms of classifying Arabic hadith texts with unbalanced data.\",\"PeriodicalId\":32501,\"journal\":{\"name\":\"Jurnal Teknologi Informasi dan Ilmu Komputer\",\"volume\":\"52 1\",\"pages\":\"0\"},\"PeriodicalIF\":0.0000,\"publicationDate\":\"2023-10-17\",\"publicationTypes\":\"Journal Article\",\"fieldsOfStudy\":null,\"isOpenAccess\":false,\"openAccessPdf\":\"\",\"citationCount\":\"0\",\"resultStr\":null,\"platform\":\"Semanticscholar\",\"paperid\":null,\"PeriodicalName\":\"Jurnal Teknologi Informasi dan Ilmu Komputer\",\"FirstCategoryId\":\"1085\",\"ListUrlMain\":\"https://doi.org/10.25126/jtiik.2023106375\",\"RegionNum\":0,\"RegionCategory\":null,\"ArticlePicture\":[],\"TitleCN\":null,\"AbstractTextCN\":null,\"PMCID\":null,\"EPubDate\":\"\",\"PubModel\":\"\",\"JCR\":\"\",\"JCRName\":\"\",\"Score\":null,\"Total\":0}","platform":"Semanticscholar","paperid":null,"PeriodicalName":"Jurnal Teknologi Informasi dan Ilmu Komputer","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.25126/jtiik.2023106375","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0
摘要
阿拉伯语文本的特征选择是一项具有挑战性的任务,因为阿拉伯语的复杂和丰富。阿拉伯文本圣训的分类需要特点的选择,因为阿拉伯文本的圣训不同于阿拉伯文本的文档。阿拉伯文本的圣训在阿拉伯文本的分类中值得考虑。这项研究建议采用灰狼化杂种优化来分类阿拉伯文本。HBGWO方法结合了BGWO拥有的本地搜索能力或pwo pwo勘探能力,以及PSO的最佳解决方案或开发能力。从islamboo.com上获取的阿拉伯文本的集合数据。它由五本书组成,沙赫布哈里,沙赫穆斯林,苏南布努·马贾,苏南·阿布·杜尔德和苏安·特尔米兹。在这本书的汇编中,有五节课是Tuhid、祈祷、Zakat、斋戒和朝觐,共有844节。研究结果表明,通过使用SVM来搜索fitnes功能和分类功能可以获得84%的结果,从而在将阿拉伯hadith文本与不平衡数据进行分类的过程中使用KNN 76%的分类来揭示出比这更好的表现。《阿拉伯文字》中抽象的特征特征对复杂和丰富的阿拉伯性质来说是一个挑战的任务。在阿拉伯文本的经典文本hadith引用引用,因为hadith文本与阿拉伯文本文档不同。圣训阿拉伯语的文本与传统被认为是文本圣训的古典化。这项研究建议采用混合灰狼灰狼光学优化法。HBGWO方法导致当地搜索或pyg探索BGWO的能力,以及PSO在最佳解决方案或漏洞附近的搜索能力。《阿拉伯文字》中使用的数据来自islam比克网。五卷书的组成部分,namely Sahih Bukhari, Sahih Muslim, s祝福Ibn Majah, sdhan Abu Dawud和Suann at得米德希。在这本书的合集中,五节课被接进了纳梅尔·图希德、祈祷、扎克、法西斯和哈杰·斯塔灵844。最近的结果显示,使用SVM排版(SVM)进行了fitneso和古典化的选择,共84%,可以揭示在classifying Arabic texts中使用KNN classification 76%的经典表现。
Seleksi Fitur Menggunakan Hybrid Binary Grey Wolf Optimizer untuk Klasifikasi Hadist Teks Arab
Seleksi fitur pada teks Arab merupakan tugas yang menantang karena sifat Bahasa Arab yang kompleks dan kaya. Dala klasifikasi hadist teks Arab membutuhkan seleksi fitur, karena hadist teks Arab berbeda dengan dokumen teks arab. Hadist teks Arab memiliki sanat dan matan yang menjadi pertimbangan dalam klasifikasi hadist teks arab. Penelitian ini mengusulkan metode seleksi fitur menggunakan Hybrid Binary Grey Wolf Optimizer untuk klasifikasi hadist teks arab. Metode HBGWO mengkombinasikan kemampuan pencarian lokal atau eksplorasi pyg dimiliki BGWO, dan kemampuan pencarian di sekitar solusi terbaik atau eksploitasi yang dimiliki PSO. Data set yang digunakan berupa teks Arab diambil dari islambook.com. yang terdiri dari lima kitab yaitu Shahih Bukhari, Shahih Muslim, Sunan Ibnu Majah, Sunan Abu Dawud dan Suann at-Tirmidzi. Pada kumpulan kitab tersebut diambil 5 kelas yaitu Tuhid, Sholat, Zakat, Puasa dan Haji berjumlah 844. Hasil penelitian menunjukkan bahwa pemilihan fitur BGWOPSO dengan mencari fungsi fitnes dan klasifikasi menggunakan SVM mendapatkan 84%, dapat mengungkapkan kinerja yang unggul dibandingkan dengan menggunakan klasifikasi KNN 76% dalam soal mengklasifikasikan teks hadits Arab dengan data yang tidak seimbang. Abstract Feature selection in Arabic text is a challenging task due to the complex and rich nature of Arabic. In the classification of Arabic text hadith requires feature selection, because Arabic text hadith is different from Arabic text documents. Arabic text hadith has sanat and matan which are considered in the classification of Arabic text hadith. This study proposes a feature selection method using the Hybrid Binary Gray Wolf Optimizer for Arabic text hadith classification. The HBGWO method combines the local search or pyg exploration capabilities of the BGWO, and the search capabilities around the best solutions or exploits that PSO has. The data set used in the form of Arabic text is taken from islambook.com. which consists of five books, namely Sahih Bukhari, Sahih Muslim, Sunan Ibn Majah, Sunan Abu Dawud and Suann at-Tirmidhi. In this collection of books, 5 classes were taken, namely Tuhid, Prayer, Zakat, Fasting and Hajj totaling 844. The results showed that the selection of BGWOPSO features by looking for fitness functions and classification using SVM obtained 84%, can reveal superior performance compared to using KNN classification 76% in terms of classifying Arabic hadith texts with unbalanced data.