Penerapan XGBoost untuk Seleksi Atribut pada K-Means dalam Clustering Penerima KIP Kuliah

Amiruddin Bengnga, Rezqiwati Ishak
{"title":"Penerapan XGBoost untuk Seleksi Atribut pada K-Means dalam Clustering Penerima KIP Kuliah","authors":"Amiruddin Bengnga, Rezqiwati Ishak","doi":"10.37905/jjeee.v5i2.20253","DOIUrl":null,"url":null,"abstract":"Pada proses clustering prioritas penerima bantuan Kartu Indonesia Pintar Kuliah dengan algoritma K-Means ada beberapa masalah yang muncul yaitu masalah seleksi atribut yang penting dan penentuan nilai K yang optimum sehingga membuat proses clustering tidak maksimal dan tidak ideal. Masalah pemilihan atribut yang penting akan diselesaikan dengan menggunakan algoritma XGBoost yang terbukti dapat digunakan untuk memecahkan masalah seperti pada proses clustering prioritas penerima bantuan KIP Kuliah. Hasil penelitian menunjukkan bahwa algoritma XGBoost dapat menentukan 3 (tiga) atribut yang paling penting yaitu Pekerjaan Ayah, Penghasilan Ibu dan Luas Bangunan dari 12 (dua belas) atribut yang ada yaitu Pekerjaan Ayah, Pekerjaan Ibu, Penghasilan Ayah, Penghasilan Ibu, Jumlah Tanggungan, Kepemilikan Rumah, Sumber Listrik, Luas Tanah, Luas Bangunan, Sumber Air, MCK, Prestasi dan metode Elbow terbukti dapat menentukan nilai K yang optimum yaitu nilai K=4. Berdasarkan penggunaan 3 (tiga) atribut terbaik dan nilai K=4 sebagai nilai K optimum berhasil didapatkan clustering yang paling maksimal dan ideal dengan nilai index terkecil yaitu 0.819 dengan menggunakan metode pengujian Davies-Bouldin Index.In the process of clustering the priority of the recipient Indonesian smart school cards with the K-Means algorithm, there are several problems that arise, namely the problem of selecting important attributes and determining the optimal value of K, so that the process is not maximum and is not ideal. Important attribute selection problems will be solved using proven XGBoost algorithm that can be used to solve problems such as in the process of clustering the priority of recipients of school KIP assistance. The results of the research showed that the XGBoost algorithm can determine the 3 (three) most important attributes, namely Father’s Work, Mother’s Production and Building Size from the 12 (twelve) attributs that exist: Father's Job, Mothers’ Work, Fathers’ Income, Mothers’ Revenue, Number of Dependants, Home Ownership, Electrical Resources, Land Area, Building Area, Water Resource, MCK, Performance and Elbow Method proved to determine the optimal K value of K=4. Based on the use of the 3 (three) best attributes and the value of K = 4 as the optimal K value, the maximum and ideal clustering with the smallest index value is 0.819 using the Davies-Bouldin Index test method.","PeriodicalId":292481,"journal":{"name":"Jambura Journal of Electrical and Electronics Engineering","volume":"31 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2023-07-11","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Jambura Journal of Electrical and Electronics Engineering","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.37905/jjeee.v5i2.20253","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0

Abstract

Pada proses clustering prioritas penerima bantuan Kartu Indonesia Pintar Kuliah dengan algoritma K-Means ada beberapa masalah yang muncul yaitu masalah seleksi atribut yang penting dan penentuan nilai K yang optimum sehingga membuat proses clustering tidak maksimal dan tidak ideal. Masalah pemilihan atribut yang penting akan diselesaikan dengan menggunakan algoritma XGBoost yang terbukti dapat digunakan untuk memecahkan masalah seperti pada proses clustering prioritas penerima bantuan KIP Kuliah. Hasil penelitian menunjukkan bahwa algoritma XGBoost dapat menentukan 3 (tiga) atribut yang paling penting yaitu Pekerjaan Ayah, Penghasilan Ibu dan Luas Bangunan dari 12 (dua belas) atribut yang ada yaitu Pekerjaan Ayah, Pekerjaan Ibu, Penghasilan Ayah, Penghasilan Ibu, Jumlah Tanggungan, Kepemilikan Rumah, Sumber Listrik, Luas Tanah, Luas Bangunan, Sumber Air, MCK, Prestasi dan metode Elbow terbukti dapat menentukan nilai K yang optimum yaitu nilai K=4. Berdasarkan penggunaan 3 (tiga) atribut terbaik dan nilai K=4 sebagai nilai K optimum berhasil didapatkan clustering yang paling maksimal dan ideal dengan nilai index terkecil yaitu 0.819 dengan menggunakan metode pengujian Davies-Bouldin Index.In the process of clustering the priority of the recipient Indonesian smart school cards with the K-Means algorithm, there are several problems that arise, namely the problem of selecting important attributes and determining the optimal value of K, so that the process is not maximum and is not ideal. Important attribute selection problems will be solved using proven XGBoost algorithm that can be used to solve problems such as in the process of clustering the priority of recipients of school KIP assistance. The results of the research showed that the XGBoost algorithm can determine the 3 (three) most important attributes, namely Father’s Work, Mother’s Production and Building Size from the 12 (twelve) attributs that exist: Father's Job, Mothers’ Work, Fathers’ Income, Mothers’ Revenue, Number of Dependants, Home Ownership, Electrical Resources, Land Area, Building Area, Water Resource, MCK, Performance and Elbow Method proved to determine the optimal K value of K=4. Based on the use of the 3 (three) best attributes and the value of K = 4 as the optimal K value, the maximum and ideal clustering with the smallest index value is 0.819 using the Davies-Bouldin Index test method.
关于带有K- means算法的智能印尼大学生帮助卡的优先权捕获过程,出现了几个问题,即重要属性选择问题和最佳值K值值问题,使集群过程不是最大的,也不是最理想的。关键属性选择问题将通过使用XGBoost算法来解决,该算法被证明可以用来解决诸如此类的问题,比如收集优先级受益人。研究结果表明,算法XGBoost可以定义属性3(三)最重要的就是爸爸妈妈的工作,收入和建筑面积的12(十二)的属性有工作的父亲,母亲,父亲的收入,收入、数量、土地所有权、电源、大面积的房子,建筑面积水源,洗衣和肘部的方法被证明可以决定成就价值最佳的K就是K = 4。使用3(3)最佳属性和值K=4作为最佳K值,成功地得到最充分的,最小值值为0.819,通过采用david - bouldin方法测试索引。在这个过程中,印尼聪明的学校卡片的首要含义是K-这意味着算法,有几个问题,却忽略了选择重要的品质和确定最佳价值的K的问题,所以进程不是最大的,也不是最理想的。重要的吸引力吸引力将通过可能用来解决这个问题的XGBoost算法来解决这个问题。results》研究那里那个《XGBoost算法可以个重大3(三)最重要的attributes, namely父亲的工作,母亲的制作和建设大小从12(十二)attributs那存在:父亲的工作,母亲工作,父亲‘收入,母亲’Revenue Dependants之号,Home Ownership,电资源、土地面积,建设区域,水研究资源,洗衣,演出和肘部方法proved to K = 4个重大之最佳K价值。3(3)最佳的attributes和值= 4,最佳的和理想的与smallest索引的结合是0.819,使用david - bouldin指数方法。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
求助全文
约1分钟内获得全文 求助全文
来源期刊
自引率
0.00%
发文量
0
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
确定
请完成安全验证×
copy
已复制链接
快去分享给好友吧!
我知道了
右上角分享
点击右上角分享
0
联系我们:info@booksci.cn Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。 Copyright © 2023 布克学术 All rights reserved.
京ICP备2023020795号-1
ghs 京公网安备 11010802042870号
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术官方微信