水质量分类中的梯级boost和Catboost算法分析

Taufik Zulhaq Jasman, Muhammad Alief Fadhlullah, Arnold Listanto Pratama, Rismayani Rismayani
{"title":"水质量分类中的梯级boost和Catboost算法分析","authors":"Taufik Zulhaq Jasman, Muhammad Alief Fadhlullah, Arnold Listanto Pratama, Rismayani Rismayani","doi":"10.28932/jutisi.v8i2.4906","DOIUrl":null,"url":null,"abstract":"Penelitian ini bertujuan untuk mencari akurasi tertinggi dari ketiga algoritma klasifikasi tersebut. Algoritma dengan akurasi tertinggi akan digunakan sebagai acuan dalam klasifikasi kualitas air ini. Serta menguji kinerja ketiga model ini. Metode yang digunakan dalam analisis ini untuk mengatasi data yang hilang adalah metode Median. Kemudian untuk menangani data yang tidak seimbang digunakan metode SMOTE. Dalam penelitian ini, peneliti membandingkan akurasi dari kinerja Gradient Boosting, Adaboost, dan Catboost. Hasilnya ditemukan bahwa algoritma Catboost memiliki akurasi dan kinerja tertinggi sebesar 68%, diikuti oleh Gradient Boosting sebesar 60% dan Adaboost sebesar 58%. Kemudian performansi nilai AUC Catboost sebesar 0,678, Gradient Boosting sebesar 0,595, dan Adaboost sebesar 0,584. Namun hasil akurasi dan performanya masih kurang.","PeriodicalId":185279,"journal":{"name":"Jurnal Teknik Informatika dan Sistem Informasi","volume":"13 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2022-08-26","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":"{\"title\":\"Analisis Algoritma Gradient Boosting, Adaboost dan Catboost dalam Klasifikasi Kualitas Air\",\"authors\":\"Taufik Zulhaq Jasman, Muhammad Alief Fadhlullah, Arnold Listanto Pratama, Rismayani Rismayani\",\"doi\":\"10.28932/jutisi.v8i2.4906\",\"DOIUrl\":null,\"url\":null,\"abstract\":\"Penelitian ini bertujuan untuk mencari akurasi tertinggi dari ketiga algoritma klasifikasi tersebut. Algoritma dengan akurasi tertinggi akan digunakan sebagai acuan dalam klasifikasi kualitas air ini. Serta menguji kinerja ketiga model ini. Metode yang digunakan dalam analisis ini untuk mengatasi data yang hilang adalah metode Median. Kemudian untuk menangani data yang tidak seimbang digunakan metode SMOTE. Dalam penelitian ini, peneliti membandingkan akurasi dari kinerja Gradient Boosting, Adaboost, dan Catboost. Hasilnya ditemukan bahwa algoritma Catboost memiliki akurasi dan kinerja tertinggi sebesar 68%, diikuti oleh Gradient Boosting sebesar 60% dan Adaboost sebesar 58%. Kemudian performansi nilai AUC Catboost sebesar 0,678, Gradient Boosting sebesar 0,595, dan Adaboost sebesar 0,584. Namun hasil akurasi dan performanya masih kurang.\",\"PeriodicalId\":185279,\"journal\":{\"name\":\"Jurnal Teknik Informatika dan Sistem Informasi\",\"volume\":\"13 1\",\"pages\":\"0\"},\"PeriodicalIF\":0.0000,\"publicationDate\":\"2022-08-26\",\"publicationTypes\":\"Journal Article\",\"fieldsOfStudy\":null,\"isOpenAccess\":false,\"openAccessPdf\":\"\",\"citationCount\":\"0\",\"resultStr\":null,\"platform\":\"Semanticscholar\",\"paperid\":null,\"PeriodicalName\":\"Jurnal Teknik Informatika dan Sistem Informasi\",\"FirstCategoryId\":\"1085\",\"ListUrlMain\":\"https://doi.org/10.28932/jutisi.v8i2.4906\",\"RegionNum\":0,\"RegionCategory\":null,\"ArticlePicture\":[],\"TitleCN\":null,\"AbstractTextCN\":null,\"PMCID\":null,\"EPubDate\":\"\",\"PubModel\":\"\",\"JCR\":\"\",\"JCRName\":\"\",\"Score\":null,\"Total\":0}","platform":"Semanticscholar","paperid":null,"PeriodicalName":"Jurnal Teknik Informatika dan Sistem Informasi","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.28932/jutisi.v8i2.4906","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0

摘要

本研究的目的是寻求这三种分类算法的最高准确性。最精确的算法将用于对水质量的分类。并测试这三种模型的性能。用于处理丢失数据的分析方法是中位数的方法。然后使用SMOTE方法处理不平衡数据。在本研究中,研究人员比较了boost、Adaboost和Catboost性能的准确性。结果发现,Catboost算法的准确率和表现最高,其次是60%的纯助推器和58%的纯助推器。然后是AUC Catboost分数为0.678,等级为0.595,而Adaboost为0.584。但是准确性和性能仍然很差。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
Analisis Algoritma Gradient Boosting, Adaboost dan Catboost dalam Klasifikasi Kualitas Air
Penelitian ini bertujuan untuk mencari akurasi tertinggi dari ketiga algoritma klasifikasi tersebut. Algoritma dengan akurasi tertinggi akan digunakan sebagai acuan dalam klasifikasi kualitas air ini. Serta menguji kinerja ketiga model ini. Metode yang digunakan dalam analisis ini untuk mengatasi data yang hilang adalah metode Median. Kemudian untuk menangani data yang tidak seimbang digunakan metode SMOTE. Dalam penelitian ini, peneliti membandingkan akurasi dari kinerja Gradient Boosting, Adaboost, dan Catboost. Hasilnya ditemukan bahwa algoritma Catboost memiliki akurasi dan kinerja tertinggi sebesar 68%, diikuti oleh Gradient Boosting sebesar 60% dan Adaboost sebesar 58%. Kemudian performansi nilai AUC Catboost sebesar 0,678, Gradient Boosting sebesar 0,595, dan Adaboost sebesar 0,584. Namun hasil akurasi dan performanya masih kurang.
求助全文
通过发布文献求助,成功后即可免费获取论文全文。 去求助
来源期刊
自引率
0.00%
发文量
0
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
确定
请完成安全验证×
copy
已复制链接
快去分享给好友吧!
我知道了
右上角分享
点击右上角分享
0
联系我们:info@booksci.cn Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。 Copyright © 2023 布克学术 All rights reserved.
京ICP备2023020795号-1
ghs 京公网安备 11010802042870号
Book学术文献互助
Book学术文献互助群
群 号:604180095
Book学术官方微信