混合灰狼优化和粒子群优化特征选择在乳腺癌分类中的距离偏置奈维贝叶斯应用

Ratna Septia Devi, Triando Hamonangan Saragih, M. Faisal, Dwi Kartini, I. Budiman, Ilmu Komputer
{"title":"混合灰狼优化和粒子群优化特征选择在乳腺癌分类中的距离偏置奈维贝叶斯应用","authors":"Ratna Septia Devi, Triando Hamonangan Saragih, M. Faisal, Dwi Kartini, I. Budiman, Ilmu Komputer","doi":"10.33795/jip.v10i2.4737","DOIUrl":null,"url":null,"abstract":"Kanker payudara adalah penyebab utama kematian akibat kanker tertinggi kedua di dunia. Pasien Kanker payudara terus mengalami peningkatan dan menjadi masalah kesehatan yang cukup serius di seluruh dunia, termasuk juga di Indonesia. Diagnosis dini adalah salah satu pendekatan terbaik untuk mencegah penyakit ini semakin meningkat dan berkembang. Machine learning dapat melakukan penambangan data menggunakan serangkaian fitur pada sebuah data. Penelitian ini menggunakan dataset public dari UCI machine learning repository yaitu Breast Cancer Wisconsin (Diagnostic). Pada dataset ini memiliki atribut sebanyak 32 fitur, namun banyaknya fitur pada sebuah data juga akan memperlambat waktu komputasi dari metode klasifikasi yang digunakan. Pada penelian ini, akan dilakukan seleksi fitur menggunakan metode Hybrid Grey Wolf Optimization dan Particle Swarm Optimization (HGWOPSO) untuk memilih fitur yang paling informatif dan signifikan untuk digunakan pada klasifikasi. Metode klasifikasi yang digunakan adalah Distance Biased Naive Bayes (DBNB) yang terdiri dari dua modul yaitu Weighted Naïve Bayes Module (WNBM) dan Distance Reinforcement Module (DRM). Dari penelitian ini, didapatkan performa akurasi tertinggi pada model DBNB tanpa seleksi fitur sebesar 94,90%, DBNB dengan GWO sebesar 95,08%, DBNB dengan PSO sebesar 95,25%, dan DBNB dengan HGWOPSO sebesar 96,13%. Dapat disimpulkan bahwa model DBNB dengan seleksi fitur HGWOPSO mengalami peningkatan dibandingkan dengan DBNB tanpa seleksi fitur maupun dengan seleksi fitur individualnya.","PeriodicalId":232501,"journal":{"name":"Jurnal Informatika Polinema","volume":"16 12","pages":""},"PeriodicalIF":0.0000,"publicationDate":"2024-02-29","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":"{\"title\":\"Seleksi Fitur Hybrid Grey Wolf Optimization dan Particle Swarm Optimization pada Distance Biased Naive Bayes untuk Klasifikasi Kanker Payudara\",\"authors\":\"Ratna Septia Devi, Triando Hamonangan Saragih, M. Faisal, Dwi Kartini, I. Budiman, Ilmu Komputer\",\"doi\":\"10.33795/jip.v10i2.4737\",\"DOIUrl\":null,\"url\":null,\"abstract\":\"Kanker payudara adalah penyebab utama kematian akibat kanker tertinggi kedua di dunia. Pasien Kanker payudara terus mengalami peningkatan dan menjadi masalah kesehatan yang cukup serius di seluruh dunia, termasuk juga di Indonesia. Diagnosis dini adalah salah satu pendekatan terbaik untuk mencegah penyakit ini semakin meningkat dan berkembang. Machine learning dapat melakukan penambangan data menggunakan serangkaian fitur pada sebuah data. Penelitian ini menggunakan dataset public dari UCI machine learning repository yaitu Breast Cancer Wisconsin (Diagnostic). Pada dataset ini memiliki atribut sebanyak 32 fitur, namun banyaknya fitur pada sebuah data juga akan memperlambat waktu komputasi dari metode klasifikasi yang digunakan. Pada penelian ini, akan dilakukan seleksi fitur menggunakan metode Hybrid Grey Wolf Optimization dan Particle Swarm Optimization (HGWOPSO) untuk memilih fitur yang paling informatif dan signifikan untuk digunakan pada klasifikasi. Metode klasifikasi yang digunakan adalah Distance Biased Naive Bayes (DBNB) yang terdiri dari dua modul yaitu Weighted Naïve Bayes Module (WNBM) dan Distance Reinforcement Module (DRM). Dari penelitian ini, didapatkan performa akurasi tertinggi pada model DBNB tanpa seleksi fitur sebesar 94,90%, DBNB dengan GWO sebesar 95,08%, DBNB dengan PSO sebesar 95,25%, dan DBNB dengan HGWOPSO sebesar 96,13%. Dapat disimpulkan bahwa model DBNB dengan seleksi fitur HGWOPSO mengalami peningkatan dibandingkan dengan DBNB tanpa seleksi fitur maupun dengan seleksi fitur individualnya.\",\"PeriodicalId\":232501,\"journal\":{\"name\":\"Jurnal Informatika Polinema\",\"volume\":\"16 12\",\"pages\":\"\"},\"PeriodicalIF\":0.0000,\"publicationDate\":\"2024-02-29\",\"publicationTypes\":\"Journal Article\",\"fieldsOfStudy\":null,\"isOpenAccess\":false,\"openAccessPdf\":\"\",\"citationCount\":\"0\",\"resultStr\":null,\"platform\":\"Semanticscholar\",\"paperid\":null,\"PeriodicalName\":\"Jurnal Informatika Polinema\",\"FirstCategoryId\":\"1085\",\"ListUrlMain\":\"https://doi.org/10.33795/jip.v10i2.4737\",\"RegionNum\":0,\"RegionCategory\":null,\"ArticlePicture\":[],\"TitleCN\":null,\"AbstractTextCN\":null,\"PMCID\":null,\"EPubDate\":\"\",\"PubModel\":\"\",\"JCR\":\"\",\"JCRName\":\"\",\"Score\":null,\"Total\":0}","platform":"Semanticscholar","paperid":null,"PeriodicalName":"Jurnal Informatika Polinema","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.33795/jip.v10i2.4737","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0

摘要

乳腺癌是世界第二大癌症死因。乳腺癌患者持续增加,已成为包括印度尼西亚在内的全球严重健康问题。早期诊断是防止病情加重和恶化的最佳方法之一。机器学习可以利用一组数据特征进行数据挖掘。本研究使用了 UCI 机器学习资料库中的一个公共数据集,即威斯康星州乳腺癌(诊断)。该数据集有 32 个属性,但数据中的特征数量也会减慢分类方法的计算时间。在本研究中,将使用灰狼优化和粒子群优化混合(HGWOPSO)方法进行特征选择,以选出信息量最大、最重要的特征用于分类。使用的分类方法是距离偏置奈维贝叶斯(DBNB),它由两个模块组成,即加权奈维贝叶斯模块(WNBM)和距离强化模块(DRM)。研究结果表明,不带特征选择的 DBNB 模型准确率最高,为 94.90%;带 GWO 的 DBNB 准确率为 95.08%;带 PSO 的 DBNB 准确率为 95.25%;带 HGWOPSO 的 DBNB 准确率为 96.13%。由此可以得出结论,采用 HGWOPSO 特征选择的 DBNB 模型与不采用特征选择或单独采用特征选择的 DBNB 相比有了改进。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
Seleksi Fitur Hybrid Grey Wolf Optimization dan Particle Swarm Optimization pada Distance Biased Naive Bayes untuk Klasifikasi Kanker Payudara
Kanker payudara adalah penyebab utama kematian akibat kanker tertinggi kedua di dunia. Pasien Kanker payudara terus mengalami peningkatan dan menjadi masalah kesehatan yang cukup serius di seluruh dunia, termasuk juga di Indonesia. Diagnosis dini adalah salah satu pendekatan terbaik untuk mencegah penyakit ini semakin meningkat dan berkembang. Machine learning dapat melakukan penambangan data menggunakan serangkaian fitur pada sebuah data. Penelitian ini menggunakan dataset public dari UCI machine learning repository yaitu Breast Cancer Wisconsin (Diagnostic). Pada dataset ini memiliki atribut sebanyak 32 fitur, namun banyaknya fitur pada sebuah data juga akan memperlambat waktu komputasi dari metode klasifikasi yang digunakan. Pada penelian ini, akan dilakukan seleksi fitur menggunakan metode Hybrid Grey Wolf Optimization dan Particle Swarm Optimization (HGWOPSO) untuk memilih fitur yang paling informatif dan signifikan untuk digunakan pada klasifikasi. Metode klasifikasi yang digunakan adalah Distance Biased Naive Bayes (DBNB) yang terdiri dari dua modul yaitu Weighted Naïve Bayes Module (WNBM) dan Distance Reinforcement Module (DRM). Dari penelitian ini, didapatkan performa akurasi tertinggi pada model DBNB tanpa seleksi fitur sebesar 94,90%, DBNB dengan GWO sebesar 95,08%, DBNB dengan PSO sebesar 95,25%, dan DBNB dengan HGWOPSO sebesar 96,13%. Dapat disimpulkan bahwa model DBNB dengan seleksi fitur HGWOPSO mengalami peningkatan dibandingkan dengan DBNB tanpa seleksi fitur maupun dengan seleksi fitur individualnya.
求助全文
通过发布文献求助,成功后即可免费获取论文全文。 去求助
来源期刊
自引率
0.00%
发文量
0
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
确定
请完成安全验证×
copy
已复制链接
快去分享给好友吧!
我知道了
右上角分享
点击右上角分享
0
联系我们:info@booksci.cn Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。 Copyright © 2023 布克学术 All rights reserved.
京ICP备2023020795号-1
ghs 京公网安备 11010802042870号
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术官方微信