{"title":"Membandingkan Seleksi variabel Pada Data Microarray Menggunakan Important Variable Value dan Genetic Algorithm (Studi Kasus Lung Cancer Dataset dan Prostate Cancer Dataset)","authors":"Dian Nurlaily, Farida Nur Hayati, Elly Pusporani","doi":"10.36456/jstat.vol14.no1.a3853","DOIUrl":null,"url":null,"abstract":"Teknologi DNA microarray menarik minat yang luar biasa baik di kalangan komunitas ilmiah maupun kalangan industri. Meskipun data microarray telah diterapkan dalam berbagai bidang, penanganan volume data besar yang dihasilkan bukanlah perkara yang mudah. Ukuran sampel kecil dengan dimensi tinggi adalah tantangan utama analisis menggunakan data microarray. Oleh karena itu perlu dilakukan analisis lebih lanjut untuk mengatasi hal ini. Banyak penelitian yang telah dirancang berkaitan dengan data microarray misalnya untuk menyelidiki mekanisme genetik kanker, dan untuk mengklasifikasikan berbagai jenis kanker atau membedakan antara jaringan kanker dan non-kanker. Semua penelitian ini bertujuan untuk menghasilkan kesimpulan dan interpretasi yang bermanfaat dari kumpulan data yang kompleks. Dalam penelitian ini, data yang digunakan adalah data kanker paru-paru sebanyak 24257 Variabel dan data kanker prostat sebanyak 12626 Variabel. Data tersebut kemudian akan dianalisis dengan beberapa metode feature selection yaitu important variable value dan genetic algorithm untuk memilih dimensi atau variabel data sehingga dapat meningkatkan akurasi klasifikasi data. Berdasarkan hasil analisis feature selection menggunakan data kanker paru-paru, didapatkan jumlah variabel terpilih sebanyak 112 variabel dengan metode feature selection important. Sedangkan metode genetic algorithm didapatkan jumlah variabel terpilihnya sebanyak 12266 variabel. Pada data kanker prostat, didapatkan jumlah variabel terpilih sebanyak 299 variabel dengan metode feature selection important. Sedangkan metode genetic algorithm didapatkan jumlah variabel terpilihnya sebanyak 6359 variabel. \n ","PeriodicalId":118320,"journal":{"name":"J Statistika: Jurnal Ilmiah Teori dan Aplikasi Statistika","volume":"53 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2021-07-31","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"J Statistika: Jurnal Ilmiah Teori dan Aplikasi Statistika","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.36456/jstat.vol14.no1.a3853","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
Membandingkan Seleksi variabel Pada Data Microarray Menggunakan Important Variable Value dan Genetic Algorithm (Studi Kasus Lung Cancer Dataset dan Prostate Cancer Dataset)
Teknologi DNA microarray menarik minat yang luar biasa baik di kalangan komunitas ilmiah maupun kalangan industri. Meskipun data microarray telah diterapkan dalam berbagai bidang, penanganan volume data besar yang dihasilkan bukanlah perkara yang mudah. Ukuran sampel kecil dengan dimensi tinggi adalah tantangan utama analisis menggunakan data microarray. Oleh karena itu perlu dilakukan analisis lebih lanjut untuk mengatasi hal ini. Banyak penelitian yang telah dirancang berkaitan dengan data microarray misalnya untuk menyelidiki mekanisme genetik kanker, dan untuk mengklasifikasikan berbagai jenis kanker atau membedakan antara jaringan kanker dan non-kanker. Semua penelitian ini bertujuan untuk menghasilkan kesimpulan dan interpretasi yang bermanfaat dari kumpulan data yang kompleks. Dalam penelitian ini, data yang digunakan adalah data kanker paru-paru sebanyak 24257 Variabel dan data kanker prostat sebanyak 12626 Variabel. Data tersebut kemudian akan dianalisis dengan beberapa metode feature selection yaitu important variable value dan genetic algorithm untuk memilih dimensi atau variabel data sehingga dapat meningkatkan akurasi klasifikasi data. Berdasarkan hasil analisis feature selection menggunakan data kanker paru-paru, didapatkan jumlah variabel terpilih sebanyak 112 variabel dengan metode feature selection important. Sedangkan metode genetic algorithm didapatkan jumlah variabel terpilihnya sebanyak 12266 variabel. Pada data kanker prostat, didapatkan jumlah variabel terpilih sebanyak 299 variabel dengan metode feature selection important. Sedangkan metode genetic algorithm didapatkan jumlah variabel terpilihnya sebanyak 6359 variabel.