{"title":"Analisa Perbandingan 7 Algoritma Klasifikasi Menggunakan Dataset Sensus Penduduk","authors":"T. Wijanarko","doi":"10.54066/jci.v2i2.238","DOIUrl":null,"url":null,"abstract":"Dalam penelitian ini penulis mencoba melakukan komparasi dari tujuh algoritma klasifikasi dengan mengambil dataset kependudukan dari data yang sudah dipublikasikan. Tujuan dari penelitian ini adalah mengetahui perbandingan performa teknik klasifikasi menggunakan software Rapidminer. Dalam pengujian menggunakan dataset adult yang memiliki 35.500 instance meliputi 15 attribut (6 continous 6 nominal). Dataset adult berisi data mengenai orang dewasa seperti umur, jenis kelamin, etnis, status, edukasi, dan lain-lain. Data-data pada dataset adult diklasifikasikan berdasar gaji yang melebihi Rp. 50.000 dan gaji yang sama dengan atau kurang dari Rp. 50.000. Peneliti mencoba melakukan komparasi dari tujuh algoritma klasifikasi untuk mendapatkan akurasi dari masing-masing algoritma tersebut. Algoritma yang digunakan adalah Decision Tree (C4.5), Decision Stump, Random Tree, Random Forest, Naive Bayes, k-Nearest Neighbor, dan Rule Based. Untuk metode validasi penulis menggunakan k-Fold Cross Validation sedang untuk mengetahui akurasi algoritma antara satu dengan yang lain penulis menggunakan uji beda parametik dengan menggunakan t-test.","PeriodicalId":114910,"journal":{"name":"Jurnal Cakrawala Informasi","volume":"111 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2022-12-30","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Jurnal Cakrawala Informasi","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.54066/jci.v2i2.238","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0
Abstract
Dalam penelitian ini penulis mencoba melakukan komparasi dari tujuh algoritma klasifikasi dengan mengambil dataset kependudukan dari data yang sudah dipublikasikan. Tujuan dari penelitian ini adalah mengetahui perbandingan performa teknik klasifikasi menggunakan software Rapidminer. Dalam pengujian menggunakan dataset adult yang memiliki 35.500 instance meliputi 15 attribut (6 continous 6 nominal). Dataset adult berisi data mengenai orang dewasa seperti umur, jenis kelamin, etnis, status, edukasi, dan lain-lain. Data-data pada dataset adult diklasifikasikan berdasar gaji yang melebihi Rp. 50.000 dan gaji yang sama dengan atau kurang dari Rp. 50.000. Peneliti mencoba melakukan komparasi dari tujuh algoritma klasifikasi untuk mendapatkan akurasi dari masing-masing algoritma tersebut. Algoritma yang digunakan adalah Decision Tree (C4.5), Decision Stump, Random Tree, Random Forest, Naive Bayes, k-Nearest Neighbor, dan Rule Based. Untuk metode validasi penulis menggunakan k-Fold Cross Validation sedang untuk mengetahui akurasi algoritma antara satu dengan yang lain penulis menggunakan uji beda parametik dengan menggunakan t-test.