Kalvintirta Ciptady, M. Harahap, Jonvin Jonvin, Yonata Ndruru, Ibadurrahman Ibadurrahman
{"title":"在随机森林算法中通过数据科学方法对咖啡质量的预测","authors":"Kalvintirta Ciptady, M. Harahap, Jonvin Jonvin, Yonata Ndruru, Ibadurrahman Ibadurrahman","doi":"10.47709/dsi.v2i1.1708","DOIUrl":null,"url":null,"abstract":"Perusahaan yang bergerak dibidang produksi kopi, selalu mementingkan kualitas kopi untuk menghasilkan produk yang dapat bersaing dengan kompetitor lainnya \n. Adapun sistem yang dapat dibangun untuk mengatasi permasalahan tersebut yaitu berupa prediksi dalam menentukan kualitas kopi. Data kopi yang digunakan pada penelitian ini didapatkan dari Coffee Quality Institute. Data ini memiliki 44 kolom atau variabel dengan jumlah data sebanyak 1339 data. Tahapan yang dilakukan dengan pendekatan data science dengan algoritma random forest terdiri dari proses pengumpulan data, preprocessing, pengumpulan data, split data, pemrosesan dengan algoritma Random Forest yang menghasilkan hasil prediksi, hingga yang terakhir adalah proses evaluasi performa algoritma Random Forest dalam memprediksi kualitas kopi. \nVariabel dependen yang diprediksi pada penelitian ini secara berurutan dari kualitas terbaik hingga terburuk antara lain adalah kualitas kopi Specialty Grade, Premium, Exchange, dan Below Standard. Kualitas kopi premium adalah hasil prediksi paling baik dengan hasil actual 135. Jumlah data yang cukup untuk memastikan algoritma random forest dapat memprediksi dengan cukup baik dengan akurasi yang mencapai 79% masih memiliki ruang untuk perkembangan sehingga bisa mendekati 100%. Kurang optimalnya nilai akurasi pada penelitian ini dapat diakibatkan oleh kurangnya variabel independen yang digunakan. Penelitian ini hanya menggunakan 8 variabel dari 43 variabel yang tersedia. Sehingga masih terdapat variabel yang berpotensi dapat meningkatkan akurasi. Tidak dilakukannya penyetelan parameter Random Forest yang tersedia untuk meningkatkan akurasi.","PeriodicalId":155875,"journal":{"name":"Data Sciences Indonesia (DSI)","volume":"28 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2022-09-08","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"1","resultStr":"{\"title\":\"Prediksi Kualitas Kopi Dengan Algoritma Random Forest Melalui Pendekatan Data Science\",\"authors\":\"Kalvintirta Ciptady, M. Harahap, Jonvin Jonvin, Yonata Ndruru, Ibadurrahman Ibadurrahman\",\"doi\":\"10.47709/dsi.v2i1.1708\",\"DOIUrl\":null,\"url\":null,\"abstract\":\"Perusahaan yang bergerak dibidang produksi kopi, selalu mementingkan kualitas kopi untuk menghasilkan produk yang dapat bersaing dengan kompetitor lainnya \\n. Adapun sistem yang dapat dibangun untuk mengatasi permasalahan tersebut yaitu berupa prediksi dalam menentukan kualitas kopi. Data kopi yang digunakan pada penelitian ini didapatkan dari Coffee Quality Institute. Data ini memiliki 44 kolom atau variabel dengan jumlah data sebanyak 1339 data. Tahapan yang dilakukan dengan pendekatan data science dengan algoritma random forest terdiri dari proses pengumpulan data, preprocessing, pengumpulan data, split data, pemrosesan dengan algoritma Random Forest yang menghasilkan hasil prediksi, hingga yang terakhir adalah proses evaluasi performa algoritma Random Forest dalam memprediksi kualitas kopi. \\nVariabel dependen yang diprediksi pada penelitian ini secara berurutan dari kualitas terbaik hingga terburuk antara lain adalah kualitas kopi Specialty Grade, Premium, Exchange, dan Below Standard. Kualitas kopi premium adalah hasil prediksi paling baik dengan hasil actual 135. Jumlah data yang cukup untuk memastikan algoritma random forest dapat memprediksi dengan cukup baik dengan akurasi yang mencapai 79% masih memiliki ruang untuk perkembangan sehingga bisa mendekati 100%. Kurang optimalnya nilai akurasi pada penelitian ini dapat diakibatkan oleh kurangnya variabel independen yang digunakan. Penelitian ini hanya menggunakan 8 variabel dari 43 variabel yang tersedia. Sehingga masih terdapat variabel yang berpotensi dapat meningkatkan akurasi. Tidak dilakukannya penyetelan parameter Random Forest yang tersedia untuk meningkatkan akurasi.\",\"PeriodicalId\":155875,\"journal\":{\"name\":\"Data Sciences Indonesia (DSI)\",\"volume\":\"28 1\",\"pages\":\"0\"},\"PeriodicalIF\":0.0000,\"publicationDate\":\"2022-09-08\",\"publicationTypes\":\"Journal Article\",\"fieldsOfStudy\":null,\"isOpenAccess\":false,\"openAccessPdf\":\"\",\"citationCount\":\"1\",\"resultStr\":null,\"platform\":\"Semanticscholar\",\"paperid\":null,\"PeriodicalName\":\"Data Sciences Indonesia (DSI)\",\"FirstCategoryId\":\"1085\",\"ListUrlMain\":\"https://doi.org/10.47709/dsi.v2i1.1708\",\"RegionNum\":0,\"RegionCategory\":null,\"ArticlePicture\":[],\"TitleCN\":null,\"AbstractTextCN\":null,\"PMCID\":null,\"EPubDate\":\"\",\"PubModel\":\"\",\"JCR\":\"\",\"JCRName\":\"\",\"Score\":null,\"Total\":0}","platform":"Semanticscholar","paperid":null,"PeriodicalName":"Data Sciences Indonesia (DSI)","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.47709/dsi.v2i1.1708","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
Prediksi Kualitas Kopi Dengan Algoritma Random Forest Melalui Pendekatan Data Science
Perusahaan yang bergerak dibidang produksi kopi, selalu mementingkan kualitas kopi untuk menghasilkan produk yang dapat bersaing dengan kompetitor lainnya
. Adapun sistem yang dapat dibangun untuk mengatasi permasalahan tersebut yaitu berupa prediksi dalam menentukan kualitas kopi. Data kopi yang digunakan pada penelitian ini didapatkan dari Coffee Quality Institute. Data ini memiliki 44 kolom atau variabel dengan jumlah data sebanyak 1339 data. Tahapan yang dilakukan dengan pendekatan data science dengan algoritma random forest terdiri dari proses pengumpulan data, preprocessing, pengumpulan data, split data, pemrosesan dengan algoritma Random Forest yang menghasilkan hasil prediksi, hingga yang terakhir adalah proses evaluasi performa algoritma Random Forest dalam memprediksi kualitas kopi.
Variabel dependen yang diprediksi pada penelitian ini secara berurutan dari kualitas terbaik hingga terburuk antara lain adalah kualitas kopi Specialty Grade, Premium, Exchange, dan Below Standard. Kualitas kopi premium adalah hasil prediksi paling baik dengan hasil actual 135. Jumlah data yang cukup untuk memastikan algoritma random forest dapat memprediksi dengan cukup baik dengan akurasi yang mencapai 79% masih memiliki ruang untuk perkembangan sehingga bisa mendekati 100%. Kurang optimalnya nilai akurasi pada penelitian ini dapat diakibatkan oleh kurangnya variabel independen yang digunakan. Penelitian ini hanya menggunakan 8 variabel dari 43 variabel yang tersedia. Sehingga masih terdapat variabel yang berpotensi dapat meningkatkan akurasi. Tidak dilakukannya penyetelan parameter Random Forest yang tersedia untuk meningkatkan akurasi.