Muhammad Said, Mohammad Reza Faisal, Dwi Kartini, Irwan Budiman, Triando Hamonangan Saragih
{"title":"基于谐波平均值和局部平均值向量的 KNN 算法与邻域选择","authors":"Muhammad Said, Mohammad Reza Faisal, Dwi Kartini, Irwan Budiman, Triando Hamonangan Saragih","doi":"10.34128/jsi.v9i2.376","DOIUrl":null,"url":null,"abstract":"Algoritma K Nearest Neighbour (KNN) merupakan salah satu algoritma klasifikasi yang telah digunakan pada banyak penelitian, namun KNN memiliki beberapa kekurangan diantaranya adalah pada pemilihan jumlah tetangga terdekat. Jika jumlah tetangga terdekat terlalu kecil maka akan sensitif terhadap data bising dan jika jumlah tetangga terdekat terlalu besar kemungkinan ada tetangga outlier dari kelas lain. Majority Voting juga merupakan metode yang sederhana dan ini bisa jadi masalah jika jarak bervariasi. Salah satu solusi untuk masalah outlier adalah menggunakan Local Mean Vector dengan menambahkan Harmonic Mean untuk membantunya. Penelitian ini akan menyeleksi tetangga yang didapatkan menggunakan Local Mean Vector dan Harmonic Mean sehingga tersisa tetangga terakhir. Dari hasil yang didapatkan yaitu pada KNN menggunakan Majority Voting mendapatkan akurasi sebesar 0,752998731, dan KNN dengan Penyeleksian Tetangga berdasarkan Local Mean Vector dan Harmonic Mean mendapatkan akurasi yang lebih besar yaitu 0,780791833.","PeriodicalId":426758,"journal":{"name":"Jurnal Sains dan Informatika","volume":"1979 10","pages":""},"PeriodicalIF":0.0000,"publicationDate":"2023-12-14","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":"{\"title\":\"Algoritma KNN Dengan Penyeleksian Tetangga Berbasis Harmonic Mean dan Local mean vector\",\"authors\":\"Muhammad Said, Mohammad Reza Faisal, Dwi Kartini, Irwan Budiman, Triando Hamonangan Saragih\",\"doi\":\"10.34128/jsi.v9i2.376\",\"DOIUrl\":null,\"url\":null,\"abstract\":\"Algoritma K Nearest Neighbour (KNN) merupakan salah satu algoritma klasifikasi yang telah digunakan pada banyak penelitian, namun KNN memiliki beberapa kekurangan diantaranya adalah pada pemilihan jumlah tetangga terdekat. Jika jumlah tetangga terdekat terlalu kecil maka akan sensitif terhadap data bising dan jika jumlah tetangga terdekat terlalu besar kemungkinan ada tetangga outlier dari kelas lain. Majority Voting juga merupakan metode yang sederhana dan ini bisa jadi masalah jika jarak bervariasi. Salah satu solusi untuk masalah outlier adalah menggunakan Local Mean Vector dengan menambahkan Harmonic Mean untuk membantunya. Penelitian ini akan menyeleksi tetangga yang didapatkan menggunakan Local Mean Vector dan Harmonic Mean sehingga tersisa tetangga terakhir. Dari hasil yang didapatkan yaitu pada KNN menggunakan Majority Voting mendapatkan akurasi sebesar 0,752998731, dan KNN dengan Penyeleksian Tetangga berdasarkan Local Mean Vector dan Harmonic Mean mendapatkan akurasi yang lebih besar yaitu 0,780791833.\",\"PeriodicalId\":426758,\"journal\":{\"name\":\"Jurnal Sains dan Informatika\",\"volume\":\"1979 10\",\"pages\":\"\"},\"PeriodicalIF\":0.0000,\"publicationDate\":\"2023-12-14\",\"publicationTypes\":\"Journal Article\",\"fieldsOfStudy\":null,\"isOpenAccess\":false,\"openAccessPdf\":\"\",\"citationCount\":\"0\",\"resultStr\":null,\"platform\":\"Semanticscholar\",\"paperid\":null,\"PeriodicalName\":\"Jurnal Sains dan Informatika\",\"FirstCategoryId\":\"1085\",\"ListUrlMain\":\"https://doi.org/10.34128/jsi.v9i2.376\",\"RegionNum\":0,\"RegionCategory\":null,\"ArticlePicture\":[],\"TitleCN\":null,\"AbstractTextCN\":null,\"PMCID\":null,\"EPubDate\":\"\",\"PubModel\":\"\",\"JCR\":\"\",\"JCRName\":\"\",\"Score\":null,\"Total\":0}","platform":"Semanticscholar","paperid":null,"PeriodicalName":"Jurnal Sains dan Informatika","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.34128/jsi.v9i2.376","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0
摘要
K 近邻(KNN)算法是分类算法之一,已被许多研究采用,但 KNN 有几个缺点,包括近邻数量的选择。如果近邻数太小,就会对噪声数据很敏感;如果近邻数太大,就可能会出现来自其他类别的离群近邻。多数投票法也是一种简单的方法,如果距离不同,就会出现问题。解决离群值问题的一种方法是通过添加谐波平均值来使用局部平均值向量。本研究将选择使用局部均值向量和谐波均值获得的邻域,以便保留最后一个邻域。从得到的结果来看,使用多数投票的 KNN 准确率为 0.752998731,而使用基于本地均值向量和谐波平均值的邻居选择的 KNN 准确率更高,为 0.780791833。
Algoritma KNN Dengan Penyeleksian Tetangga Berbasis Harmonic Mean dan Local mean vector
Algoritma K Nearest Neighbour (KNN) merupakan salah satu algoritma klasifikasi yang telah digunakan pada banyak penelitian, namun KNN memiliki beberapa kekurangan diantaranya adalah pada pemilihan jumlah tetangga terdekat. Jika jumlah tetangga terdekat terlalu kecil maka akan sensitif terhadap data bising dan jika jumlah tetangga terdekat terlalu besar kemungkinan ada tetangga outlier dari kelas lain. Majority Voting juga merupakan metode yang sederhana dan ini bisa jadi masalah jika jarak bervariasi. Salah satu solusi untuk masalah outlier adalah menggunakan Local Mean Vector dengan menambahkan Harmonic Mean untuk membantunya. Penelitian ini akan menyeleksi tetangga yang didapatkan menggunakan Local Mean Vector dan Harmonic Mean sehingga tersisa tetangga terakhir. Dari hasil yang didapatkan yaitu pada KNN menggunakan Majority Voting mendapatkan akurasi sebesar 0,752998731, dan KNN dengan Penyeleksian Tetangga berdasarkan Local Mean Vector dan Harmonic Mean mendapatkan akurasi yang lebih besar yaitu 0,780791833.