{"title":"Penerapan Sparse Principal Component Analysis dalam Menghasilkan Matriks Loading yang Sparse","authors":"G. M. Tinungki, Nurtiti i Sunusi","doi":"10.20956/jmsk.v15i2.5713","DOIUrl":null,"url":null,"abstract":"Abstract Sparse Principal Component Analysis (Sparse PCA) is one of the development of PCA. Sparse PCA modifies new variables as a linier combination of p old variables (original variable) which is yielded by PCA method. Modifying new variables is conducted by producing a loading yang sparse matrix, such that old variable which is not effective (value of loading is zero) able be exit from PCA. In this study, Sparse PCA method was applied on data of Indonesia Poverty population in 2015, that contains 13 variables and 34 observation with variable reduction such that yields 4 (four) new variables, which can explain 80.1% of total variance data. This study show, the loading matrix that has been yielded by using Sparse PCA method to become sparse with there exist 11 elements (loading value) zero entry of matrix, such that the model that has been produced to be simpler and easy to be interpreted. Keywords: Principal Component Analysis, Sparse Principal Component Analysis, reduksi dimensi, matriks loading yang sparse Abstrak Sparse Principal Component Analysis (Sparse PCA) merupakan salah satu pengembangan dari metode PCA. Sparse PCA memodifikasi variabel-variabel baru yang merupakan kombinasi linear dari variabel lama (variabel asli) yang dihasilkan oleh metode PCA. Pemodifikasian variabel baru ini dilakukan dengan dengan menghasilkan matriks loading yang sparse sehingga variabel lama yang tidak efektif (memiliki nilai loading sama dengan nol) dapat dikeluarkan dari model PCA. Pada penelitian ini, metode Sparse PCA diterapkan pada data Indikator Kemiskinan Penduduk Indonesia Tahun 2015 yang memuat 13 variabel dan 34 observasi dengan reduksi variabel menghasilkan 4 (empat) variabel baru yang telah mampu menjelaskan 80,1% dari total variansi data. Hasil penelitian menunjukkan, matriks loading yang dihasilkan menggunakan metode Sparse PCA menjadi sparse dengan terdapat 11 elemen (nilai loading) matriks bernilai nol sehingga model yang dihasilkan menjadi lebih sederhana dan mudah untuk diinterpretasikan. Kata Kunci: Principal Component Analysis, Sparse Principal Component Analysis, reduksi dimensi, matriks loading yang sparse","PeriodicalId":150527,"journal":{"name":"Jurnal Matematika Statistika dan Komputasi","volume":"24 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2018-12-06","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"2","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Jurnal Matematika Statistika dan Komputasi","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.20956/jmsk.v15i2.5713","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 2
Abstract
Abstract Sparse Principal Component Analysis (Sparse PCA) is one of the development of PCA. Sparse PCA modifies new variables as a linier combination of p old variables (original variable) which is yielded by PCA method. Modifying new variables is conducted by producing a loading yang sparse matrix, such that old variable which is not effective (value of loading is zero) able be exit from PCA. In this study, Sparse PCA method was applied on data of Indonesia Poverty population in 2015, that contains 13 variables and 34 observation with variable reduction such that yields 4 (four) new variables, which can explain 80.1% of total variance data. This study show, the loading matrix that has been yielded by using Sparse PCA method to become sparse with there exist 11 elements (loading value) zero entry of matrix, such that the model that has been produced to be simpler and easy to be interpreted. Keywords: Principal Component Analysis, Sparse Principal Component Analysis, reduksi dimensi, matriks loading yang sparse Abstrak Sparse Principal Component Analysis (Sparse PCA) merupakan salah satu pengembangan dari metode PCA. Sparse PCA memodifikasi variabel-variabel baru yang merupakan kombinasi linear dari variabel lama (variabel asli) yang dihasilkan oleh metode PCA. Pemodifikasian variabel baru ini dilakukan dengan dengan menghasilkan matriks loading yang sparse sehingga variabel lama yang tidak efektif (memiliki nilai loading sama dengan nol) dapat dikeluarkan dari model PCA. Pada penelitian ini, metode Sparse PCA diterapkan pada data Indikator Kemiskinan Penduduk Indonesia Tahun 2015 yang memuat 13 variabel dan 34 observasi dengan reduksi variabel menghasilkan 4 (empat) variabel baru yang telah mampu menjelaskan 80,1% dari total variansi data. Hasil penelitian menunjukkan, matriks loading yang dihasilkan menggunakan metode Sparse PCA menjadi sparse dengan terdapat 11 elemen (nilai loading) matriks bernilai nol sehingga model yang dihasilkan menjadi lebih sederhana dan mudah untuk diinterpretasikan. Kata Kunci: Principal Component Analysis, Sparse Principal Component Analysis, reduksi dimensi, matriks loading yang sparse
稀疏主成分分析(稀疏主成分分析)是主成分分析的发展方向之一。稀疏主成分分析法将新变量修改为由主成分分析法得到的p个旧变量(原始变量)的线性组合。通过生成加载杨稀疏矩阵对新变量进行修改,使无效的旧变量(加载值为零)能够从主成分分析中退出。本研究采用稀疏PCA方法对2015年印度尼西亚贫困人口数据进行分析,该数据包含13个变量,34个观测值进行了变量化简,产生了4(4)个新变量,可以解释总方差数据的80.1%。本研究表明,使用稀疏PCA方法得到的加载矩阵变得稀疏,且矩阵中存在11个元素(加载值)零条目,使得所得到的模型更简单,易于解释。关键词:主成分分析,稀疏主成分分析,reduksi维数,矩阵加载杨稀疏摘要稀疏主成分分析(稀疏PCA) merupakan salah satu pengembangan dari方法PCA。稀疏主成分分析(memdifikasi variable - variable baru yang merupakan kombinasi linear dari variable lama (variabel asli) yang dihasilkan oleh方法主成分分析。Pemodifikasian variable baru ini dilakukan dengan menghasilkan矩阵加载yang sparse sehinga变量lama yang tidak efektif (memiliki nilai loading sama dengan nol) dapat dikeluarkan dari模型PCA。指标keemiskinan Penduduk Indonesia Tahun 2015 yang memu13个变量和34个观测值,denengan reduksi变量menghasilkan 4 (empat)变量baru yang telah mampu menjelaskan 80.1%,总方差数据。稀疏主成分分析(PCA) menjadi稀疏dengan terdapat 11元(nilai加载)矩阵bernilai nol sehingga模型yang dihasilkan menjadi lebih sederhana dan mudah untuk diinterpretasikan。Kata Kunci:主成分分析,稀疏主成分分析,reduksi维数,矩阵加载稀疏