{"title":"Perbandingan Model Regresi Zero Inflated Poisson (ZIP) dan Hurdle Poisson (HP) pada Kasus Kematian Balita di Kota Bandung Tahun 2021","authors":"Ani Ressa Nuryaningsih, Nusar Hajarisman","doi":"10.29313/bcss.v3i2.8522","DOIUrl":null,"url":null,"abstract":"Abstract. In this study, the response variable is assumed to be Poisson-distributed enumeration data. However, in the Poisson regression model, the enumerated data often deviates from the Poisson distribution because of the proportion of excess zero values in the response variable (excess zero), resulting in a larger variance than the average of the observed variables (overdispersion). Therefore, this study aims to model the data with Zero Inflated Poisson (ZIP) and Hurdle Poisson regression. Based on the results of the study by comparing the ZIP and Hurdle Poisson regression models using the Akaike Information Criterion (AIC) and Bayesian Information Criteria (BIC) values, it is found that the Hurdle Poisson regression model is more appropriate for modeling child mortality data in the city of Bandung in 2021 or in other words the Hurdle Poisson regression model is better at dealing with overdispersion and excess zeros problems compared to the Zero Inflated Poisson (ZIP) regression model. \nAbstrak. Pada penelitian ini variabel respon diasumsikan merupakan data cacahan yang berdistribusi Poisson. Namun, pada model regresi Poisson data cacah seringkali menyimpang dari distribusi Poisson karena proporsi nilai nol yang berlebih pada variabel respon (excess zero), sehingga menghasilkan varian yang lebih besar dari rata-rata variabel yang diamati (overdispersi). Maka dari itu, penelitian ini bertujuan untuk memodelkan data dengan regresi Zero Inflated Poisson (ZIP) dan Hurdle Poisson. Berdasarkan hasil penelitian dengan membandingkan model regresi ZIP dan Hurdle Poisson menggunakan nilai Akaike Information Criterion (AIC) dan Bayesian Information Criteria (BIC), maka diperoleh bahwa model regresi Hurdle Poisson lebih tepat digunakan untuk memodelkan data kematian balita di Kota Bandung tahun 2021 atau dengan kata lain model regresi Hurdle Poisson lebih baik dalam menangani masalah overdispersi dan excess zeros dibandingkan dengan model regresi Zero Inflated Poisson (ZIP).","PeriodicalId":337947,"journal":{"name":"Bandung Conference Series: Statistics","volume":"4 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2023-07-30","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Bandung Conference Series: Statistics","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.29313/bcss.v3i2.8522","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0
摘要
摘要。在本研究中,假设响应变量为泊松分布枚举数据。然而,在泊松回归模型中,由于响应变量中超零值的比例(超零),枚举数据往往偏离泊松分布,导致方差大于观测变量的平均值(过分散)。因此,本研究旨在利用零膨胀泊松(ZIP)和跨栏泊松回归对数据进行建模。基于使用赤池信息准则(AIC)和贝叶斯信息准则(BIC)值的ZIP和跨栏泊松回归模型的比较研究结果,研究发现,跨栏泊松回归模型更适合于2021年万隆市儿童死亡率数据的建模,或者说,与零膨胀泊松(Zero Inflated Poisson, ZIP)回归模型相比,跨栏泊松回归模型更擅长于处理过离散和过零问题。Abstrak。Pada penelitian - i变量响应与merupakan数据。Namun,帕达模型回归泊松数据cacah seringkali menyimpang dari分布泊松karena比例是nilai nol yang berlebih帕达变量响应(超零),sehinga menghasilkan varian yang lebih besar dari rata-rata变量yang diamati(过分散)。零膨胀泊松(ZIP)和障碍泊松。Berdasarkan hasil penelitian dengan membandingkan模型回归ZIP,但障碍泊松menggunakan nilai Akaike信息准则(AIC)和贝叶斯信息准则(BIC), maka diperoleh bahwa模型回归,障碍泊松lebih tepat digunakan untuk memodelkan数据kematian balita di Kota万隆tahun 2021 atau dengan kata模型回归,障碍泊松lebih baik dalam menangani masalah过度分散和过度零dibandingkan dengan模型回归零膨胀泊松(ZIP)。
Perbandingan Model Regresi Zero Inflated Poisson (ZIP) dan Hurdle Poisson (HP) pada Kasus Kematian Balita di Kota Bandung Tahun 2021
Abstract. In this study, the response variable is assumed to be Poisson-distributed enumeration data. However, in the Poisson regression model, the enumerated data often deviates from the Poisson distribution because of the proportion of excess zero values in the response variable (excess zero), resulting in a larger variance than the average of the observed variables (overdispersion). Therefore, this study aims to model the data with Zero Inflated Poisson (ZIP) and Hurdle Poisson regression. Based on the results of the study by comparing the ZIP and Hurdle Poisson regression models using the Akaike Information Criterion (AIC) and Bayesian Information Criteria (BIC) values, it is found that the Hurdle Poisson regression model is more appropriate for modeling child mortality data in the city of Bandung in 2021 or in other words the Hurdle Poisson regression model is better at dealing with overdispersion and excess zeros problems compared to the Zero Inflated Poisson (ZIP) regression model.
Abstrak. Pada penelitian ini variabel respon diasumsikan merupakan data cacahan yang berdistribusi Poisson. Namun, pada model regresi Poisson data cacah seringkali menyimpang dari distribusi Poisson karena proporsi nilai nol yang berlebih pada variabel respon (excess zero), sehingga menghasilkan varian yang lebih besar dari rata-rata variabel yang diamati (overdispersi). Maka dari itu, penelitian ini bertujuan untuk memodelkan data dengan regresi Zero Inflated Poisson (ZIP) dan Hurdle Poisson. Berdasarkan hasil penelitian dengan membandingkan model regresi ZIP dan Hurdle Poisson menggunakan nilai Akaike Information Criterion (AIC) dan Bayesian Information Criteria (BIC), maka diperoleh bahwa model regresi Hurdle Poisson lebih tepat digunakan untuk memodelkan data kematian balita di Kota Bandung tahun 2021 atau dengan kata lain model regresi Hurdle Poisson lebih baik dalam menangani masalah overdispersi dan excess zeros dibandingkan dengan model regresi Zero Inflated Poisson (ZIP).