{"title":"logistic回归与随机森林在确定秘鲁伴侣暴力因素中的比较","authors":"Ashley Mercedes Guerrero-Muguerza","doi":"10.26439/ciis2019.5518","DOIUrl":null,"url":null,"abstract":"La violencia de pareja es una problemática social que ha sido estudiada por diferentes investigadores para los factores que influyen en la ocurrencia de la misma, considerando diferentes entornos, tiempos y locaciones. El 68,2 % de mujeres han sido víctimas de violencia, y el 31,7 % fueron víctimas de agresión física en el Perú. La presente investigación propone nueve modelos basados en logística y random forest con las de chi-square, entropía y Gini, y tres sub escenarios de cinco, diez y veinte variables que utilizaron el dataset de denuncias registradas en el año 2016 del Ministerio de la Mujer. Se obtuvo el mejor resultado de cada subescenario, pero finalmente el mejor modelo fue el de veinte variables utilizando el feature selection random forest (entropy) y el modelo random forest (Gini).","PeriodicalId":365289,"journal":{"name":"Innovando la educación en tecnología. Actas del II Congreso Internacional de Ingeniería de Sistemas","volume":"34 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"1900-01-01","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":"{\"title\":\"Comparación entre regresión logística y random forest para determinación de factores de violencia de pareja en el Perú\",\"authors\":\"Ashley Mercedes Guerrero-Muguerza\",\"doi\":\"10.26439/ciis2019.5518\",\"DOIUrl\":null,\"url\":null,\"abstract\":\"La violencia de pareja es una problemática social que ha sido estudiada por diferentes investigadores para los factores que influyen en la ocurrencia de la misma, considerando diferentes entornos, tiempos y locaciones. El 68,2 % de mujeres han sido víctimas de violencia, y el 31,7 % fueron víctimas de agresión física en el Perú. La presente investigación propone nueve modelos basados en logística y random forest con las de chi-square, entropía y Gini, y tres sub escenarios de cinco, diez y veinte variables que utilizaron el dataset de denuncias registradas en el año 2016 del Ministerio de la Mujer. Se obtuvo el mejor resultado de cada subescenario, pero finalmente el mejor modelo fue el de veinte variables utilizando el feature selection random forest (entropy) y el modelo random forest (Gini).\",\"PeriodicalId\":365289,\"journal\":{\"name\":\"Innovando la educación en tecnología. Actas del II Congreso Internacional de Ingeniería de Sistemas\",\"volume\":\"34 1\",\"pages\":\"0\"},\"PeriodicalIF\":0.0000,\"publicationDate\":\"1900-01-01\",\"publicationTypes\":\"Journal Article\",\"fieldsOfStudy\":null,\"isOpenAccess\":false,\"openAccessPdf\":\"\",\"citationCount\":\"0\",\"resultStr\":null,\"platform\":\"Semanticscholar\",\"paperid\":null,\"PeriodicalName\":\"Innovando la educación en tecnología. Actas del II Congreso Internacional de Ingeniería de Sistemas\",\"FirstCategoryId\":\"1085\",\"ListUrlMain\":\"https://doi.org/10.26439/ciis2019.5518\",\"RegionNum\":0,\"RegionCategory\":null,\"ArticlePicture\":[],\"TitleCN\":null,\"AbstractTextCN\":null,\"PMCID\":null,\"EPubDate\":\"\",\"PubModel\":\"\",\"JCR\":\"\",\"JCRName\":\"\",\"Score\":null,\"Total\":0}","platform":"Semanticscholar","paperid":null,"PeriodicalName":"Innovando la educación en tecnología. Actas del II Congreso Internacional de Ingeniería de Sistemas","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.26439/ciis2019.5518","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
Comparación entre regresión logística y random forest para determinación de factores de violencia de pareja en el Perú
La violencia de pareja es una problemática social que ha sido estudiada por diferentes investigadores para los factores que influyen en la ocurrencia de la misma, considerando diferentes entornos, tiempos y locaciones. El 68,2 % de mujeres han sido víctimas de violencia, y el 31,7 % fueron víctimas de agresión física en el Perú. La presente investigación propone nueve modelos basados en logística y random forest con las de chi-square, entropía y Gini, y tres sub escenarios de cinco, diez y veinte variables que utilizaron el dataset de denuncias registradas en el año 2016 del Ministerio de la Mujer. Se obtuvo el mejor resultado de cada subescenario, pero finalmente el mejor modelo fue el de veinte variables utilizando el feature selection random forest (entropy) y el modelo random forest (Gini).