大数据技术在哥伦比亚covid-19大流行状况分析中的应用

Jorge Luis Quintero López, Andrés Arismendi Ramírez, Angela Liceth Pérez Rendon
{"title":"大数据技术在哥伦比亚covid-19大流行状况分析中的应用","authors":"Jorge Luis Quintero López, Andrés Arismendi Ramírez, Angela Liceth Pérez Rendon","doi":"10.22490/25394088.5612","DOIUrl":null,"url":null,"abstract":"En la actualidad de la pandemia, se presenta la necesidad de procesar grandes volúmenes de información generados por casos reportados positivos, con el fin de identificar patrones que conlleven a afrontar la emergencia con medidas de contingencia oportunas. En el presente estudio se plantea el tratamiento de un data set de la población general de Colombia, con información comprendida del mes de marzo y abril del 2021, con el fin de caracterizar, georreferenciar y predecir para darle valor a los datos, en busca de una comprensión de la dinámica del virus, para lo que se utilizaron tres modelos Naive Bayes, Random Forest y árboles J-48, buscando identificar aquel con mayor precisión; al usar el aplicativo Weka se llega a la conclusión de que el modelo que mejor se ajusta a la predicción, es el algoritmo de clasificación de árboles J-48 con un nivel de clasificación de instancias correctas de 99.24%, con un valor de Kappa de 0.9266 informando que se aproxima al 100 % de concordancia en la clasificación de las clases, con una cantidad, para este caso, de estudio de 221.583 clases y la predicción con 30 clases tomadas de la base original que consta de aproximadamente 2.774.465 datos. Al aplicar pruebas estadísticas se logra identificar la correlación entre los atributos, que llevan a garantizar el correcto modelado para la predicción. Este proceso se convierte en un insumo potencial para apoyar los procesos de administración de la sociedad y que beneficie las decisiones que se toman en términos de salud pública.","PeriodicalId":32115,"journal":{"name":"Publicaciones e Investigacion","volume":" ","pages":""},"PeriodicalIF":0.0000,"publicationDate":"2021-12-15","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":"{\"title\":\"Tecnología de Big Data en el análisis del estado de la pandemia por covid-19 en Colombia\",\"authors\":\"Jorge Luis Quintero López, Andrés Arismendi Ramírez, Angela Liceth Pérez Rendon\",\"doi\":\"10.22490/25394088.5612\",\"DOIUrl\":null,\"url\":null,\"abstract\":\"En la actualidad de la pandemia, se presenta la necesidad de procesar grandes volúmenes de información generados por casos reportados positivos, con el fin de identificar patrones que conlleven a afrontar la emergencia con medidas de contingencia oportunas. En el presente estudio se plantea el tratamiento de un data set de la población general de Colombia, con información comprendida del mes de marzo y abril del 2021, con el fin de caracterizar, georreferenciar y predecir para darle valor a los datos, en busca de una comprensión de la dinámica del virus, para lo que se utilizaron tres modelos Naive Bayes, Random Forest y árboles J-48, buscando identificar aquel con mayor precisión; al usar el aplicativo Weka se llega a la conclusión de que el modelo que mejor se ajusta a la predicción, es el algoritmo de clasificación de árboles J-48 con un nivel de clasificación de instancias correctas de 99.24%, con un valor de Kappa de 0.9266 informando que se aproxima al 100 % de concordancia en la clasificación de las clases, con una cantidad, para este caso, de estudio de 221.583 clases y la predicción con 30 clases tomadas de la base original que consta de aproximadamente 2.774.465 datos. Al aplicar pruebas estadísticas se logra identificar la correlación entre los atributos, que llevan a garantizar el correcto modelado para la predicción. Este proceso se convierte en un insumo potencial para apoyar los procesos de administración de la sociedad y que beneficie las decisiones que se toman en términos de salud pública.\",\"PeriodicalId\":32115,\"journal\":{\"name\":\"Publicaciones e Investigacion\",\"volume\":\" \",\"pages\":\"\"},\"PeriodicalIF\":0.0000,\"publicationDate\":\"2021-12-15\",\"publicationTypes\":\"Journal Article\",\"fieldsOfStudy\":null,\"isOpenAccess\":false,\"openAccessPdf\":\"\",\"citationCount\":\"0\",\"resultStr\":null,\"platform\":\"Semanticscholar\",\"paperid\":null,\"PeriodicalName\":\"Publicaciones e Investigacion\",\"FirstCategoryId\":\"1085\",\"ListUrlMain\":\"https://doi.org/10.22490/25394088.5612\",\"RegionNum\":0,\"RegionCategory\":null,\"ArticlePicture\":[],\"TitleCN\":null,\"AbstractTextCN\":null,\"PMCID\":null,\"EPubDate\":\"\",\"PubModel\":\"\",\"JCR\":\"\",\"JCRName\":\"\",\"Score\":null,\"Total\":0}","platform":"Semanticscholar","paperid":null,"PeriodicalName":"Publicaciones e Investigacion","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.22490/25394088.5612","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0

摘要

目前,在这一大流行病中,有必要处理报告的阳性病例产生的大量信息,以确定导致通过及时的应急措施应对紧急情况的模式。这项研究考虑使用2021年3月和4月的信息处理哥伦比亚普通人口的一组数据,以表征、地理参考和预测数据,以评估数据的价值,以了解病毒的动态,为此使用了三种朴素贝叶斯模型、随机森林模型和J-48树,旨在更准确地识别病毒;使用WEKA应用程序得出的结论是,最适合预测的模型是J-48树分类算法,正确的实例分类级别为99.24%,Kappa值为0.9266,报告类分类的一致性接近100%,在这种情况下,数量为,对221583个班级进行了研究,并从大约2774465个数据组成的原始基础上对30个班级进行了预测。通过应用统计测试,可以识别属性之间的相关性,从而确保预测的正确建模。这一进程成为支持社会管理进程的潜在投入,并有利于在公共卫生方面作出的决定。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
Tecnología de Big Data en el análisis del estado de la pandemia por covid-19 en Colombia
En la actualidad de la pandemia, se presenta la necesidad de procesar grandes volúmenes de información generados por casos reportados positivos, con el fin de identificar patrones que conlleven a afrontar la emergencia con medidas de contingencia oportunas. En el presente estudio se plantea el tratamiento de un data set de la población general de Colombia, con información comprendida del mes de marzo y abril del 2021, con el fin de caracterizar, georreferenciar y predecir para darle valor a los datos, en busca de una comprensión de la dinámica del virus, para lo que se utilizaron tres modelos Naive Bayes, Random Forest y árboles J-48, buscando identificar aquel con mayor precisión; al usar el aplicativo Weka se llega a la conclusión de que el modelo que mejor se ajusta a la predicción, es el algoritmo de clasificación de árboles J-48 con un nivel de clasificación de instancias correctas de 99.24%, con un valor de Kappa de 0.9266 informando que se aproxima al 100 % de concordancia en la clasificación de las clases, con una cantidad, para este caso, de estudio de 221.583 clases y la predicción con 30 clases tomadas de la base original que consta de aproximadamente 2.774.465 datos. Al aplicar pruebas estadísticas se logra identificar la correlación entre los atributos, que llevan a garantizar el correcto modelado para la predicción. Este proceso se convierte en un insumo potencial para apoyar los procesos de administración de la sociedad y que beneficie las decisiones que se toman en términos de salud pública.
求助全文
通过发布文献求助,成功后即可免费获取论文全文。 去求助
来源期刊
自引率
0.00%
发文量
0
审稿时长
10 weeks
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
确定
请完成安全验证×
copy
已复制链接
快去分享给好友吧!
我知道了
右上角分享
点击右上角分享
0
联系我们:info@booksci.cn Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。 Copyright © 2023 布克学术 All rights reserved.
京ICP备2023020795号-1
ghs 京公网安备 11010802042870号
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术官方微信