{"title":"利用自动化机器学习系统预测非洲冲突","authors":"Vito D'Orazio, Yu Lin","doi":"10.1080/03050629.2022.2017290","DOIUrl":null,"url":null,"abstract":"Abstract The ViEWS problem is to forecast changes in the level of state-based violence for each of the next six months at the PRIO-GRID and country level. For this competition and toward the goal of improving sub-national and country level forecasts, we experiment with combinations of automated machine learning (autoML) systems and limited datasets that emphasize the endogenous nature of conflict. Two core findings emerge: autoML improves predictive performance and the Dynamics model performs best. The data used for the Dynamics model is limited to measures of state-based violence built from the event-level violence data plus those describing the spatial and temporal structure of the data. The intent is to capture spatial and temporal conflict dynamics while not overfitting to exogenous factors, which is especially problematic with flexible autoML algorithms and the types of highly disaggregate data used here. At the PGM level, this model won the ViEWS competition for “predictive accuracy” and split the win for “originality.” Beyond the ViEWS competition, we expect conflict forecasting models that couple advanced autoML systems with variables that reflect a diverse set of conflict dynamics to have high predictive performance, especially at sub-national and sub-annual aggregations. El problema del ViEWS es que predice los cambios en el nivel de violencia estatal de cada uno de los próximos seis meses a nivel de PRIO-GRID y de país. En el marco de esta competencia y con el objetivo de mejorar las predicciones a nivel regional y nacional, probamos combinaciones de sistemas de aprendizaje automático (autoML) y conjuntos de datos limitados que ponen de relieve la naturaleza endógena de los conflictos. Hay dos resultados principales: el autoML mejora el rendimiento predictivo y el modelo Dynamics es el que mejor funciona. Los datos utilizados para el modelo Dynamics se limitan a las medidas de la violencia a nivel estatal establecidas a partir de los datos de la violencia sobre eventos más los que describen la estructura espacial y temporal de los datos. La intención es captar la dinámica espacial y temporal de los conflictos sin caer en el exceso de ajuste de los factores exógenos, lo que supone un problema, sobre todo con los algoritmos autoML flexibles y los tipos de datos altamente desagregados que se utilizan aquí. A nivel de PGM, este modelo ganó la competencia del ViEWS tanto por su “precisión predictiva” como por su “originalidad”. Más allá de la competencia del ViEWS, esperamos que los modelos de previsión de conflictos que combinan sistemas avanzados de autoML con variables que reflejan un conjunto diverso de dinámicas de conflicto tengan un alto resultado predictivo, sobre todo en agregados regionales y semestrales. La problématique du ViEWS (Violence early-warning system, système d’alerte précoce sur la violence) est de prévoir les évolutions du niveau de violence étatique pour chacun des six prochains mois au niveau de la grille PRIO et au niveau national. Pour ce concours et dans l’objectif d’améliorer les prévisions au niveau infranational et au niveau national, nous avons expérimenté des combinaisons de systèmes de machine learning automatisés (autoML) et de jeux de données limités mettant l’accent sur la nature endogène des conflits. Deux résultats fondamentaux sont apparus : l’autoML améliore les performances prédictives et le modèle Dynamiques est le plus efficace. Les données utilisées pour le modèle Dynamiques sont limitées aux mesures de la violence étatique établies à partir des données sur la violence au niveau des événements ainsi que de celles qui décrivent la structure spatiale et temporelle des données. L’objectif est de capturer les dynamiques spatiales et temporelles des conflits tout en évitant un ajustement excessif aux facteurs exogènes, ce qui est particulièrement problématique avec les algorithmes d’autoML flexibles et les types de données très désagrégées qui sont utilisés ici. Au niveau PGM, ce modèle a remporté le concours ViEWS à la fois dans les catégories « Précision prédictive » et « Originalité ». Au-delà du concours ViEWS, nous nous attendons à ce que les modèles de prévision des conflits qui allient des systèmes avancés d’autoML à des variables reflétant un ensemble diversifié de dynamiques de conflits aient de hautes performances prédictives, en particulier aux niveaux d’agrégation infranationaux et infra-annuels.","PeriodicalId":51513,"journal":{"name":"International Interactions","volume":"48 1","pages":"714 - 738"},"PeriodicalIF":1.5000,"publicationDate":"2022-01-15","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"7","resultStr":"{\"title\":\"Forecasting conflict in Africa with automated machine learning systems\",\"authors\":\"Vito D'Orazio, Yu Lin\",\"doi\":\"10.1080/03050629.2022.2017290\",\"DOIUrl\":null,\"url\":null,\"abstract\":\"Abstract The ViEWS problem is to forecast changes in the level of state-based violence for each of the next six months at the PRIO-GRID and country level. For this competition and toward the goal of improving sub-national and country level forecasts, we experiment with combinations of automated machine learning (autoML) systems and limited datasets that emphasize the endogenous nature of conflict. Two core findings emerge: autoML improves predictive performance and the Dynamics model performs best. The data used for the Dynamics model is limited to measures of state-based violence built from the event-level violence data plus those describing the spatial and temporal structure of the data. The intent is to capture spatial and temporal conflict dynamics while not overfitting to exogenous factors, which is especially problematic with flexible autoML algorithms and the types of highly disaggregate data used here. At the PGM level, this model won the ViEWS competition for “predictive accuracy” and split the win for “originality.” Beyond the ViEWS competition, we expect conflict forecasting models that couple advanced autoML systems with variables that reflect a diverse set of conflict dynamics to have high predictive performance, especially at sub-national and sub-annual aggregations. El problema del ViEWS es que predice los cambios en el nivel de violencia estatal de cada uno de los próximos seis meses a nivel de PRIO-GRID y de país. En el marco de esta competencia y con el objetivo de mejorar las predicciones a nivel regional y nacional, probamos combinaciones de sistemas de aprendizaje automático (autoML) y conjuntos de datos limitados que ponen de relieve la naturaleza endógena de los conflictos. Hay dos resultados principales: el autoML mejora el rendimiento predictivo y el modelo Dynamics es el que mejor funciona. Los datos utilizados para el modelo Dynamics se limitan a las medidas de la violencia a nivel estatal establecidas a partir de los datos de la violencia sobre eventos más los que describen la estructura espacial y temporal de los datos. La intención es captar la dinámica espacial y temporal de los conflictos sin caer en el exceso de ajuste de los factores exógenos, lo que supone un problema, sobre todo con los algoritmos autoML flexibles y los tipos de datos altamente desagregados que se utilizan aquí. A nivel de PGM, este modelo ganó la competencia del ViEWS tanto por su “precisión predictiva” como por su “originalidad”. Más allá de la competencia del ViEWS, esperamos que los modelos de previsión de conflictos que combinan sistemas avanzados de autoML con variables que reflejan un conjunto diverso de dinámicas de conflicto tengan un alto resultado predictivo, sobre todo en agregados regionales y semestrales. La problématique du ViEWS (Violence early-warning system, système d’alerte précoce sur la violence) est de prévoir les évolutions du niveau de violence étatique pour chacun des six prochains mois au niveau de la grille PRIO et au niveau national. Pour ce concours et dans l’objectif d’améliorer les prévisions au niveau infranational et au niveau national, nous avons expérimenté des combinaisons de systèmes de machine learning automatisés (autoML) et de jeux de données limités mettant l’accent sur la nature endogène des conflits. Deux résultats fondamentaux sont apparus : l’autoML améliore les performances prédictives et le modèle Dynamiques est le plus efficace. Les données utilisées pour le modèle Dynamiques sont limitées aux mesures de la violence étatique établies à partir des données sur la violence au niveau des événements ainsi que de celles qui décrivent la structure spatiale et temporelle des données. L’objectif est de capturer les dynamiques spatiales et temporelles des conflits tout en évitant un ajustement excessif aux facteurs exogènes, ce qui est particulièrement problématique avec les algorithmes d’autoML flexibles et les types de données très désagrégées qui sont utilisés ici. Au niveau PGM, ce modèle a remporté le concours ViEWS à la fois dans les catégories « Précision prédictive » et « Originalité ». Au-delà du concours ViEWS, nous nous attendons à ce que les modèles de prévision des conflits qui allient des systèmes avancés d’autoML à des variables reflétant un ensemble diversifié de dynamiques de conflits aient de hautes performances prédictives, en particulier aux niveaux d’agrégation infranationaux et infra-annuels.\",\"PeriodicalId\":51513,\"journal\":{\"name\":\"International Interactions\",\"volume\":\"48 1\",\"pages\":\"714 - 738\"},\"PeriodicalIF\":1.5000,\"publicationDate\":\"2022-01-15\",\"publicationTypes\":\"Journal Article\",\"fieldsOfStudy\":null,\"isOpenAccess\":false,\"openAccessPdf\":\"\",\"citationCount\":\"7\",\"resultStr\":null,\"platform\":\"Semanticscholar\",\"paperid\":null,\"PeriodicalName\":\"International Interactions\",\"FirstCategoryId\":\"90\",\"ListUrlMain\":\"https://doi.org/10.1080/03050629.2022.2017290\",\"RegionNum\":3,\"RegionCategory\":\"社会学\",\"ArticlePicture\":[],\"TitleCN\":null,\"AbstractTextCN\":null,\"PMCID\":null,\"EPubDate\":\"\",\"PubModel\":\"\",\"JCR\":\"Q2\",\"JCRName\":\"INTERNATIONAL RELATIONS\",\"Score\":null,\"Total\":0}","platform":"Semanticscholar","paperid":null,"PeriodicalName":"International Interactions","FirstCategoryId":"90","ListUrlMain":"https://doi.org/10.1080/03050629.2022.2017290","RegionNum":3,"RegionCategory":"社会学","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"Q2","JCRName":"INTERNATIONAL RELATIONS","Score":null,"Total":0}
引用次数: 7
摘要
观点问题是预测未来六个月PRIO电网和国家层面的国家暴力水平的变化。为了这场比赛,并朝着改善次国家和国家一级预测的目标,我们正在试验自动机器学习(AutoML)系统和有限数据集的组合,强调冲突的内在性质。出现了两个核心发现:AutoML提高了预测性能,动态模型表现最佳。用于动力学模型的数据仅限于测量从事件级暴力数据加上描述数据空间和时间结构的基于状态的暴力。其目的是捕捉空间和时间冲突动态,同时不过度拟合外源因素,这尤其是灵活的AutoML算法和此处使用的高度分解数据类型的问题。在PGM层面,该模型赢得了“预测准确性”的观点竞赛,并分裂了“独创性”的胜利。除了观点竞赛之外,我们预计冲突预测模型将高级AutoML系统与反映不同冲突动态集的变量配对,以具有高预测性能,特别是在次国家和次年度汇总中。El problema del views es que predice los cambios en el nivel de violencia estatal de cada uno de los próximos seis meses a nivel de prio grid y de país。在国家和地区一级的竞争力和目标方面,Probamos Combinaciones de Sistemas de Aprendizaje Automático(AUTOML)和Conventos de datos limitados que ponen de relieve la naturaleza endógena de los conflictos。主要结果:el automl mejora el rendimiento predictivo y el modelo dynamics es el que mejor funciona。Los datos utilizados para el modelo dynamics se limitan a las medidas de la violencia a nivel estatal establecidas de los datos de la violencia sobre eventos más los que describen la estructura espacial y temporal de los datos。我们的意图是捕捉冲突的空间和时间差异,这是一个问题,sobre todo con los algoritmos automl flexibles y los tipos de datos altamente desagregados que se utilizan aquí。在PGM级别,este modelo ganóla competencia del views tanto por su“precisión predictiva”como por su“originalidad”。más alláde la competencia del views,esperamos que los modelos de previsión de conflictos que combinan sistemas avanzados de automl con variables que reflejan un convento diverso de dinámicas de conflicto tengan un alto resultado predictivo,sobre todo en agregionales y semestrales。VIEWS(暴力预警系统)的问题是预测未来六个月在PRIO网格和国家一级的国家暴力水平的变化。在本次比赛中,为了改善次国家和国家层面的预测,我们尝试了自动化机器学习系统(AutoML)和有限数据集的组合,重点关注冲突的内生性质。出现了两个基本结果:AutoML提高了预测性能,动态模型最有效。动态模型中使用的数据仅限于基于事件级暴力数据的国家暴力测量,以及描述数据空间和时间结构的数据。目标是捕捉冲突的空间和时间动态,同时避免过度调整外源因素,这在这里使用的灵活AutoML算法和高度分类的数据类型中尤其成问题。在PGM级别,该模型在“预测精度”和“独创性”类别中赢得了视图竞赛。除了视图竞赛之外,我们预计将高级AutoML系统与反映各种冲突动态的变量相结合的冲突预测模型将具有高预测性能,特别是在次国家和次国家聚合级别。
Forecasting conflict in Africa with automated machine learning systems
Abstract The ViEWS problem is to forecast changes in the level of state-based violence for each of the next six months at the PRIO-GRID and country level. For this competition and toward the goal of improving sub-national and country level forecasts, we experiment with combinations of automated machine learning (autoML) systems and limited datasets that emphasize the endogenous nature of conflict. Two core findings emerge: autoML improves predictive performance and the Dynamics model performs best. The data used for the Dynamics model is limited to measures of state-based violence built from the event-level violence data plus those describing the spatial and temporal structure of the data. The intent is to capture spatial and temporal conflict dynamics while not overfitting to exogenous factors, which is especially problematic with flexible autoML algorithms and the types of highly disaggregate data used here. At the PGM level, this model won the ViEWS competition for “predictive accuracy” and split the win for “originality.” Beyond the ViEWS competition, we expect conflict forecasting models that couple advanced autoML systems with variables that reflect a diverse set of conflict dynamics to have high predictive performance, especially at sub-national and sub-annual aggregations. El problema del ViEWS es que predice los cambios en el nivel de violencia estatal de cada uno de los próximos seis meses a nivel de PRIO-GRID y de país. En el marco de esta competencia y con el objetivo de mejorar las predicciones a nivel regional y nacional, probamos combinaciones de sistemas de aprendizaje automático (autoML) y conjuntos de datos limitados que ponen de relieve la naturaleza endógena de los conflictos. Hay dos resultados principales: el autoML mejora el rendimiento predictivo y el modelo Dynamics es el que mejor funciona. Los datos utilizados para el modelo Dynamics se limitan a las medidas de la violencia a nivel estatal establecidas a partir de los datos de la violencia sobre eventos más los que describen la estructura espacial y temporal de los datos. La intención es captar la dinámica espacial y temporal de los conflictos sin caer en el exceso de ajuste de los factores exógenos, lo que supone un problema, sobre todo con los algoritmos autoML flexibles y los tipos de datos altamente desagregados que se utilizan aquí. A nivel de PGM, este modelo ganó la competencia del ViEWS tanto por su “precisión predictiva” como por su “originalidad”. Más allá de la competencia del ViEWS, esperamos que los modelos de previsión de conflictos que combinan sistemas avanzados de autoML con variables que reflejan un conjunto diverso de dinámicas de conflicto tengan un alto resultado predictivo, sobre todo en agregados regionales y semestrales. La problématique du ViEWS (Violence early-warning system, système d’alerte précoce sur la violence) est de prévoir les évolutions du niveau de violence étatique pour chacun des six prochains mois au niveau de la grille PRIO et au niveau national. Pour ce concours et dans l’objectif d’améliorer les prévisions au niveau infranational et au niveau national, nous avons expérimenté des combinaisons de systèmes de machine learning automatisés (autoML) et de jeux de données limités mettant l’accent sur la nature endogène des conflits. Deux résultats fondamentaux sont apparus : l’autoML améliore les performances prédictives et le modèle Dynamiques est le plus efficace. Les données utilisées pour le modèle Dynamiques sont limitées aux mesures de la violence étatique établies à partir des données sur la violence au niveau des événements ainsi que de celles qui décrivent la structure spatiale et temporelle des données. L’objectif est de capturer les dynamiques spatiales et temporelles des conflits tout en évitant un ajustement excessif aux facteurs exogènes, ce qui est particulièrement problématique avec les algorithmes d’autoML flexibles et les types de données très désagrégées qui sont utilisés ici. Au niveau PGM, ce modèle a remporté le concours ViEWS à la fois dans les catégories « Précision prédictive » et « Originalité ». Au-delà du concours ViEWS, nous nous attendons à ce que les modèles de prévision des conflits qui allient des systèmes avancés d’autoML à des variables reflétant un ensemble diversifié de dynamiques de conflits aient de hautes performances prédictives, en particulier aux niveaux d’agrégation infranationaux et infra-annuels.
期刊介绍:
International Interactions is a leading interdisciplinary journal that publishes original empirical, analytic, and theoretical studies of conflict and political economy. The journal has a particular interest in research that focuses upon the broad range of relations and interactions among the actors in the global system. Relevant topics include ethnic and religious conflict, interstate and intrastate conflict, conflict resolution, conflict management, economic development, regional integration, trade relations, institutions, globalization, terrorism, and geopolitical analyses.