Utilisation des arbres décisionnels dans la recherche en surveillance de la santé de la population : application aux données d’enquête sur la santé mentale des jeunes de l’étude COMPASS
Katelyn Battista, Liqun Diao, Karen A. Patte, J. Dubin, S. T. Leatherdale
{"title":"Utilisation des arbres décisionnels dans la recherche en surveillance de la santé de la population : application aux données d’enquête sur la santé mentale des jeunes de l’étude COMPASS","authors":"Katelyn Battista, Liqun Diao, Karen A. Patte, J. Dubin, S. T. Leatherdale","doi":"10.24095/hpcdp.43.2.03f","DOIUrl":null,"url":null,"abstract":"\n Introduction\n Dans la recherche en surveillance de la santé de la population, les données d’enquête sont couramment analysées à l’aide de méthodes de régression. Or ces méthodes disposent d’une capacité limitée à analyser les relations complexes. À l’opposé, les modèles d’arbres décisionnels sont parfaitement adaptés pour segmenter les populations et étudier les interactions complexes entre facteurs, et leur utilisation dans la recherche en santé est en pleine croissance. Cet article fournit un aperçu de la méthodologie des arbres décisionnels et de leur application aux données d’enquête sur la santé mentale des jeunes.\n \n \n Methods\n La performance de deux techniques courantes de construction d’arbres décisionnels, soit l’arbre de classification et de régression (CART) et l’arbre d’inférence conditionnelle (CTREE), est comparée aux modèles classiques de régression linéaire et logistique par le biais d’une application aux résultats en santé mentale des jeunes de l’étude COMPASS. Les données ont été recueillies auprès de 74 501 élèves de 136 écoles au Canada. L’anxiété, la dépression et le bien‑être psychologique ont été mesurés, de même que 23 variables sociodémographiques et facteurs de prédiction des comportements liés à la santé. La performance du modèle a été évaluée au moyen de mesures de prédiction de l’exactitude, de la parcimonie et de l’importance relative des variables. \n \n \n Results\n Les modèles d’arbres décisionnels et les modèles de régression ont systématiquement mis en évidence les mêmes ensembles de facteurs de prédiction les plus importants pour chaque résultat, ce qui indique un niveau général de concordance entre méthodes. Trois modèles ont présenté une exactitude prédictive plus faible, mais se caractérisent par une plus grande parcimonie et accordent une importance relative plus élevée aux principaux facteurs de différenciation.\n \n \n Conclusion\n Les arbres décisionnels permettent de cerner les sous-groupes à risque élevé qu’il convient de cibler dans le cadre des efforts de prévention et d’intervention. Ils constituent donc un outil utile pour répondre aux questions de recherche auxquelles les méthodes de régression classiques ne peuvent pas répondre.\n","PeriodicalId":371766,"journal":{"name":"Promotion de la santé et prévention des maladies chroniques au Canada","volume":"31 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2023-02-01","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Promotion de la santé et prévention des maladies chroniques au Canada","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.24095/hpcdp.43.2.03f","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0
Abstract
Introduction
Dans la recherche en surveillance de la santé de la population, les données d’enquête sont couramment analysées à l’aide de méthodes de régression. Or ces méthodes disposent d’une capacité limitée à analyser les relations complexes. À l’opposé, les modèles d’arbres décisionnels sont parfaitement adaptés pour segmenter les populations et étudier les interactions complexes entre facteurs, et leur utilisation dans la recherche en santé est en pleine croissance. Cet article fournit un aperçu de la méthodologie des arbres décisionnels et de leur application aux données d’enquête sur la santé mentale des jeunes.
Methods
La performance de deux techniques courantes de construction d’arbres décisionnels, soit l’arbre de classification et de régression (CART) et l’arbre d’inférence conditionnelle (CTREE), est comparée aux modèles classiques de régression linéaire et logistique par le biais d’une application aux résultats en santé mentale des jeunes de l’étude COMPASS. Les données ont été recueillies auprès de 74 501 élèves de 136 écoles au Canada. L’anxiété, la dépression et le bien‑être psychologique ont été mesurés, de même que 23 variables sociodémographiques et facteurs de prédiction des comportements liés à la santé. La performance du modèle a été évaluée au moyen de mesures de prédiction de l’exactitude, de la parcimonie et de l’importance relative des variables.
Results
Les modèles d’arbres décisionnels et les modèles de régression ont systématiquement mis en évidence les mêmes ensembles de facteurs de prédiction les plus importants pour chaque résultat, ce qui indique un niveau général de concordance entre méthodes. Trois modèles ont présenté une exactitude prédictive plus faible, mais se caractérisent par une plus grande parcimonie et accordent une importance relative plus élevée aux principaux facteurs de différenciation.
Conclusion
Les arbres décisionnels permettent de cerner les sous-groupes à risque élevé qu’il convient de cibler dans le cadre des efforts de prévention et d’intervention. Ils constituent donc un outil utile pour répondre aux questions de recherche auxquelles les méthodes de régression classiques ne peuvent pas répondre.