使用 GPT 类型的生成式 IIA 自动提取神经放射学报告中的信息

IF 3 3区医学 Q2 CLINICAL NEUROLOGY

Journal of Neuroradiology Pub Date : 2024-02-24 DOI:10.1016/j.neurad.2024.01.049

Bastien Le Guellec , Grégory Kuchcinsky , Jean-Pierre Pruvo , Philippe Amouyel , Aghiles Hamroun

{"title":"使用 GPT 类型的生成式 IIA 自动提取神经放射学报告中的信息","authors":"Bastien Le Guellec , Grégory Kuchcinsky , Jean-Pierre Pruvo , Philippe Amouyel , Aghiles Hamroun","doi":"10.1016/j.neurad.2024.01.049","DOIUrl":null,"url":null,"abstract":"<div><h3>Introduction</h3><p>Les comptes-rendus de neuro-radiologie contiennent des données riches, à haut potentiel de réutilisation. Récemment, les Large Language Model (LLM) de type GPT ont révolutionné le traitement du langage naturel. Certains d'entre eux, en open-source, peuvent être utilisés sur site sans partage de données à des serveurs tiers (1). Nous avons fait l'hypothèse que ceux-ci pourraient être utilisés pour automatiser l'extraction de données depuis des comptes-rendus de neuro-radiologie. Nous avons utilisé Vicuna, un LLM open-source, afin d'estimer la proportion d'examens positifs parmi les IRM encéphaliques réalisées aux urgences pour céphalées, à partir des seuls comptes-rendus radiologiques.</p></div><div><h3>Méthodes</h3><p>Nous avons revu rétrospectivement les comptes-rendus des 2398 IRM encéphaliques successives passées sur l'IRM des urgences du CHU de Lille en 2022. Nous avons défini 4 variables d'intérêt: 1/ la présence de céphalées dans l'indication 2/ la présnce d'une injection du produit de contraste décrite dans le protocole 3/ la normalité ou non de l'examen 4/ la présence d'une anomalie pouvant expliquer des céphalées. Quatre radiologues ont effectué ces tâches d'extraction manuellement. Vicuna a réalisé les mêmes tâches, et ses performances ont été mesurées en relation avec la vérité établie par le consensus des radiologues.</p></div><div><h3>Résultats</h3><p>Sur les 2398 IRM réalisées aux urgences en 2022, 595 (25%) l'ont été pour des céphalées. Parmi celles-ci, 88%(517/595) ont été injectées, 38%(227/595) étaient anormales et 23%(136/595) comportaient une anomalie pouvant causer des céphalées. Le score F1 pour l'extraction de l'indication était de 98% (95%CI 97-98.7), de 99.6% (99.0-99.9) pour l'injection de produit de contraste, de 97.3% (95.4-98.6) pour la classification en normal/anormal et de 85.4% (80.7-89.3) pour la détection d'une anomalie pouvant causer des caphalées parmi les examens anormaux (fig 1, table 1).</p></div><div><h3>Conclusion</h3><p>Un LLM gratuit et open-source permet d'extraire automatiquement des variables d'intérêt depuis des miliers de comptes-rendus de neuro-radiologie, sans nécessité de ré-entraînement.</p></div>","PeriodicalId":50115,"journal":{"name":"Journal of Neuroradiology","volume":"51 2","pages":"Pages 99-100"},"PeriodicalIF":3.0000,"publicationDate":"2024-02-24","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":"{\"title\":\"UTILISATION DE L'IA GÉNÉRATIVE DE TYPE GPT POUR L'EXTRACTION AUTOMATIQUE D'INFORMATION DEPUIS DES COMPTES-RENDUS DE NEURORADIOLOGIE\",\"authors\":\"Bastien Le Guellec , Grégory Kuchcinsky , Jean-Pierre Pruvo , Philippe Amouyel , Aghiles Hamroun\",\"doi\":\"10.1016/j.neurad.2024.01.049\",\"DOIUrl\":null,\"url\":null,\"abstract\":\"<div><h3>Introduction</h3><p>Les comptes-rendus de neuro-radiologie contiennent des données riches, à haut potentiel de réutilisation. Récemment, les Large Language Model (LLM) de type GPT ont révolutionné le traitement du langage naturel. Certains d'entre eux, en open-source, peuvent être utilisés sur site sans partage de données à des serveurs tiers (1). Nous avons fait l'hypothèse que ceux-ci pourraient être utilisés pour automatiser l'extraction de données depuis des comptes-rendus de neuro-radiologie. Nous avons utilisé Vicuna, un LLM open-source, afin d'estimer la proportion d'examens positifs parmi les IRM encéphaliques réalisées aux urgences pour céphalées, à partir des seuls comptes-rendus radiologiques.</p></div><div><h3>Méthodes</h3><p>Nous avons revu rétrospectivement les comptes-rendus des 2398 IRM encéphaliques successives passées sur l'IRM des urgences du CHU de Lille en 2022. Nous avons défini 4 variables d'intérêt: 1/ la présence de céphalées dans l'indication 2/ la présnce d'une injection du produit de contraste décrite dans le protocole 3/ la normalité ou non de l'examen 4/ la présence d'une anomalie pouvant expliquer des céphalées. Quatre radiologues ont effectué ces tâches d'extraction manuellement. Vicuna a réalisé les mêmes tâches, et ses performances ont été mesurées en relation avec la vérité établie par le consensus des radiologues.</p></div><div><h3>Résultats</h3><p>Sur les 2398 IRM réalisées aux urgences en 2022, 595 (25%) l'ont été pour des céphalées. Parmi celles-ci, 88%(517/595) ont été injectées, 38%(227/595) étaient anormales et 23%(136/595) comportaient une anomalie pouvant causer des céphalées. Le score F1 pour l'extraction de l'indication était de 98% (95%CI 97-98.7), de 99.6% (99.0-99.9) pour l'injection de produit de contraste, de 97.3% (95.4-98.6) pour la classification en normal/anormal et de 85.4% (80.7-89.3) pour la détection d'une anomalie pouvant causer des caphalées parmi les examens anormaux (fig 1, table 1).</p></div><div><h3>Conclusion</h3><p>Un LLM gratuit et open-source permet d'extraire automatiquement des variables d'intérêt depuis des miliers de comptes-rendus de neuro-radiologie, sans nécessité de ré-entraînement.</p></div>\",\"PeriodicalId\":50115,\"journal\":{\"name\":\"Journal of Neuroradiology\",\"volume\":\"51 2\",\"pages\":\"Pages 99-100\"},\"PeriodicalIF\":3.0000,\"publicationDate\":\"2024-02-24\",\"publicationTypes\":\"Journal Article\",\"fieldsOfStudy\":null,\"isOpenAccess\":false,\"openAccessPdf\":\"\",\"citationCount\":\"0\",\"resultStr\":null,\"platform\":\"Semanticscholar\",\"paperid\":null,\"PeriodicalName\":\"Journal of Neuroradiology\",\"FirstCategoryId\":\"3\",\"ListUrlMain\":\"https://www.sciencedirect.com/science/article/pii/S015098612400049X\",\"RegionNum\":3,\"RegionCategory\":\"医学\",\"ArticlePicture\":[],\"TitleCN\":null,\"AbstractTextCN\":null,\"PMCID\":null,\"EPubDate\":\"\",\"PubModel\":\"\",\"JCR\":\"Q2\",\"JCRName\":\"CLINICAL NEUROLOGY\",\"Score\":null,\"Total\":0}","platform":"Semanticscholar","paperid":null,"PeriodicalName":"Journal of Neuroradiology","FirstCategoryId":"3","ListUrlMain":"https://www.sciencedirect.com/science/article/pii/S015098612400049X","RegionNum":3,"RegionCategory":"医学","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"Q2","JCRName":"CLINICAL NEUROLOGY","Score":null,"Total":0}

引用次数: 0

摘要

导言神经放射学报告包含丰富的数据，具有很高的重用潜力。最近，GPT 类型的大型语言模型（LLM）给自然语言处理带来了革命性的变化。其中一些是开源的，可以在现场使用，无需与第三方服务器共享数据 (1)。我们假设这些模型可用于从神经放射学报告中自动提取数据。我们使用开源 LLM Vicuna，仅根据放射学报告就估算出了在头痛急诊科进行的脑部 MRI 检查中阳性检查的比例。我们定义了 4 个相关变量：1/ 指示中是否存在头痛 2/是否存在方案中描述的造影剂注射 3/检查是否正常 4/是否存在可解释头痛的异常。四名放射科医生手动完成了这些提取任务。结果在 2022 年急诊科进行的 2398 次磁共振成像扫描中，有 595 次（25%）是头痛。其中，88%（517/595）为注射，38%（227/595）为异常，23%（136/595）为可导致头痛的异常。适应症提取的 F1 得分为 98% (95%CI 97-98.7)，造影剂注射的 F1 得分为 99.6% (99.0-99.9)，正常/异常分类的 F1 得分为 97.3% (95.4-98.6)，异常检测的 F1 得分为 85.4% (80.7-89.3)。结论免费、开源的 LLM 可以从数千份神经放射学报告中自动提取感兴趣的变量，而无需重新训练。

本文章由计算机程序翻译，如有差异，请以英文原文为准。

查看原文本刊更多论文

UTILISATION DE L'IA GÉNÉRATIVE DE TYPE GPT POUR L'EXTRACTION AUTOMATIQUE D'INFORMATION DEPUIS DES COMPTES-RENDUS DE NEURORADIOLOGIE

Introduction

Les comptes-rendus de neuro-radiologie contiennent des données riches, à haut potentiel de réutilisation. Récemment, les Large Language Model (LLM) de type GPT ont révolutionné le traitement du langage naturel. Certains d'entre eux, en open-source, peuvent être utilisés sur site sans partage de données à des serveurs tiers (1). Nous avons fait l'hypothèse que ceux-ci pourraient être utilisés pour automatiser l'extraction de données depuis des comptes-rendus de neuro-radiologie. Nous avons utilisé Vicuna, un LLM open-source, afin d'estimer la proportion d'examens positifs parmi les IRM encéphaliques réalisées aux urgences pour céphalées, à partir des seuls comptes-rendus radiologiques.

Méthodes

Nous avons revu rétrospectivement les comptes-rendus des 2398 IRM encéphaliques successives passées sur l'IRM des urgences du CHU de Lille en 2022. Nous avons défini 4 variables d'intérêt: 1/ la présence de céphalées dans l'indication 2/ la présnce d'une injection du produit de contraste décrite dans le protocole 3/ la normalité ou non de l'examen 4/ la présence d'une anomalie pouvant expliquer des céphalées. Quatre radiologues ont effectué ces tâches d'extraction manuellement. Vicuna a réalisé les mêmes tâches, et ses performances ont été mesurées en relation avec la vérité établie par le consensus des radiologues.

Résultats

Sur les 2398 IRM réalisées aux urgences en 2022, 595 (25%) l'ont été pour des céphalées. Parmi celles-ci, 88%(517/595) ont été injectées, 38%(227/595) étaient anormales et 23%(136/595) comportaient une anomalie pouvant causer des céphalées. Le score F1 pour l'extraction de l'indication était de 98% (95%CI 97-98.7), de 99.6% (99.0-99.9) pour l'injection de produit de contraste, de 97.3% (95.4-98.6) pour la classification en normal/anormal et de 85.4% (80.7-89.3) pour la détection d'une anomalie pouvant causer des caphalées parmi les examens anormaux (fig 1, table 1).

Conclusion

Un LLM gratuit et open-source permet d'extraire automatiquement des variables d'intérêt depuis des miliers de comptes-rendus de neuro-radiologie, sans nécessité de ré-entraînement.

求助全文

通过发布文献求助，成功后即可免费获取论文全文。去求助

来源期刊

Journal of Neuroradiology 医学-核医学

CiteScore

6.10

自引率

5.70%

发文量

142

审稿时长

6-12 weeks

期刊介绍： The Journal of Neuroradiology is a peer-reviewed journal, publishing worldwide clinical and basic research in the field of diagnostic and Interventional neuroradiology, translational and molecular neuroimaging, and artificial intelligence in neuroradiology. The Journal of Neuroradiology considers for publication articles, reviews, technical notes and letters to the editors (correspondence section), provided that the methodology and scientific content are of high quality, and that the results will have substantial clinical impact and/or physiological importance.