PI | 大语言模型在儿科诊断中的应用:基于常见病与罕见病真实临床病历的性能评估

Wiley威立 2026-05-21 07:00
文章摘要
本研究针对大语言模型在儿科诊断中的应用,尤其是常见病与罕见病的性能评估。背景方面,儿科疾病诊断面临挑战,罕见病诊断延迟问题突出,大语言模型展现出辅助诊断的潜力,但现有研究多基于人工病例摘要,缺乏真实临床场景下的多模型对比。研究目的为填补这一空白,评估多款大语言模型在真实儿科初诊病历中的诊断表现,并与临床医生进行对比。研究在西班牙一家儿童医院开展,选取50例真实病例(常见病与罕见病各25例),使用DxGPT、Claude-3.5 Sonnet、GPT-4o和o1-preview四款模型,与78名医生进行对比。结论显示,顶级大语言模型(如o1-preview和Claude-3.5 Sonnet)在罕见病诊断中准确率显著高于临床医生,补充额外临床信息可进一步提升性能,且大语言模型与医生呈现双向互补性,联合诊断准确率最高达94.3%。然而,高准确率模型的一致性较低,临床落地仍面临监管和伦理挑战。研究强调人机协同是儿科诊断AI工具的核心方向。
PI | 大语言模型在儿科诊断中的应用:基于常见病与罕见病真实临床病历的性能评估
本站注明稿件来源为其他媒体的文/图等稿件均为转载稿,本站转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请作者速来电或来函联系。
Wiley威立
最新文章
热门类别
相关文章
联系我们:info@booksci.cn Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。 Copyright © 2023 布克学术 All rights reserved.
京ICP备2023020795号-1
ghs 京公网安备 11010802042870号
Book学术文献互助
Book学术文献互助群
群 号:604180095
Book学术官方微信
小红书