Valutazione del ragionamento clinico dei reasoning large language models su casi clinici complessi.

Q3 Medicine

Recenti progressi in medicina Pub Date : 2025-10-01 DOI:10.1701/4573.45794

Vittorio De Vita, Bianca Destro Castaniti, Mariapia Vassalli, Lorenzo De Mori, Doriana Lacalaprice, Emanuele Arcà, Antonio Cristiano, Chiara Battipaglia, Pietro Eric Risuleo, Tommaso Dionisi, Francesco Andrea Causio

引用次数: 0

Abstract

Large language models (LLMs) show promise in explicit reasoning for complex medical fields like psychiatry. This study assessed the clinical validity of Gemini's chain-of-thought (CoT) reasoning in 10 complex psychiatric cases, evaluated by specialists using six metrics. Results indicate high performance (average score ≥4.26/5), especially in step sufficiency and factual accuracy, suggesting that CoT reasoning by LLMs can support transparent and detailed clinical decision-making.

查看原文本刊更多论文

复杂临床病例中大型语言模型推理的临床评估。

大型语言模型（llm）在精神病学等复杂医学领域的显式推理中显示出前景。本研究评估了10个复杂精神病例中双子座思维链推理的临床有效性，由专家使用6个指标进行评估。结果表明，LLMs的CoT推理在步骤充分性和事实准确性方面表现优异（平均得分≥4.26/5），表明LLMs的CoT推理可以支持透明、详细的临床决策。

本文章由计算机程序翻译，如有差异，请以英文原文为准。

求助全文

约1分钟内获得全文求助全文

来源期刊

Recenti progressi in medicina Medicine-Medicine (all)

CiteScore

0.90

自引率

0.00%

发文量

143

期刊介绍： Giunta ormai al sessantesimo anno, Recenti Progressi in Medicina continua a costituire un sicuro punto di riferimento ed uno strumento di lavoro fondamentale per l"ampliamento dell"orizzonte culturale del medico italiano. Recenti Progressi in Medicina è una rivista di medicina interna. Ciò significa il recupero di un"ottica globale e integrata, idonea ad evitare sia i particolarismi della informazione specialistica sia la frammentazione di quella generalista.