Valutazione comparativa di modelli linguistici di grandi dimensioni per il supporto all’educazione sanitaria del paziente con BPCO: uno studio pneumologico internazionale delle risposte generate da ChatGPT-4, Claude 3.5 Sonnet e Gemini 1.5 Advanced.

Q3 Medicine

Recenti progressi in medicina Pub Date : 2025-10-01 DOI:10.1701/4573.45780

Guido Marchi, Giulia Gambini, Giacomo Guglielmi, Francesco Pistelli, Laura Carrozzi

引用次数: 0

Abstract

Three LLMs - ChatGPT-4, Claude 3.5 Sonnet and Gemini 1.5 Advanced - were evaluated on COPD questions from the GOLD recommendations. Sixty-one pulmonologists from 6 continents rated 90 AI responses for completeness, accuracy, terminology, accessibility, and safety. Gemini outperformed in completeness, Claude in accuracy and terminology, with no differences in accessibility or safety. While promising, clinical use requires caution and further validation to ensure safe, accurate patient education.

查看原文本刊更多论文

支持BPCO患者健康教育的大型语言模型的比较:一项关于ChatGPT-4、Claude 3.5十四行诗和双子座1.5高级响应的国际肺学研究。

三位法学硕士- ChatGPT-4， Claude 3.5 Sonnet和Gemini 1.5 Advanced -根据GOLD建议对COPD问题进行评估。来自六大洲的61位肺科医生对90个人工智能回答的完整性、准确性、术语、可及性和安全性进行了评分。双子星座在完整性方面优于克劳德，在准确性和术语方面优于克劳德，在可及性和安全性方面没有差异。虽然前景看好，但临床应用需要谨慎和进一步验证，以确保安全、准确的患者教育。

本文章由计算机程序翻译，如有差异，请以英文原文为准。

求助全文

约1分钟内获得全文求助全文

来源期刊

Recenti progressi in medicina Medicine-Medicine (all)

CiteScore

0.90

自引率

0.00%

发文量

143

期刊介绍： Giunta ormai al sessantesimo anno, Recenti Progressi in Medicina continua a costituire un sicuro punto di riferimento ed uno strumento di lavoro fondamentale per l"ampliamento dell"orizzonte culturale del medico italiano. Recenti Progressi in Medicina è una rivista di medicina interna. Ciò significa il recupero di un"ottica globale e integrata, idonea ad evitare sia i particolarismi della informazione specialistica sia la frammentazione di quella generalista.