Valutazione comparativa di modelli linguistici di grandi dimensioni per il supporto all’educazione sanitaria del paziente con BPCO: uno studio pneumologico internazionale delle risposte generate da ChatGPT-4, Claude 3.5 Sonnet e Gemini 1.5 Advanced.
Guido Marchi, Giulia Gambini, Giacomo Guglielmi, Francesco Pistelli, Laura Carrozzi
{"title":"Valutazione comparativa di modelli linguistici di grandi dimensioni per il supporto all’educazione sanitaria del paziente con BPCO: uno studio pneumologico internazionale delle risposte generate da ChatGPT-4, Claude 3.5 Sonnet e Gemini 1.5 Advanced.","authors":"Guido Marchi, Giulia Gambini, Giacomo Guglielmi, Francesco Pistelli, Laura Carrozzi","doi":"10.1701/4573.45780","DOIUrl":null,"url":null,"abstract":"<p><p>Three LLMs - ChatGPT-4, Claude 3.5 Sonnet and Gemini 1.5 Advanced - were evaluated on COPD questions from the GOLD recommendations. Sixty-one pulmonologists from 6 continents rated 90 AI responses for completeness, accuracy, terminology, accessibility, and safety. Gemini outperformed in completeness, Claude in accuracy and terminology, with no differences in accessibility or safety. While promising, clinical use requires caution and further validation to ensure safe, accurate patient education.</p>","PeriodicalId":20887,"journal":{"name":"Recenti progressi in medicina","volume":"116 10","pages":"571-572"},"PeriodicalIF":0.0000,"publicationDate":"2025-10-01","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Recenti progressi in medicina","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.1701/4573.45780","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"Q3","JCRName":"Medicine","Score":null,"Total":0}
引用次数: 0
Abstract
Three LLMs - ChatGPT-4, Claude 3.5 Sonnet and Gemini 1.5 Advanced - were evaluated on COPD questions from the GOLD recommendations. Sixty-one pulmonologists from 6 continents rated 90 AI responses for completeness, accuracy, terminology, accessibility, and safety. Gemini outperformed in completeness, Claude in accuracy and terminology, with no differences in accessibility or safety. While promising, clinical use requires caution and further validation to ensure safe, accurate patient education.
期刊介绍:
Giunta ormai al sessantesimo anno, Recenti Progressi in Medicina continua a costituire un sicuro punto di riferimento ed uno strumento di lavoro fondamentale per l"ampliamento dell"orizzonte culturale del medico italiano. Recenti Progressi in Medicina è una rivista di medicina interna. Ciò significa il recupero di un"ottica globale e integrata, idonea ad evitare sia i particolarismi della informazione specialistica sia la frammentazione di quella generalista.