发布求助

文献互助智能选刊最新文献

戳破AI for Science幻象，"深度原理"为AI科学能力立下新标尺

果壳硬科技 2026-01-19 13:00

文章摘要

本文背景是AI for Science领域快速发展，但现有AI模型评测多基于传统选择题，难以反映真实科研能力。研究目的是通过深度原理团队提出的科学发现评估（SDE）体系，对GPT-5等顶级大模型进行实战化评测，检验其在完整科研流程中的表现。结论显示，模型在SDE中平均分大幅低于传统考试，尤其在硬核问题上表现不佳，表明当前大模型存在“高分低能”现象，技术路径存在天花板；同时，OpenAI的类似评测也印证了这一点，标志着领域需重新审视方向，未来应发展垂直专业AI工具，并革新训练方式以注入科学思维。

戳破AI for Science幻象，"深度原理"为AI科学能力立下新标尺

本站注明稿件来源为其他媒体的文/图等稿件均为转载稿，本站转载出于非商业性的教育和科研之目的，并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题，请作者速来电或来函联系。

果壳硬科技

从4小时到39秒：AI如何重塑气象预报｜论文解读

从4小时到39秒：AI如何重塑气象预报｜论文解读. 2026-03-06

弯道超车？国产具身，千小时人类数据激发智能涌现

弯道超车？国产具身，千小时人类数据激发智能涌现. 2026-03-05

独家对话极映科技高鑫：我们为什么要做一个比Sora难10倍的物理世界模型？

独家对话极映科技高鑫：我们为什么要做一个比Sora难10倍的物理世界模型？. 2026-02-09

能屈能伸，清华任天令团队发布全球首款高性能柔性AI芯片｜论文解读

能屈能伸，清华任天令团队发布全球首款高性能柔性AI芯片｜论文解读. 2026-02-03

当“机器人科学家”登上顶刊封面：AI驱动钙钛矿量子点研发新范式

当“机器人科学家”登上顶刊封面：AI驱动钙钛矿量子点研发新范式. 2026-01-30

最新文章

Joule：粘附功指导成核控制，深入理解钾金属电池枝晶问题！

Joule：粘附功指导成核控制，深入理解钾金属电池枝晶问题！ 2026-04-02

复旦/南大/东京大学合作，Nature！

复旦/南大/东京大学合作，Nature！ 2026-04-02

新加坡国立大学（NUS）鲁俊课题组诚聘博士后及博士生

新加坡国立大学（NUS）鲁俊课题组诚聘博士后及博士生 2026-04-02

购买研理云服务器，让计算更省心！免费测试！

购买研理云服务器，让计算更省心！免费测试！ 20小时前

热门类别

综合性期刊物理法学地球科学历史学

相关文章

中国民航大学接收材料科学与工程，物理学，航空制造工程调剂研究生燕山大学环化学院招收调剂（电池和离子热电方向）中科院新疆理化所诚聘能源电化学方向博士后、博士和科研助理启事天津科技大学-（院士团队）先进纤维与纸基功能材料课题组招收2026硕士调剂生破解T细胞“能量分配”之谜！《Cell》揭示半胱氨酸如何分两路决定免疫细胞的杀伤与增殖

联系我们：info@booksci.cn Book学术提供免费学术资源搜索服务，方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。 Copyright © 2023 布克学术 All rights reserved.
京ICP备2023020795号-1

京公网安备 11010802042870号

Book学术文献互助

Book学术文献互助群
群号：604180095

Book学术官方微信