中国的平价开源AI模型DeepSeek惊艳全球科学家
自然系列
2025-01-27 12:40
文章摘要
本文介绍了中国公司DeepSeek推出的开源大语言模型DeepSeek-R1,该模型在推理任务中的表现与OpenAI的o1模型相媲美。DeepSeek-R1的开源特性允许科研人员研究和继续构建该算法,尽管其训练数据未公开。该模型在特定化学、数学和代码任务上的表现与o1相当,且成本仅为o1的1/30。DeepSeek的进展表明,有效利用现有资源比只关注计算规模更重要,同时也缩小了中美在AI领域的差距。DeepSeek-R1的成功在于其“思维链”方法和强化学习的应用,这些方法提升了模型解决复杂任务的能力。
本站注明稿件来源为其他媒体的文/图等稿件均为转载稿,本站转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请作者速来电或来函联系。