发布求助

文献互助智能选刊最新文献

如何合成Agentic事实性SFT/Mid-train数据？

机器学习算法与自然语言处理 2026-05-18 00:07

文章摘要

本文主要探讨如何合成Agentic事实性SFT/Mid-train数据。背景指出，简单的直接问答训练无法满足需要模型进行可观察、可验证和可复盘求证过程的需求。研究目的在于训练模型在面对事实性问题时，能主动判断是否需要检索、如何查找并评估证据，最终给出有依据的结论，而非仅凭记忆。通过将Query分类（如时效事实类、给定文档问答类等），并设计“轨迹数据”结构（包含问题、类别、证据和回应），文章详细阐述了数据合成流程。结论强调，Mid-train数据应侧重底层能力训练（如拆解claim、判断证据支持/反驳），而SFT数据则偏重行为对齐（如何时检索、如何引用证据）。文章最后提出了一个可行的合成流水线，包括清洗、分类、构造证据包、生成轨迹样本、验证和写入数据，并指出了常见陷阱（如observation凭空写、问题无差别联网等）。

如何合成Agentic事实性SFT/Mid-train数据？

本站注明稿件来源为其他媒体的文/图等稿件均为转载稿，本站转载出于非商业性的教育和科研之目的，并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题，请作者速来电或来函联系。

机器学习算法与自然语言处理

Attention Is All You Need作者再出手：Transformer 99%稀疏，还能更快？

Attention Is All You Need作者再出手：Transformer 99%稀疏，还能更快？. 2026-05-20

LLM近期重大架构进化一览：从Gemma4到DeepSeekV4

LLM近期重大架构进化一览：从Gemma4到DeepSeekV4. 2026-05-20

编程新王Composer 2.5来了，逼近Opus 4.7！成本仅为1/10

编程新王Composer 2.5来了，逼近Opus 4.7！成本仅为1/10. 2026-05-20

王云鹤眼中的Harness：复杂优化问题，AGI灵魂争夺之战

王云鹤眼中的Harness：复杂优化问题，AGI灵魂争夺之战. 2026-05-19

从P(y|x)到P(y)：将RL引入预训练空间，激发大模型内生推理

从P(y|x)到P(y)：将RL引入预训练空间，激发大模型内生推理. 2026-05-19

最新文章

编程新王Composer 2.5来了，逼近Opus 4.7！成本仅为1/10

编程新王Composer 2.5来了，逼近Opus 4.7！成本仅为1/10 2026-05-20

LLM近期重大架构进化一览：从Gemma4到DeepSeekV4

LLM近期重大架构进化一览：从Gemma4到DeepSeekV4 2026-05-20

Attention Is All You Need作者再出手：Transformer 99%稀疏，还能更快？

Attention Is All You Need作者再出手：Transformer 99%稀疏，还能更快？ 2026-05-20

从P(y|x)到P(y)：将RL引入预训练空间，激发大模型内生推理

从P(y|x)到P(y)：将RL引入预训练空间，激发大模型内生推理 2026-05-19

热门类别

综合性期刊物理法学地球科学历史学

相关文章

中科院金属所《Science Advances》：发现晶界电子态重构提升导电性余钊飞新书 |《“枫桥经验”与自治、法治、德治相结合的乡村治理体系建设研究》 JIA优先上线 | 西北农林科技大学庞卫军团队提出基于代谢极化的猪精子性别分选新策略【前沿进展】Cell Reports Medicine | 赵扬/谈伟强/杨勇/毕洪森团队联合报道新型抗瘢痕化合物，揭示线粒体解偶联逆转皮肤纤维化新机制【5·30科技工作者日】习语金句 | “要以更大力度、更实举措加强基础研究”

联系我们：info@booksci.cn Book学术提供免费学术资源搜索服务，方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。 Copyright © 2023 布克学术 All rights reserved.
京ICP备2023020795号-1

京公网安备 11010802042870号

Book学术文献互助

Book学术文献互助群
群号：604180095

Book学术官方微信

小红书