发布求助

文献互助智能选刊最新文献

如何合成Agentic事实性SFT/Mid-train数据？

机器学习算法与自然语言处理 2026-05-28 08:07

文章摘要

本文探讨了如何合成用于训练模型Agentic事实性能力的数据，包括SFT和Mid-train数据。背景在于传统事实问答仅训练模型输出答案，而目标模型需要掌握一套可观察、可验证的求证过程。研究目的在于设计能训练模型主动检索、评估证据、处理冲突、在不确定时拒答的数据。结论指出：核心是生成“问题→检索→证据判断→回答”的轨迹；Query需筛选能产生有价值轨迹的复杂问题；需对Query打分类和处理标签以指导生成；轨迹数据应包含query、类别、证据和response；Mid-train与SFT数据目标不同，前者侧重能力训练，后者侧重行为对齐；最后提出可执行的合成流水线，并指出容易踩的坑包括observation凭空写、只看最终答案等。

如何合成Agentic事实性SFT/Mid-train数据？

本站注明稿件来源为其他媒体的文/图等稿件均为转载稿，本站转载出于非商业性的教育和科研之目的，并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题，请作者速来电或来函联系。

机器学习算法与自然语言处理

我用Codex做研究后，总结出6条有用经验！

我用Codex做研究后，总结出6条有用经验！. 2026-05-28

发不了Nature？没关系，你投的Rubbish被它翻牌了

发不了Nature？没关系，你投的Rubbish被它翻牌了. 2026-05-28

35B参数科学性能比肩万亿参数模型，『书生』科学大模型Intern-S2-Preview开源

35B参数科学性能比肩万亿参数模型，『书生』科学大模型Intern-S2-Preview开源. 2026-05-28

GPT-5.6泄露了！

GPT-5.6泄露了！. 2026-05-26

程子豪@北京航空航天大学：Terminal-World：面向终端智能体的大规模环境合成

程子豪@北京航空航天大学：Terminal-World：面向终端智能体的大规模环境合成. 2026-05-26

最新文章

如何合成Agentic事实性SFT/Mid-train数据？

如何合成Agentic事实性SFT/Mid-train数据？ 2026-05-28

35B参数科学性能比肩万亿参数模型，『书生』科学大模型Intern-S2-Preview开源

35B参数科学性能比肩万亿参数模型，『书生』科学大模型Intern-S2-Preview开源 2026-05-28

发不了Nature？没关系，你投的Rubbish被它翻牌了

发不了Nature？没关系，你投的Rubbish被它翻牌了 2026-05-28

我用Codex做研究后，总结出6条有用经验！

我用Codex做研究后，总结出6条有用经验！ 2026-05-28

热门类别

综合性期刊物理法学地球科学历史学

相关文章

一句优秀脏话需要具备什么素质？数学博士用公式算出“世界终极脏话” Adv Sci丨李胜团队发现“时空蛋白”NFYB整合激素信号调控动物身体形态新机制 J Hepatol | 魏俊成/冷泠团队联合揭示MARCHF6是MASLD干预的治疗新靶点一种兼具“高弹性+高锂通量”的弹性电解质，实现锂金属电池低温高电压稳定运行华南理工大学钱勇/SES AI Corp 许康JACS：新型木质素功能化超分子粘结剂助力高电压锂离子电池实现性能突破

联系我们：info@booksci.cn Book学术提供免费学术资源搜索服务，方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。 Copyright © 2023 布克学术 All rights reserved.
京ICP备2023020795号-1

京公网安备 11010802042870号

Book学术文献互助

Book学术文献互助群
群号：604180095

Book学术官方微信

小红书