AutoLink首创自主扩展模式链接,突破大规模Text-to-SQL瓶颈
数据派THU
2026-02-01 17:00
文章摘要
背景:Text-to-SQL任务旨在将自然语言问题转换为SQL查询,但面对包含大量表和列的工业级大规模数据库时,直接将完整数据库模式(Schema)输入大语言模型(LLM)会导致计算成本高、噪声干扰和性能下降。研究目的:为解决大规模数据库中的模式链接(Schema Linking)难题,论文提出AutoLink方法,将模式链接从一次性静态筛选转变为由LLM驱动的智能体进行自主探索和渐进式扩展的过程。结论:AutoLink通过构建交互环境(数据库环境和模式向量存储),让智能体执行探索、检索、验证等动作,逐步构建高召回、低噪声的Schema子集。在Spider 2.0-Lite等基准测试中,AutoLink在严格召回率上显著优于现有方法,同时大幅降低token消耗,展现出更强的可扩展性和鲁棒性,为工业级Text-to-SQL提供了高效实用的解决方案。
本站注明稿件来源为其他媒体的文/图等稿件均为转载稿,本站转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请作者速来电或来函联系。