纳米晶数据库+大语言模型助力逆向合成设计
材料人
2026-06-16 10:10
文章摘要
随着人工智能的快速发展,深度学习在材料结构预测上取得显著进展,但材料化学领域仍面临“知其结构不知其造法”的困境,传统“试错法”低效且耗时。北京理工大学研究团队开发了名为NanoExtractor的大语言模型,通过四种数据增强策略(文本重写、构造负样本、强制输出“NOT MENTION”、置信度校准),从海量非结构化文献中精准提取合成路线与产物性质,构建了包含近16万条对齐数据的纳米晶合成-性质数据库(NSP数据库)。基于该数据库,团队进一步开发了逆向合成设计模型NanoDesigner,输入目标产物、限定反应物和期望性质即可输出具体、可执行的合成路线,F1得分达0.85,ROUGE得分为0.42。实验验证表明,NanoDesigner能识别反常规的合成条件,如在MgF2纳米晶合成中推荐非化学计量比前驱体浓度以抑制副产物,优于GPT等通用大模型。该成果以“A Large-Scale Nanocrystal Database with Aligned Synthesis and Properties, Enabling Generative Inverse Design”为题发表于ACS Nano,为纳米材料的逆向合成设计提供了关键数据基础和高效模型,有望推动纳米材料高效、精准的“所想即所得”。
本站注明稿件来源为其他媒体的文/图等稿件均为转载稿,本站转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请作者速来电或来函联系。