【J. Org. Chem.】大连理工大学本科生作为第一作者:优化挑战性Heck反应产率数据集模型学习性能
CBG资讯
2025-09-10 11:19
文章摘要
背景:机器学习在有机合成预测中面临数据质量与完整性的挑战,现有数据集存在规模小或分布稀疏等问题。研究目的:构建大规模Heck反应产率数据集HeckLit,并探索优化策略以提升机器学习模型预测性能。结论:通过子集分割训练策略(SSTS)显著提升模型预测效果(R²从0.318增至0.380),为处理稀疏不平衡化学数据提供新思路,同时指出未来需关注负样本采集与大语言模型结合等方向。
本站注明稿件来源为其他媒体的文/图等稿件均为转载稿,本站转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请作者速来电或来函联系。