物质学院胡培君课题组提出新一代机器学习势函数训练方法

发布时间2025-09-29文章来源 物质科学与技术学院作者责任编辑刘玥

机器学习势函数(MLP)在多相催化研究中通常依赖于“系统特定”的数据采样,即围绕特定催化剂结构与反应坐标构建数据集并进行分子动力学采样。该方法易造成数据冗余与泛化通用能力不足,难以像密度泛函理论(DFT) 那样对任意结构进行“所见即算”的通用计算。近日,上海科技大学物质科学与技术学院胡培君教授与谢闻博助理研究员提出了新一代元素基通用型机器学习势函数(EMLP)的采样和训练方法。相关成果以“General reactive element-based machine learning potentials for heterogeneous catalysis”为题,发表在国际学术期刊《自然-催化》(Nature Catalysis)。

他们发展了一种势函数训练新方法(REICO),通过算法生成并优化“小体系”,摆脱对特定结构与反应坐标的依赖,将采样从“结构空间”转向“原子相互作用空间”。此模型可在小体系中学习可迁移的原子间的相互作用并推广至大体系,实现了接近 DFT 的通用预测,在多种催化反应中展现出与DFT一致的高精度,具备跨体系通用能力,为大规模复杂催化体系模拟提供了高效可靠的DFT替代方案,也为新一代大原子模型提供了新的训练思路,推动机器学习势函数从“专用”走向“通用”,在多相催化、材料、生物化学等领域具有广阔应用前景。

 

图1. EMLP 训练流程。其中RECIO方法中完全摆脱结构空间,专注于原子间相互作用训练集数据生成、元素基机器学习势函数(EMLP)训练流程以及训练出的势函数模型在多相催化中的应用。


2. EMLP可以广泛应用在各种化学体系中,实现了气固液多相体系的统一精确描述,超越了传统机器学习势函数的应用局限。EMLP不仅能准确预测多相催化反应,还能用于计算有机化学反应、表面动力学和溶液环境,展示了其真正的通用性。


上海科技大学物质学院胡培君课题组联培研究生杨昌熙、吴辰宇,助理研究员谢闻博为共同第一作者。谢闻博、胡培君教授为共同通讯作者。

论文链接:https://www.nature.com/articles/s41929-025-01398-3