2025年8月15日,在中国计算机学会(CCF)主办的第21届CCF全国高性能计算学术年会上,经过五支入围最终评选的团队激烈角逐,北京大学力学与工程科学学院陈帜研究员带领的DeepFlame团队脱颖而出,其主导开展的“深度学习赋能的超大规模高精度火箭发动机超临界燃烧流体模拟”工作夺得“CCF HPC China 2025超算年度最佳应用”奖项。该奖项是中国高性能计算领域最具权威性和影响力的奖项之一,在国内被誉为与戈登贝尔奖比肩的重磅荣誉。该奖项每年仅授予一到两项成果,旨在表彰超算应用中取得重大创新突破、具备突出科学价值与工程影响力的成果,代表了我国高性能计算应用研究的最高水准。
获奖团队成员(从左至右):陈帜、毛润泽、郭卓强、贾伟乐
本次获奖工作由陈帜团队研发的智能计算软件 DeepFlame完成。作为首个耦合AI模型与高性能计算技术的反应流体仿真平台,DeepFlame 致力于推动数值模拟领域的AI for Science研究。自2022年发布V0.1公测版以来,软件已持续迭代三年,先后完成对英伟达GPU、华为 Kunpeng、曙光 DCU等国内外硬件的适配与优化,受到学界与产业界的广泛关注。相关成果曾2022和2023连续两年荣获中国科学院“先导杯”全国应用大赛一等奖。
计算性能提升
在本次工作中,参赛团队对DeepFlame软件进行了进一步高性能优化与改进,实现了迄今最大规模的火箭燃烧模拟(考虑超临界效应和详细化学精度),计算域包含近万亿网格,并行规模达到4000万核(国产神威超算整机),峰值浮点运算性能创纪录地超过1EFlops(百亿亿次每秒)。与现有最先进方法相比,DeepFlame将计算加速提升了三个数量级(超1000倍),并将现有燃烧模拟技术的网格规模拓展了四个量级,并行节点数拓展三个量级,充分展现了国产超算与自主软件在重大工程应用中的强大潜力。该工作已被国际高性能计算顶级会议——International Conference for High Performance Computing, Networking, Storage and Analysis (SC25) 接收。
具体而言,本次工作在方法与实现上均取得了重要突破。首先,团队提出了基于流形增强采样的物理嵌入刚性神经算子,有效提升了DeepFlame计算过程中AI模型的稳定性与精度。其次,面向超大规模并行需求及国产神威超算的硬件特性,研发了两阶段并行策略,并提出了基于算子合并的多运行时I/O优化方法,显著改善了超大规模计算的输入输出效率。在数值求解层面,团队通过引入定制稀疏矩阵格式与线程级网格重排,构建了适配国产众核架构的高效隐式偏微分方程求解器;同时,对神经网络推理算子进行了定制化优化,实现了AI模型与数值计算的高效融合。这些创新不仅显著增强了DeepFlame在超大规模计算中的性能与鲁棒性,也为AI for Science与科学计算的发展提供了具有代表性的范例与方法论参考。
本项工作得到了国家自然科学基金“可解释、可通用的下一代人工智能方法重大研究计划”“人工智能赋能工程科学前沿探索专项”、北京大学鲲鹏昇腾科教创新卓越中心的资助,以及蓝箭航天空间科技有限公司、华为技术有限公司、崂山国家实验室等合作伙伴的大力支持。北京大学力学与工程科学学院博士生毛润泽和中国科学院计算技术研究所博士生郭卓强为共同第一作者,陈帜和中国科学院计算技术研究所贾伟乐研究员为共同通讯作者。
信息来源: 北大力学与工程科学学院