背景
近年来,伴随着越来越多的生命科学及物理学家们将数值计算和数值模拟作为其重要的科学研究和手段,高校中的高性能计算需求与日俱
增。上海交大作为传统理工科强校,校内对计算资源的需求尤其迫切,传统的单纯由 CPU 构建的超级计算机,无论在可支持的计算规模
还是在计算效率上都无法满足这么巨大的需求。相较于 CPU,GPU 具有支持高并发并行计算的特点。以分子动力学模拟为例,许多应用在
GPU 上能获得更高的性能,从而缩短模拟周期以及扩大模拟规模,这都将极大推动科研人员的研究进展。
挑战
分子动力学模拟是一种物质微观领域的模拟方法,它通过计算机模拟微观粒子(主要是原子、分子)之间的相互作用及运动过程来
得到计算系统的结构和特性。分子动力学模拟作为获得液体、固体分子性质的常用计算手段,广泛应用于化学、物理、医药、材料、生物等众
多领域中。分子动力学模拟体系的复杂性和精确性的需求,使得计算量巨大,而基于传统的CPU计算设备购置成本高,其有限的计算能力一直是制约
这方面研究发展的瓶颈 。
解决 方案
上海交通大学 π集群机分 CPU与 GPU两类节点,各类节点上运行的应用程序分布情况分别如图 1、图 2 所示。显而易见,Gromacs是上海
交通大学 π集群机两类节点中使用比例较多的软件,尤其是 GPU节点更为显著。事实上,Gromacs也是分子动力学模拟领域使用非常广泛
的开源软件,主要用于蛋白质、核酸等的模拟,对 GPU支持也非常好。目前在交大生命学院、自然科学研究院使用较多,将来可能会在
生物制药方面具有应用前景。
图 1 应用程序采用 π集群 CPU节点的分布情况
x
x
图 2 应用程序采用 π集群 GPU节点的分布情况
成效
平台:π 集群,分子动力学模拟分别在以下两类计算机系统中进行:
1) 单 CPU节点 2路 E5-2670 CPU, 节点间使用 56Gb FDRInfiniband 网络互联。
2) 单 GPU节点 2 路 E5-2670 CPU+2 Kepler K20/K40,节点间使用 56Gb FDR Infiniband网络互联。
使用算例:分别使用 46000/92000/184000个 atoms模拟。
加速效果: 至少 2倍以上的加速效果(CPU节点使用 16线程)。
影响
上海交通大学于 2011 年成为全球第 16 个 CUDA 卓越中心,并于 2014年获得 CUDA 卓越中心年度成就奖提名。其拥有的超级计算机 π 位列国
内高校第一,是唯一配置了超过 100 块 Kepler K20 的超级计算机,也是国内少有的 GPU 利用率高于 CPU 利用率的超级计算机。2014 年至今已
有多篇在 π GPU 集群上进行的分子动力学应用相关的高水平论文得到发表,上海交大的案例为 GPU 在国内高性能计算领域的实用起到了推动作用。