2019

空间天气数值预报模式研发与演示系统(三期)――基于NVLink总线技术的GPU+CPU“双百”万亿次混合架构专用计算集群完成硬件建设并通过技术验收

发布时间:2019-05-20 作者:
分享到:

2019年4月23日,中国科学院国家空间科学中心组织有关部门与验收专家组在空间中心怀柔园区举行了空间天气学国家重点实验室大型仪器设备专项“基于NVLink总线技术的GPU+CPU混合架构专用计算集群”验收会议。

验收会议由资产条件处资产专员李宏老师主持, 验收组专家听取了项目负责人和供货厂商的工作报告和技术报告、审阅了项目的相关资料和文档,并现场考察了位于主楼二层先导机房的机群,认为 “基于NVLink总线技术的GPU+CPU混合架构专用计算集群”圆满完成了项目批复的各项建设任务,设备采购符合政府采购招标流程,技术系统各项性能指标满足建设任务书要求,经费使用合理,归档资料完整;机房改造按照合同书要求进行,电力改造、空调等方面达到了合同书要求的各项指标;设备试运行情况良好。专家组一致同意通过验收。

空间天气学重点实验室徐寄遥副主任代表项目承担单位对主管部门的支持表示感谢,国家空间科学中心资产条件处袁庆智处长、刘锋副处长、采购办及档案室相关负责同志也出席了会议。

附:“基于NVLink总线技术的GPU+CPU混合架构专用计算集群”是空间天气学国家重点实验室“数值预报研发和演示系统”(三期)申请的国家重点实验室大型科研仪器设备专项,是继2012年“数值预报研发和演示系统”(二期)-- NUMA架构高性能计算系统建成投入使用之后, 2015年实验室在科技部组织的五年一轮次国家重点实验室评估为良好,在2016年科技部、财政部国家重点实验室科研仪器设备专项经费的支持下,历时三年建成GPU+CPU混合架构“双百”万亿次服务器,32台双路8核(Power8,3.32GHz)计算节点,共560个CPU核心,以及8块P100 GPU卡,支持NVLink技术,理论计算性能99.36TFLOPS(万亿次);CPU刀片计算节点集群采用90台双路14核(Intel Xeon E5-2680V4,2.4GHz)计算节点,100Gb IB网络互连, 共2520颗CPU核心,理论计算性能96.768 TFLOPS(万亿次)。

集群于2018年底进入试运行、2019年正式投入使用,该集群的建成将为空间天气学国家重点实验室的模式研究与数据分析工作插上腾飞的翅膀!空间天气学国家重点实验室有使用GPU基础和辉煌成绩, 在中国科学院科技创新交叉合作团队―“高效空间天气预报模式研究”项目的支持下, 与北京大学、 清华大学的相关力量一起,对SMILE太阳风-磁层相互作用PPMLR-MHD模式的高效并行GPU计算方法进行联合攻关,学术论文Large Scale GPU Accelerated PPMLR-MHD Simulations for Space Weather Forecast获得IEEE/ACM国际网格计算与云计算大会SCALE 2016挑战论文奖,该奖项在计算机界有小“戈登贝尔奖”之称。