上海科技大学GPU集群----单一来源公示

ON2014-05-09文章来源 设备与资产处CATEGORY招标采购

采购代理机构:上海市政府采购中心

邀请采购供应商:华菁电子科技(上海)有限公司

单一来源理由:上海科技大学信息学院计划采购高性能服务器1套,以满足大规模分布式估计和检测、大型分布式存储系统的信息论研究,大规模的认知系统设计等科学研究项目需求,并用以培养研究生基于高性能计算集群的理论研究和项目开发能力,同时需要符合现有机房温度和噪声、以及集群可扩展性等方面的要求。配置要求如下:

PSC-4S计算节点2台,每台配置如下

外形 塔式

处理器(CPU)≥2颗,Intel Xeon  E5系列处理器≥2.1GHZ主频≥6核,

内存(Memory)      ≥8*8G DDR3 ECC REG 1600 MHz,可扩展

硬盘(Hard Drive) ≥2TSATA高速硬盘,可扩展

RAID支持  支持RAID:0、1、5、10

GPU卡片     ≥3片,NVidia并行计算卡≥2496CUDA核心显存≥5GB DDR5

驱动盘(DVD Driver)  包含所有驱动程序等原厂安装包

操作系统     64位操作系统,预装ACM集群管理软件;

PSC-4S存储管理节点1台,配置如下

处理器(CPU)≥2颗,Intel Xeon  E5系列处理器≥2.1GHZ主频,≥6核,

内存(Memory)      ≥4*8G DDR3 ECC REG 1600 MHz,可扩展

硬盘(Hard Drive) ≥5TSATA高速硬盘,可扩展

RAID支持  支持RAID:0、1、5、10

驱动盘(DVD Driver)包含所有驱动程序等原厂安装包,GPU配套应用软件,CUDA集群平台管理包

操作系统     64位操作系统,预装ACM集群管理软件;

集群附件,共包括

光纤收发器 infiniband40GB 8端口QSFP

网卡      3块infiniband40GB

交换机  24口千兆交换机

电源      ≥2个32A 8联万用PDU

集群管理软件    ACM集群管理软件。

经调研发现华菁电子科技(上海)有限公司开发的产品可以满足我方教学科研需求:

需求1. 高性能计算设备的计算能力能达到理论计算值的70%以上,最大化资金投入以及计算能力的回收。.

此次选用的GPU集群采用两台PSC-4S作为计算,理论浮点运算性能约为7.02 TFLOPS(1.17TFLOPS每GPU)。

采用IB网络群集以及IB 40Gb高速HCA卡,保证群集计算中大量数据实时交换的需求;减少延时性能损失,实际浮点计算能力超过理论值的80%,不低于5.616 TFLOPS。

需求2. 提供原厂免费的群集管理软件,方便对计算群集进行管理和监控。

这次选择的厂商提供自主研发的GPU/CPU群集管理软件。软件提供中英文界面,提供远程的web统一管理界面,方便群集的远程管理。另外软件中提供相应的群集调度器(支持CPU/GPU),支持远程提交计算任务以及参数设定。在计算过程中,软件支持实时的硬件资源监控,可动态调整计算节点的负载。

软件需具备快速部署功能,易于恢复、增加、删除节点,以方便后期对集群进行调整。

支持多用户管理,并且可以设置不同权限的系统用户,方便集群管理和使用。

需求3. 对集群的开发环境要求

支持并行编译环境:GNU C/C++编译器;GNU Fortran77/903编译器;OpenMPI;MPICH/Lam-MPI;PVM; Python;Perl;Java;

支持高性能计算函数库:ACML LAPACK;Blacs;ScaLAPACK;BLAS;GOTO;Atlas;Intel MKL,Lapack;FFTW;

支持GPU软件:cuBlas cuFFT;cuSparse;cuRand;npp;OpenCL

需求4. 群集将在办公室使用,需要满足静音要求。

采购的PSC-4S集群通过静音机箱搭建,在满足机器散热性的同时也充分保证了机器的算热性以及稳定性。集群在工作期间噪音大约45dB。

需求5. 厂商需要有能力对我们的CUDA项目的支持以及培训。

供应商提供有Intel Cluster Ready资质,并且有数十位英伟达GPU官方技术认证工程提供支持服务。

每年该供应商能提供2次由英伟达官方授权工程师讲解CUDA开发相关培训。

需求6. 产品质量以及售后服务

AMAX的生产基地都通过ISO9001,ISO14001,TL9000认证,

对每台服务器提供整机五步测试:部件检测、系统组装、高温测试、性能检测、最终质量检验

提供测试性能报告:操作系统与CUDA的兼容性和稳定性测试报告、24小时负载99%耐高温测试报告、72小时压力测试报告、40个小时 Burn in测试报告、Function test机器稳定性和散热的测试报告、ATA(AMAX Test Automation)自动化测试体系、FlexStar硬盘厂商级硬盘测试系统、等多重认证,高等级无尘生产环境

对所购买群集进行整合性测试,以Linpack作为标准将群集性能调整到最优。厂商在上海有设办公点,日后的工程师上门支持以及响应能得到保证。

因此计划从华菁电子科技(上海)有限公司采购该套服务器设备。

有关单位或个人如对本项目采用单一来源采购方式有异议,应在本公示发布之日起7个工作日内以书面形式向(单位:上海科技大学            地址:岳阳路319号8号楼1109室           邮编:   200031        联系方式:    54200161       联系人:    金文虎     )反映。