中科云达-GPU服务器-深度学习集群-HPC高性能计算-超微服务器

产品详情

P100 SXM2

适用范围

GPU高性能计算

深度学习、科学计算

同时运用GPU与CPU服务器的数据中心

产品特性

Pascal 架构带来巨大的性能飞跃

NVIDIA Pascal 架构使 Tesla P100 能为 HPC 和超大规模工作负载提供卓越性能。凭借每秒超过 21 万亿次的 16 位浮点 (FP16) 运算性能，经过优化的 Pascal 为深度学习应用程序带来了令人兴奋的新可能。Pascal 还可为 HPC 工作负载提供超过 5 万亿次的双精度浮点运算和 10 万亿次的单精度浮点运算能力。

通过采用 HBM2 的 CoWoS 技术实现更高效率

通过加入采用 HBM2 的晶圆基底芯片 (CoWoS) 技术，Tesla P100 将计算性能和数据紧密集成在同一个程序包内，提供的内存性能是 NVIDIA Maxwell™ 架构的三倍以上。这大幅缩短了为数据密集型应用程序算出解决方案的时间。

NVIDIA NVLink 让超大规模的应用成为现实

互连技术通常制约着性能。创新的 NVIDIA NVLink 高速双向互连技术能跨越多个 GPU 扩展应用程序，其性能比当今的一流技术高 5 倍。

页面迁移引擎使编程更简单

页面迁移引擎可使开发人员从管理数据移动的工作中腾出时间，将精力更多地放在计算性能的调整上。应用程序现在可以突破 GPU 物理显存的容量限制，达到几乎无限量的显存。

适用于具备强扩展能力的 HPC 的 NVIDIA Tesla P100

利用搭载 NVIDIA NVLink 技术的 Tesla P100，快如闪电的节点可以显著缩短为具备强扩展能力的应用程序提供解决方案的时间。采用 NVLink 技术的服务器节点可以 5 倍的 PCIe 带宽互联多达八个 Tesla P100。这种设计旨在帮助解决在 HPC 和深度学习领域拥有极大计算需求的全球重大挑战。

产品参数

产品型号	P100-SXM2
CUDA核心数量	3584
CUDA核心频率	1328MHz
显存容量	16GB
显存带宽	732GB/s（16GB）
显存类型	HBM2
半精度性能（峰值）	21.2TFLOFPS
单精计算性能（峰值）	10.6TFLOFPS
双精计算性能（峰值）	5.3TFLOFPS
互联带宽（双向）	160GB/s
功耗	300W

资源下载

P100产品白皮书V1.0
下载