产品详情
产品特性
Pascal 架构带来巨大的性能飞跃
NVIDIA Pascal 架构使 Tesla P100 能为 HPC 和超大规模工作负载提供卓越性能。凭借每秒超过 21 万亿次的 16 位浮点 (FP16) 运算性能,经过优化的 Pascal 为深度学习应用程序带来了令人兴奋的新可能。Pascal 还可为 HPC 工作负载提供超过 5 万亿次的双精度浮点运算和 10 万亿次的单精度浮点运算能力。
通过采用 HBM2 的 CoWoS 技术实现更高效率
通过加入采用 HBM2 的晶圆基底芯片 (CoWoS) 技术,Tesla P100 将计算性能和数据紧密集成在同一个程序包内,提供的内存性能是 NVIDIA Maxwell™ 架构的三倍以上。这大幅缩短了为数据密集型应用程序算出解决方案的时间。
页面迁移引擎使编程更简单
页面迁移引擎可使开发人员从管理数据移动的工作中腾出时间,将精力更多地放在计算性能的调整上。应用程序现在可以突破 GPU 物理显存的容量限制,达到几乎无限量的显存。
适用于混合型工作负载 HPC 的 NVIDIA Tesla P100
适用于 PCIe 的 Tesla P100 使混合型工作负载 HPC 数据中心能在节省资金的同时大幅提升吞吐量。例如,一个由四个与 PCIe 互联的 Tesla P100 驱动的 GPU 加速节点,可以替代各种应用程序的多达 32 个通用 CPU 节点。利用数量大幅减少而性能强大的节点完成各种作业,意味着客户可以节省多达 70% 的整体数据中心成本。
产品参数
产品型号 | P100-PCIe |
CUDA核心数量 | 3584 |
CUDA核心频率 | 1126MHz |
显存容量 | 16GB/12GB |
显存带宽 | 549GB/s(12GB) |
显存类型 | HBM2 |
半精度性能(峰值) | 18.7TFLOFPS |
单精计算性能(峰值) | 9.3TFLOFPS |
双精计算性能(峰值) | 4.7TFLOFPS |
互联带宽(双向) | 32GB/s |
功耗 | 250W |
资源下载
P100 产品白皮书V1.0
下载