产品详情


P4

适用范围

GPU高性能计算

深度学习、科学计算

同时运用GPU与CPU服务器的数据中心


产品特性


通过实时推理提供快速响应的用户体验

响应速度是决定用户是否使用互动语音、视觉 搜索和视频推荐等服务的关键因素。随着模型的 准确性和复杂性越来越高,CPU 已经无法再提供 响应灵敏的用户体验。Tesla P4 借助 INT8 运算 能力提供高达 22 TOPS 的推理性能,可将延迟 降低 15 倍。

 

为低功耗扩展型服务器带来更高效率

Tesla P4 凭借小巧的外形和 75W 的功耗为经过 密度优化的扩展型服务器加速。该加速卡还可为 深度学习推理工作负载提供比 CPU 高 60 倍的 惊人能效,满足超大规模客户对 AI 应用程序 飞速增长的需求。

 

借助专用解码引擎开发新的 AI 型视频服务

Tesla P4 配备专用的硬件加速解码引擎,能对多达 35 路高清视频流进行实时转码和推理,该解码 引擎可与进行推理的 GPU 并行运作。将深度学习 集成到视频流水线后,客户可以向用户提供之前 无法实现的智能创新型视频服务。

 

使用 TENSORRT 和 DEEPSTREAM SDK 加快 部署速度

TensorRT 是为优化部署到生产环境的深度 学习模型而创建的库。它通常以 32 位或 16 位 数据的形式获取接受训练的神经网络,并针对 降低精度的 INT8 运算能力优化这些网络。 NVIDIA DeepStream SDK 利用 Pascal GPU 的 强大功能,可以同时解码和分析视频流。


产品参数


产品型号P4
CUDA核心数量2560
CUDA核心频率

810MHz

显存容量8GB
显存带宽192GB/s
显存类型GDDR5
INT822TOPS
半精度性能(峰值)11TFLOFPS
单精计算性能(峰值)5.5TFLOFPS
双精计算性能(峰值)0.17TFLOFPS
互联带宽(双向)
32GB/s
功耗50/75W

资源下载