服务电话:

400-801-5670

NVIDIA发布Tesla P100显卡:Pascal降临,见识GP100的恐怖威力

发表时间:2019年12月04日 作者: 浏览次数:1578

     AMD、NVIDIA下一代显卡争霸战今天拉开了帷幕,因为GTC大会上NVIDIA终于正式发布了Pascal显卡的旗舰Tesla P100,虽然今年1月份的CES展会上NVIDIA发布的Drive PX2自动驾驶平台使用的也是Pascal显卡,但当时的发布只是象征意义的,现在人们才首次看到了GP100显卡的真容——拥有3584个CUDA核心,153亿个晶体管,16GB HBM2显存,核心频率高达1328MHz,浮点性能10.6TFLOPS。

NVIDIA发布首款Pascal架构的高性能HPC显卡Tesla P100

     对于Pascal架构,我们之前陆续报道过了很多内容,这次的真·Pascal显卡有些规格与爆料相符,不过很多内容也是出乎意外的,可以确定的内容是16nm FinFET工艺、16GB HBM 2显存、4096bit位宽以及支持NVLink总线等,不过GP100的CUDA核心数比之前曝光的要少很多,只有3584个,比目前GM200核心的3072个没高出多少,不过GP100的双精度CUDA单元暴增,而且核心频率异常凶猛,基础频率就有1328MHz,加速频率1480MHz,比很多Maxwell显卡的超频频率都要高,这可是153亿晶体管的大核心啊!

GP100显卡核心

     GP100核心确实是为高性能计算而生的,虽然3584个CUDA核心相比目前GM200的3072个提升不多,但在FP64双精度单元上,GP100核心总计拥有1792个CUDA核心,相当于FP32单精度的1/2,相比之下GM200只有96个,所以其FP64双精度性能高达5.3TFOPS,而GM200核心只有0.213TFLOPS,GK110核心也只有1.68TFLOPS,绝对是碾压之态。

     GP100第二点变化是升级了显存架构,从之前的GDDR5变成了HBM 2,从图片上看也是堆栈了4颗HBM 2显存,等效位宽4096bit,不过频率1.4Gbps而非HBM 2显存应有的2Gbps,因此带宽只有720GB/s,并没有达到之前所说的TB/s级别,只不过720GB/s的带宽已经远远超过了之前GM200/GK110核心的240-288GB/s带宽了。

     至于容量,目前HBM 2显存量产的是4GB颗粒的,因此GP100的显存容量也是16GB,与我们之前分析的一致,而32GB的超大容量还得等到8GB HBM2显存芯片量产才有戏。

     GP100核心更让人惊讶的地方是核心频率,Pascal使用了更先进的16nm FinFET工艺(之前说高性能的16nm Plus工艺),新工艺带来的好处不仅是功耗和发热降低,核心频率也大幅提升了,之前GK100/GM200这样的大核心GPU频率通常在1GHz内,甚至为了控制功耗还会降低到500-700MHz左右,但GP100基础频率就有1328MHz,加速频率1480MHz,这简直是bug,理论上仅仅核心频率提升就差不多能把性能提升一倍了。