在即将到来或者说已经到来的人工智能时代,我们更多的是听到AI服务器这一名词。那么,究竟什么是AI服务器,AI服务器又为何适用人工智能时代?
AI服务器的定义
从硬件架构来看,AI服务器主要指的是采用异构形式的服务器,表现形态多为机架式。在异构方式上,可以为CPU+GPU、CPU+FPGA、CPU+TPU、CPU+ASIC或CPU+多种加速卡。
而在其他组成部件上,如内存模块、存储模块、网络模块与传统服务器差别不大,主要的提升便是支持更大容量的内存满足当下实时负载增加的需求,提供更多外置硬盘插槽,并广泛支持NVME/PCIE等SSD,满足数据洪流需求,网络模块主要表现为带宽增加。
尽管AI服务器可以采用多种异构形式,但目前广泛使用的是CPU+GPU。也因此,业界在谈到AI服务器时,往往将其默认为GPU服务器。因此,在第二部分中,笔者谈到的AI服务器优势也主要为GPU服务器。
AI服务器的优势
传统服务器主要以CPU为算力提供者。而CPU为通用型处理器,采用串行架构,擅长逻辑计算,负责不同类型种类的数据处理及访问,同时逻辑判断又需要引入大量分支跳转中断处理,这使得CPU的内部结构复杂。也因此,CPU算力的提升主要靠堆核来实现。
随着云计算、大数据、AI、物联网等技术应用,数据在近几年呈指数型增长,IDC统计显示全球90%数据均在近几年产生,这便对CPU的处理能力提出考验,而目前CPU的物理工艺、核心数已接近极限,数据量却不会停止,服务器的处理能力必须提升。因此,在AI时代下,仅由CPU做算力提供者的传统服务器并不能满足需求。
不同于CPU,GPU采用并行计算模式,单卡核心数达到上千个,擅长处理密集型运算应用,如图形渲染、计算视觉和机器学习。经过几年验证,搭载GPU的服务器也被证实的确适用这个时代。
中科云达RT4220-4G
适用范围
计算物理、生物化学模拟、机器学习、深度学习、人工智能
气候和天气建模、CFD、CAE、DCC
数据分析、卫星成像和计算金融学
天体物理学、计算流媒体动力学、高性能计算等
强大的性能
RT4220-4G是一款基于Intel® Xeon® Scalable 可扩展系列处理器的高性能计算平台,支持4个NVIDIA GPU加速器和4TB的内存,单精度浮点计算112TFLOPS、双精度浮点计算56TFLOPS, 让用户体验强大的计算性能。
灵活的配置
为更加贴切的满足各种应用需求,客户可根据需求选择支持8个3.5寸SATA/SAS硬盘,网络选择多样化,可选择支持双千兆、四千兆、双千兆+双万兆搭配,所有网络支持管理复用,满足各种不同的网络应用场景。
优化的散热
整机结构布局充分考虑优化散热和节约功耗,支持高温环境。关键部件根据发热量采用特殊设计,在保持性能的同时可以降低风扇转速,从而减低功耗和噪音。
合理的扩展
在支持4块GPU卡的同时还可有1至2个PCI-E插槽可用,可扩展100Gb infiniband HCA、Nvme SSD等、具有非常好的灵活性和兼容性。
便捷的管理
具备IPMI 远程管理功能,实现非现场即可监控管理服务器要求,具有监控系统各部件的运行状况、远程安装操作系统、故障报警等功能。极大的缩减了维护开销。