中科云达-GPU服务器-深度学习集群-HPC高性能计算-超微服务器

GTC：NVIDIA CEO黄仁勋发布新一代RTX GPU和云端AI工作流

发表时间：2022年11月01日作者：浏览次数：1229

NVIDIA首席执行官黄仁勋在GTC主题演讲上介绍了支持AI工作流的新型云服务和新一代GeForce RTXGPU，以及各种新系统、芯片和软件。

黄仁勋在NVIDIA GTC线上演讲中表示：“在加速计算和AI的推动下，计算正在以惊人的速度发展。”

NVIDIA首席执行官黄仁勋

从利用AI和前所未有的图形能力让玩家收获快乐，到建立虚拟试验场以供全球大型企业完善其产品，黄仁勋再次将新技术和新产品与全新发展机遇联系在一起。

加速计算的非凡愿景开启了AI的进步，而AI反过来又将触及全球各个行业，新想法、新产品和新应用因此涌现。

游戏玩家和创作者将获得首批基于全新NVIDIA Ada Lovelace架构的GPU。

企业将通过基于GraceCPU和Grace Hopper超级芯片的系统获得新型、强大的工具，以实现高性能计算应用。构建3D互联网的企业将获得Ada Lovelace L40数据中心GPU驱动的新型OVX服务器。研究人员和计算机科学家将通过NVIDIA LLMs NeMo服务获得新的大型语言模型功能。汽车行业则将会获得一个具有每秒2000万亿次浮点计算性能的新“大脑”——Thor。

黄仁勋重点介绍了各行各业的主要合作伙伴以及客户如何使用NVIDIA技术。

在加快技术采用方面，他宣布全球*大的专业服务公司德勤正在向全球企业提供基于NVIDIA AI和NVIDIA Omniverse构建的新服务。

他还分享了诸多客户故事，包括电信巨头Charter、汽车行业的通用汽车公司、运输行业的德国铁路系统Deutsche Bahn、医学研究行业的博德研究所以及零售行业的Lowe's。

本周揭幕的NVIDIAGTC大会已经成为全球*重要的AI盛会之一，来自波音、德意志银行、Lowe’s、极星、强生、克罗格、梅赛德斯·奔驰、西门子、T-Mobile和美国银行等公司的200多名演讲者以及超过20万名注册参会者将在本届GTC上齐聚一堂。

巨大飞跃：GeForce RTX 40系列GPU

黄仁勋在主题演讲中首先介绍了由Ada助力的新一代GeForce RTX 40系列GPU，将这称之为一次“巨大飞跃”，为致力于完整模拟世界的创造者铺平了道路。

下一代GeForce RTX 40系列GPU

通过展示RacerRTX，黄仁勋让观众体验了完整模拟的可能性，这一切全部都是由光线追踪、交互模拟以及物理建模动作实现的。

Ada的革新包括一个全新的流式多处理器，一个具有两倍光线-三角形相交吞吐量的全新RT Core，以及一个具有Hopper FP8 TransformerEngine可提供1.4PetaFLOP张量处理性能的全新Tensor Core。

Ada还引入了NVIDIA DLSS技术的*新版本——DLSS 3。该技术通过将新帧和上一帧进行比较来了解场景的变化，从而利用AI生成全新帧。与传统渲染相比，它能将游戏性能提高多达4倍。

DLSS3已经得到了许多全球领先游戏开发者的支持，超过35款游戏和应用宣布即将支持该技术。黄仁勋表示：“DLSS 3是我们*伟大的发明之一。”

黄仁勋表示，这些创新将令全新GeForce RTX 4090的性能提升至上一代RTX 3090 Ti的4倍。全新重量级RTX 4090将于10月12日上市，建议零售价12999元起。

此外，全新GeForceRTX 4080将于11月推出，采用两种配置版本：

GeForceRTX 4080 16GB 建议零售价为9499元起，拥有9728个CUDA核心和16GB高速美光GDDR6X显存。借助DLSS 3，它在现代游戏中的性能是GeForce RTX 3080 Ti的两倍，性能比GeForce RTX 3090 Ti更强大且功耗更低。

GeForceRTX 4080 12GB建议零售价为7199元起，拥有7680个CUDA核心和12GB美光GDDR6X显存，使用DLSS 3比上一代旗舰GPU – RTX3090 Ti性能更强大。

黄仁勋还宣布，NVIDIA Lightspeed Studios使用Omniverse重制了历史上*佳游戏之一的《传送门》(Portal)。凭借NVIDIA RTX Remix这一AI辅助工具集，用户可以修改他们喜爱的游戏，提高纹理和素材的分辨率，并把材质转换为具有精确物理属性的材质。

NVIDIA Lightspeed Studios使用Omniverse重制了《传送门》(Portal)

推动AI进步：H100 GPU全面投产

黄仁勋再次将系统和软件与广泛的技术趋势联系到一起，他表示大型语言模型（LLM）和推荐系统是当今*重要的两种AI模型。

他表示，推荐系统“掌管着数字经济”，推动着从电子商务到娱乐再到广告的一切发展。“它们是社交媒体、数字广告、电子商务和搜索背后的引擎。”

大型语言模型如今是AI研究*活跃的领域之一，它基于2017年首次推出的Transformer深度学习模型而建立，能够在没有监督或标记数据集的情况下学习理解人类语言。

黄仁勋表示：“一个预训练模型可以执行多种任务，如问题回答、文件摘要、文本生成、翻译，甚至软件编程。”

他表示NVIDIAH100 Tensor Core GPU以及Hopper的新一代Transformer Engine已经全面投产，将在未来几周陆续发货。它们正在为这些巨大模型提供所需的计算能力。

黄仁勋表示：“Hopper已全面投产，很快就会被用于助力全球的AI工厂。”

构建系统的合作伙伴包括源讯、思科、戴尔、富士通、技嘉、慧与、联想和超微。而亚马逊云科技、谷歌云服务、微软Azure和Oracle CloudInfrastructure将从明年开始成为首批在云中部署基于H100的实例。

黄仁勋表示，GraceHopper将基于Arm的NVIDIA Grace数据中心CPU与Hopper GPU相结合，其快速内存容量增加了7倍，这将为推荐系统带来“巨大的飞跃”。采用Grace Hopper的系统将于2023年上半年上市。

编织元宇宙愿景：L40数据中心GPU全面投产

黄仁勋解释说，互联网的下一次进化，即元宇宙将通过3D技术扩展。Omniverse是NVIDIA用于构建和运行元宇宙应用的平台。

连接和模拟这些世界需要强大且灵活的新型计算机，黄仁勋解释了其中的奥义。NVIDIA OVX服务器就是专为扩展元宇宙应用而打造的。

黄仁勋宣布NVIDIA第二代OVX系统将由Ada Lovelace L40数据中心GPU提供支持，该GPU现已全面投产。

用于自动驾驶汽车、机器人、医疗仪器等领域的Thor

目前，想要实现汽车中的主动安全、停车、驾驶员监测、摄像头后视镜、集群和车载信息娱乐系统等功能通常需要不同的计算机提供支持。而未来，它们将由在中央计算机上运行的软件统一提供支持，并随着时间的推移不断改进。

为了实现这一目标，黄仁勋推出了DRIVE Thor，该平台集Hopper的Transformer Engine、基于Ada的GPU和Grace CPU于一身。

全新Thor超级芯片可提供每秒2,000万亿次浮点运算性能，取代了DRIVE发展路线图中的Atlan，能够与目前被用于量产汽车、可提供每秒254万亿次浮点运算性能的DRIVE Orin无缝衔接。黄仁勋表示，Thor将成为机器人、医疗仪器、工业自动化和边缘AI系统的处理器。

350万开发者与3000个加速应用

黄仁勋宣布，NVIDIA软件生态系统正在将NVIDIA系统和芯片以及加速计算的优势带给每个行业，超过350万名开发者通过使用NVIDIA的550个软件开发工具包（SDK）和AI模型创建了超过3,000个加速应用。
这个数量还在快速增长。在过去的12个月里，NVIDIA已经更新了100多个SDK并推出了25个新的SDK。

黄仁勋表示：“新的SDK提高了我们客户现有系统的能力和性能，同时为加速计算开辟了新的市场。”

AI和虚拟世界的新服务

黄仁勋表示，大型语言模型“是当今*重要的AI模型”。基于 Transformer 架构，这些大型模型可以在没有监督和标记数据集的情况下学习理解意义或语言，解锁无与伦比的新能力。

为了帮助研究人员更轻松地将该技术应用到其工作中，黄仁勋发布了Nemo LLM服务。这项NVIDIA管理的云服务可根据具体的任务调整预先训练的大型语言模型。

为了加速药物和生物科学研究人员的工作，黄仁勋还发布了BioNeMo LLM。这项用于创建大型语言模型的服务可以理解化学物质、蛋白质、DNA和RNA序列。

黄仁勋宣布，NVIDIA正与全球*大的人类基因组信息公司——博德研究所合作，为博德的Terra云平台提供NVIDIA Clara库，包括NVIDIA Parabricks、基因组分析工具套件和BioNeMo。

NVIDIA正在与世界上*大的人类基因组信息生产者--博德研究所合作，在博德研究所的Terra云平台上提供NVIDIA Clara库

黄仁勋还详细介绍了NVIDIA Omniverse Cloud。这项基础设施即服务（IaaS）可以连接在云端、本地或设备上运行的Omniverse应用。

黄仁勋宣布，新的Omniverse容器现已可以部署到云端，该容器包括用于合成数据生成的Replicator、用于扩展渲染农场的Farm以及用于构建和训练AI机器人的IsaacSim。

Omniverse正在被广泛采用，黄仁勋分享了几个客户故事与演示：

· 拥有近2,000家零售店的Lowe's正在使用Omniverse来设计、构建和运营门店的数字孪生；

· 市值500亿美元的电信运营商Charter和互动数据分析商HEAVY.AI正在使用Omniverse创建Charter 4G和5G网络的数字孪生。

· 通用汽车正在使用Omniverse来为他们的密歇根设计工作室创建数字孪生，设计师、工程师和营销人员可以在这个数字孪生中协同工作。

家装零售商Lowe's正在使用Omniverse来设计、构建和运营其商店的数字孪生

用于机器人的全新Jetson Orin Nano

机器人计算机“是一种*新的计算机类型”，能够将一切可移动的机器转移到虚拟世界。黄仁勋将NVIDIA第二代机器人处理器Orin描述为一次重要的成功。

为了将Orin带到更多的市场，他宣布推出Jetson Orin Nano。这款微型机器人计算机比上一代备受欢迎的Jetson Nano快80倍。

JetsonOrin Nano可运行NVIDIAIsaac机器人堆栈并采用ROS 2 GPU加速框架。NVIDIAIsaac Sim机器人模拟平台现已在云端可用。

对于使用AWSRoboMaker的机器人开发者，黄仁勋宣布，用于NVIDIA Isaac机器人开发平台的容器已在亚马逊云科技商店上架。

全新视频和图像服务工具

黄仁勋解释说，全球大部分互联网流量都由视频产生，而用户生成的视频流将越来越多地通过AI特效和计算机图形得到增强。

黄仁勋表示：“Avatars将能够实时运行计算机视觉、语音AI、语言理解和计算机图形任务，并在云端扩展。”

为了在实时图形、AI和通信交叉点上实现创新，黄仁勋宣布NVIDIA一直完善加速库。这些库包括：CV-CUDA，一种被称为UCF（统一计算框架）的云运行时引擎；OmniverseAvatar Cloud Engine；被称为Tokkio的客户服务虚拟化身示例应用等。

德勤将为企业提供AI和Omniverse服务

黄仁勋宣布，为了加快所有这些技术在全球企业中的应用，全球*大的专业服务公司德勤将带来建立在NVIDIA AI和NVIDIA Omniverse基础上的新服务。
他表示，德勤的专业人员将帮助全球企业使用NVIDIA应用框架，为客户服务、网络安全、工业自动化、仓库和零售自动化等领域构建现代化多云应用。