英伟达地表最强，黄教主被称作AI界“霉霉”

时事新闻2024-03-19 19:56:47无忧百科

来源丨创业邦（ID：ichuangyebang）

作者丨Juny

编辑丨海腰

图源丨英伟达官方

好久没有一场大会让整个科技界都如此躁动。

今天早间，在位于硅谷San Jose的麦克内里会议中心，英伟达2024 GTC大会标识已被高高挂起，并在下方悬挂着一行醒目的大字：“一场属于人工智能时代的盛会（The Conference for the era of AI）”。

时隔5年之后，英伟达的年度GTC大会再次回归线下。5年前，以硬件和技术讨论著称的GTC在一众硅谷科技公司的年度大会中还略显边缘与小众，但随着过去一年生成式AI站上C位，硬核GTC和皮衣黄仁勋当下无疑已经成为了整个硅谷的焦点。

美西时间下午1点，黄仁勋穿着他标志性的黑皮衣正式登场，面对着座无虚席的万人会场，他说道：“希望你们能意识到这并不是一场演唱会，而是一个开发者技术大会。”但在接下来长达2个多小时的开幕演讲中，伴随着英伟达所丢出的一个接一个的炸裂的产品和各种彩蛋，站在舞台中央的黄仁勋却俨然成为了AI时代里那个最摇滚的明星。

“我宣布，黄仁勋就是我们AI界的Taylor Swift。”一位人工智能粉丝会后如是说。

地表最强芯片亮相

过去几年，英伟达曾在GTC上推出了基于Hopper架构的多款重磅明星产品，目前市面上能叫得上名字得人工智能模型几乎都是在该架构上进行训练，行业内“一芯难求”的局面迟迟得不到缓解。而今年，按照英伟达每两年更新一次GPU架构的节奏，大家都对英伟达新一代计算平台翘首以盼。

站在舞台中央，黄仁勋说："我们已经来到了一个临界点，因此需要一种新的计算方式来加速整个行业的发展效率。那么英伟达能够做什么？当然，答案就是——更大的芯片。”接着，英伟达新一代图形计算平台Blackwell正式登场，它被英伟达称为 “新工业革命的引擎”。

采用全新Blackwell架构的B200和GB200系列芯片正式到来。

Blackwell以第一位入选美国国家科学院的黑人学者、数学家David Harold Blackwell的名字命名，它将允许客户能够在万亿参数大型语言模型上构建和运行实时生成人工智能。

Blackwell平台，图源：英伟达官方Keynote

Blackwell平台引入了六项开创性技术来支持高达10万亿参数的AI模型训练和大语言模型的实时推理。有望在数据处理、工程模拟、电子设计自动化、计算机辅助药物设计、量子计算和生成人工智能等领域实现新的突破。用黄仁勋的原话来说，它就是“当今世界上最强大的芯片”。这六项技术分别为：

更大芯片：Blackwell 架构 GPU 拥有2080亿个晶体管，尺寸是Hopper（800亿晶体管）的两倍多。Blackwell B200不是传统的单一GPU，而是由两个紧密耦合的芯片组成，这两个芯片通过10 TB/秒的芯片到芯片链路连接成了一个统一的GPU 。

第二代Transformer引擎：配备了新的微张量缩放支持和先进的动态范围管理算法，通过创新的4位浮点AI推理功能使计算和模型大小加倍。

第五代 NVLink 网络技术：最新的NVLink迭代增强了数万亿参数AI模型的性能，为每个GPU提供了高达1.8TB/s的双向吞吐量，确保当今最复杂的大语言模型能在多达576个GPU之间实现无缝高速通信。

RAS引擎：Blackwell驱动的GPU集成了专用引擎和基于人工智能的预防性维护功能，可确保可靠性、可用性和可维护性，从而最大限度地延长系统运行时间并最大限度地降低运营成本。

安全人工智能：全新的机密计算功能可在不影响性能的情况下保护人工智能模型和客户数据，并支持新的本机接口加密协议，在传输过程中、静止状态和计算时都能保证安全。

解压缩引擎：通过支持最新格式加速数据库查询，增强数据分析和数据科学性能，彻底改变数据处理。

英伟达表示，此前训练一个1.8万亿参数模型需要用到8000个Hopper GPU和 15兆瓦的功率。而如今，同样的训练量2000个Blackwell GPU就可以做到，功耗仅为4兆瓦。

左为Blackwell，右为Hopper 图源：英伟达

基于Blackwell，此次英伟达还推出了其AI超级芯片GB2000。GB2000由两个B200 Blackwell GPU和一个基于Arm的Grace CPU组成，可以为大语言模型推理工作负载提供30倍的性能，而成本能耗要比其“前辈” Hopper低25倍。在具有1750亿个参数的GPT-3 LLM基准测试中，GB200的性能是H100的7倍，训练速度是H100的4倍。

GB200还将成为英伟达全新大型机架系统GB200 NVL72的基石。该系统拥有72个Blackwell GPU和36个Grace GPU，拥有1.4 exaflops的AI性能和30TB的快速内存。英伟达表示，该系统可以部署27万亿参数的模型，而目前最大的模型GPT-4仅约有1.7万亿个参数，因此能够加快释放生成式AI的能力。此外，GB200还将上线Nvidia DGX Cloud，这是一个与领先的云服务提供商共同设计的AI平台，让企业开发人员能够专门访问构建和部署高级生成AI模型所需的基础设施和软件。

英伟达表示，目前亚马逊、谷歌、微软和甲骨文等都已经成为了NVL72 机架的首批采购和服务提供商，其中亚马逊将构建一个包含20000个GB200芯片的服务器集群。思科、戴尔、惠普、联想和超微电脑等大量企业也都已经把提供基于Blackwell产品的各种服务提上了日程。英伟达表示，新芯片预计将于今年晚些时候上市，但目前还并没有公布Blackwell的相关售价信息。

大型机架系统GB200 NVL72

软件服务硬件

Omniverse牵手苹果Vision Pro

除了硬件之外，软件升级也成为近年来GTC必不可少的一个内容。此次，英伟达推出了一项全新的推理管理器服务 (NIM) ，该服务的目标是通过一种交付快速推理模型的新方法来加速和优化生成式AI大语言模型的部署，成为英伟达“软件服务硬件”战略的又一关键举措。

NIM技术将优化的推理引擎、行业标准API 和对人工智能模型的支持打包到容器中，以便于部署。该容器可以包含任何类型的模型，从开放模型到专有模型，都可以在有Nvidia GPU的任何地方运行。NIM另一强大用例还在于，除了提供预构建模型，它还允许企业使用自己的专有数据，并将支持和帮助加速检索增强生成 (RAG) 部署。

NIM，图源：英伟达

此外，令人印象深刻的还有英伟达Omniverse与苹果Vision Pro的“强强联合”。

NVIDIA Omniverse是英伟达在2021年发布的一个开放平台，专为虚拟协作和实时逼真模拟而构建。它能够互联整个3D工作流程，将线性流程替换为实时同步创建，无论是企业还是个人创作者，都能够将创意和产品在虚拟世界中进行协作迭代。

在今天的GTC上，英伟达宣布，企业级数字孪生和沉浸式内容创建中心Omniverse将在Apple Vision Pro上首次亮相。通过英伟达Omniverse的云API和图形交付网络 (GDN)，企业现在将可以轻松将3D应用的OpenUSD（交互式通用场景描述）实时串流到Vision Pro混合头显中。

那么，这个过程究竟是什么样的呢？英伟达给观众做了一个实例演示。一名设计师佩戴着Vision Pro，在Omniverse平台上开发的应用程序内进行汽车工业设计，当他切换油漆、内饰时Vision Pro的三维环境实时渲染并跟物理世界融为一体。

图源：英伟达

这种基于Omniverse的新工作流程将Apple Vision Pro突破性的高分辨率显示器与英伟达强大的 RTX 云渲染相结合，只需设备和互联网连接即可提供空间计算体验。通过利用云软件和硬件组件的框架，英伟达还能确保企业客户可以在Vision Pro设备上利用数字孪生，而不会损失显示或帧率质量。

这意味着设计人员可以更加值得信赖方式与进行混合现实交互，为空间计算开辟了更大的想象空间。英伟达表示，对于开发人员和独立软件供应商，他们也正在构建更多功能使他们能够使用Vision Pro与应用程序中的现有数据无缝交互。

下一个变革：机器人

在大会的最后部分，一众机器人的登场也再次引发了一次小高潮。很显然，英伟达当前另一个工作重点，就是要继续推动智能人形机器人更快地走入人们的日常生活。

站在一排机器人的中间，黄仁勋宣布了英伟达全新的Project GROOT人工智能基础模型的到来。该基础模型是一个经过大量数据训练的人工智能系统，能够用于生成句子、视频、图像等各种任务。英伟达表示，GR00T项目将帮助人形机器人“通过观察人类行为来理解自然语言并模仿动作。快速学习协调性、灵活性和其他技能，以便更好地适应现实世界并与现实世界互动。”

作为Isaac机器人平台的一部分，英伟达此次还发布了Isaac Manipulator和Isaac Perceptor。Isaac Manipulator是一系列专为机械臂设计的基础模型，而Issac Perceptor则旨在为承担制造和履行角色的机器人提供多摄像头、3D环绕的视觉功能。此外，英伟达还推出了一款名为Thor的芯片系统，将作为人形机器人的大脑。