芯片战场丨“摇滚巨星”黄仁勋的AI春晚
2024年,英伟达一年一度的GTC大会已然成为AI界春晚,现场座无虚席,全球AI同好翘首以待黄巨星的独家SOLO。
3月19日凌晨,GTC终于拉开大幕。英伟达创始人兼首席执行官黄仁勋一如既往一身黑色皮衣登场,率先发布了全新架构平台Blackwell和相关的GPU新品,包括万众瞩目的B200、GB200超级芯片(2个B100 GPU和1个Grace CPU共同组成)。
同时,英伟达还升级了自动驾驶芯片平台Thor,使用了Blackwell架构并支持生成式AI,比亚迪将使用该平台;在大热的机器人方面,英伟达发布人形机器人通用基础模型Project GR00T、新型人形机器人计算机Jetson Thor,并对NVIDIA Isaac机器人平台进行了重大升级。
软件层面,英伟达还推出了推理平台NIM微服务、Omniverse Cloud API。不止于此,英伟达也在步步深入半导体产业链上游,台积电和新思将在生产中使用英伟达计算光刻平台NVIDIA cuLitho,从而加快先进半导体芯片的制造速度。从硬件到软件,英伟达继续全方位碾压并与同行拉开代际差距。
在演讲中,黄仁勋再一次回顾了AI发展历程和计算进化史,当多年前他亲手把第一台AI超级计算机DGX交到OpenAI手中时,命运的齿轮就开始转动。如今,在黄仁勋看来,加速计算已经来到了临界点,通用计算后劲不足,需要新的计算方式。而生成式AI是这个时代的决定性技术,Blackwell GPU是推动这场新工业革命的引擎。
Blackwell架构:新型AI超级芯片登场
接下来我们就为发布会划一下重点。
先看英伟达最新一代的GPU芯片架构——Blackwell,这一命名致敬了数学家David Harold Blackwell。从英伟达架构迭代看,Blackwell接棒两年前推出的Hopper架构,这两年间,Hopper助力了英伟达业务和股价飙升。
而随着多模态大模型的演进,英伟达认为业界需要更多、更大的GPU。于是在现场,黄仁勋从口袋中掏出了基于Blackwell架构的芯片,与Hopper芯片并排举起,外观上Blackwell显得更加强悍。黄仁勋说:“Hopper很棒,但我们需要更大的GPU。”
最新款的NVIDIA GB200 Grace Blackwell 超级芯片,由两个 B200 Blackwell GPU 和Grace CPU连接而成,比Hopper芯片更大。
其中,B200 GPU包含2080亿个晶体管,可以支持高达10万亿个参数的AI模型。10万亿个参数有多庞大?做个参照,OpenAI的GPT-3 由 1750 亿个参数组成,足见GPU强大的支撑力。
新系列的芯片预计将于今年晚些时候上市,目前尚未透露价格。英伟达表示,AWS、戴尔、谷歌、Meta、微软、OpenAI 和特斯拉计划使用 Blackwell GPU。
为了扩大Blackwell的规模,英伟达还构建了一个名为NVLINK Switch的新芯片。NVIDIA Switch和GB200都被黄仁勋视为“巨大的GPU(one giant GPU)”的关键组件。
同时,英伟达还发布了GB200 NVL72液冷机架系统,其中包含36颗GB200 Grace Blackwell Superchips。与当前的H100 GPU相比,该系统的推理工作负载性能最多能提高30倍。并且,英伟达还将推出一款名为HGX B200的服务器主板,可以将八个B200 GPU连接在一起。
在AI芯片上,英伟达继续一骑绝尘,凭借 Blackwell 的更高性能,这位霸主正努力地进一步巩固业界的主导地位。
从演讲中黄仁勋对Blackwell也充满溢美之词,他说:“Blackwell将是我们历史上最成功的产品发布”、“这就是我心目中GPU的样子”。
汽车芯片Thor引入生成式AI:比亚迪小鹏等入局
自动驾驶一直是英伟达看重的AI方向之一。在汽车智能化的变革中,英伟达深度参与其中,很早就推出了面向汽车智驾的AI计算平台NVIDIA DRIVE,并已经迭代了多系列的自动驾驶芯片,包括Thor、Orin等。
其中,DRIVE Thor是英伟达专为汽车行业的生成式AI应用而打造的车载计算平台。作为DRIVE Orin 的后续产品,DRIVE Thor可提供座舱功能、高度自动化驾驶和无人驾驶功能。这款新一代自动驾驶汽车处理器,也将搭载专为Transformer、大语言模型和生成式AI工作而生的Blackwell架构。
DRIVE Thor预计最早将于明年开始量产,性能高达1000 TFLOPS,远高于Drive Orin公布的254TOPS算力。而英伟达的DRIVE系列芯片平台就要做汽车的最强大脑,目前,其在车规级高算力自动驾驶芯片拥有超过80%的市场份额。
在英伟达看来,NVIDIA DRIVE Thor将改变汽车行业的格局,进入生成式AI定义驾驶体验的时代。此前不少车企已经将大模型应用于座舱,如今包括英伟达、英特尔在内的芯片厂商,正在争夺生成式AI芯片的新市场。
汽车厂商也必然不会错过新时代,英伟达表示,比亚迪将在DRIVE Thor上构建下一代电动车型,同时比亚迪还计划将英伟达的AI基础设施用于云端AI开发和训练技术,并使用NVIDIA Isaac与NVIDIA Omniverse平台来开发用于虚拟工厂规划等应用。
同时,广汽埃安旗下高端品牌昊铂宣布其下一代电动汽车将采用DRIVE Thor平台,新车型将于 2025年开始量产;小鹏特将把NVIDIA DRIVE Thor平台作为其下一代电动汽车的“AI大脑”,助力小鹏自研的XNGP智能辅助驾驶系统,实现自动驾驶和泊车、驾乘人员监控等功能。
此前,理想汽车和极氪均已宣布将在DRIVE Thor上构建其未来的汽车产品。除乘用车外,DRIVE Thor还将应用于卡车、自动驾驶出租车、配送车等细分领域。比如,文远知行正在与联想一同基于DRIVE Thor来创建多个商用L4级自动驾驶解决方案,该解决方案集成在联想首款自动驾驶域控制器AD1中。
软件大更新:人形机器人大模型GROOT、推理平台NIM来袭
今年人形机器人成为另一个聚光灯焦点,英伟达也在加大投资和研发力度,黄仁勋认为:“机器人的ChatGPT时刻可能很快就会到来。”
在今年GTC上,英伟达也在机器人和具身智能领域放大招。英伟达发布了人形机器人通用基础模型Project GROOT,以及基于 NVIDIA Thor 系统级芯片(SoC)的新型人形机器人计算机Jetson Thor。
并且,英伟达还对NVIDIA Isaac机器人平台进行了重大升级,包括生成式AI基础模型和仿真工具,以及 AI 工作流基础设施。
根据介绍,大模型GR00T 驱动的机器人将能够理解自然语言,并通过观察人类行为来模仿动作——快速学习协调、灵活性和其它技能,以便导航、适应现实世界并与之互动。
再看芯片层面,Jetson Thor是一个全新的计算平台,能够执行复杂的任务并安全、自然地与人和机器交互,具有针对性能、功耗和尺寸优化的模块化架构。该SoC当然也采用NVIDIA Blackwell架构,可提供每秒800万亿次8位浮点运算 AI性能,以运行GR00T等多模态生成式AI模型。
Forrester副总裁兼首席分析师戴鲲看来,英伟达面向人形机器人推出大模型和相关Jetson Thor软硬件技术栈,会极大加速人形机器人生态体系的技术发展与业务创新。
和英伟达合作的机器人公司包括如 1X Technologies、Agility Robotics、Apptronik、波士顿动力公司、Figure AI、傅利叶智能、Sanctuary AI、宇树科技和小鹏鹏行等。在发布会上,这些机器人产品和黄仁勋同台,并且还有迪士尼的orange和green登台,和黄仁勋进行互动。
另一个值得关注的软件新产品是NIM微服务。戴鲲向21世纪经济报道记者分析道:“NIM是个推理平台,融合了底层的CUDA、对自身和第三方大模型的支持、对主流推理框架和云平台的集成,可以加速生成式人工智能模型推理全过程,对于包括内容生成、现代知识管理、情景式聊天机器人等各类生成式场景在内的工作负载的加速起到了关键作用,是NVIDIA企业级AI平台的最后一块拼图。”
用黄仁勋的话说,NIM微服务能够帮助开发者面向未来创造新的应用,不需要从零写代码,他认为:“企业IT行业正处于金矿上。”
此外,英伟达推出了NVIDIA Omniverse Cloud API,通过接口开发者可以将Omniverse的技术直接集成到数字孪生等软件应用程序中。Ansys、Cadence、达索、Hexagon、微软、罗克韦尔、西门子等工业软件企业已经在使用该API,同时英伟达正在将Omniverse引入Apple Vision Pro。
可以看到,英伟达构建起越来越强大的AI生态,正在引领生成式AI的新纪元。在上一次工业革命中,电是重要能源,百年后新一轮工业革命正在进行,黄仁勋认为,现在我们正在利用基础设施创造新型的电子(能源),现在的工厂是AI工厂,它们将生产具有高价值的AI产品。
在发布会上,黄仁勋还提到了英伟达的灵魂:计算机图形学、物理学、人工智能的交集。从GB200到人形机器人的GROOT,英伟达还在不断拓展边界,GROOT或许隐喻着“I’m ROOT”,要成为全球人工智能的根。