在今日北京时间凌晨一点,于美国加州圣荷西隆重登场的 NVIDIA GTC (GPU Technology Conference)NVIDIA CEO 黄仁勋发表了备受期待的主题演讲,现场吸引了超过 2.5 万名来自各界的产业专家、研究人员与科技爱好者齐聚一堂 。 这场全球瞩目的科技盛会,不仅是技术交流的重要平台,被比喻为科技界的「超级盃」。 GTC 的与会人数持续增长,充分展现了各界对于英伟达在人工智能领域最新发展的高度关注与浓厚兴趣。 这也印证了英伟达的技术进步及其在更广泛的 AI 领域所扮演的关键角色。 黄仁勋的这番话不仅点燃了现场的热情,更预示着 NVIDIA 的创新将为整个科技生态系统带来积极的影响,而不仅仅是公司本身。

次世代GPU架构磅礴登场:Blackwell Ultra与Rubin系列将引领效能飞跃
在本次 GTC 大会上,最引人注目的莫过于 NVIDIA 次世代 GPU 架构的重磅发布。 黄仁勋首先揭露了新一代 Blackwell GPU 的升级版本,名为「Blackwell Ultra」,其设计理念完全聚焦于蓬勃发展的 AI 推理应用。 Blackwell Ultra NVL72平台展现了惊人的效能提升,其带宽较前代产品提升了两倍,内存速度也加快了1.5倍,这将能显著加速代理型AI、实体型AI以及各式推论模型的开发与部署。 紧随其后,NVIDIA 更预告了即将问世的 GB300 NVL72 服务器,这款强大的系统将整合 72 颗 Blackwell Ultra GPU 与 36 颗基于安谋 Neoverse 架构的 Grace CPU,其整体 AI 效能相较于之前的 GB200 NVL72 有了显著的提升。 这种GPU与CPU的异构计算架构,展现了英伟达持续优化其系统级解决方案,以满足日益复杂的AI工作负载需求的决心。

不仅如此,NVIDIA更将目光投向了更遥远的未来,宣布将于2026年下半年推出下一代AI超级芯片Vera Rubin,并计划在2027年下半年推出其升级版本Vera Rubin Ultra。 Vera Rubin Ultra 的规格更是令人震撼,它将整合四个 GPU,其运算性能将是目前 Hopper 架构的 900 倍,相较之下,Blackwell 的效能则是 Hopper 的 68 倍。 值得注意的是,Blackwell 在 AI 推理效能方面,也相较于 Hopper 提升了 40 倍。 这些数据清晰地描绘出英伟达在GPU技术上的飞速进展,以及其持续挑战运算极限的雄心壮志。 Blackwell Ultra预计将于2025年下半年问世,其运算能力将在Blackwell的基础上再提升1.5倍。
GPU 架构 | 预计推出时间 | 相较于 Hopper 的效能提升 | 主要应用 | 备注 |
---|---|---|---|---|
Blackwell Ultra | 2025年下半年 | 68 倍 (整体), 40 倍 (推理) | AI 推理、代理型 AI、实体型 AI | NVL72 平台带宽提升 2 倍,内存速度提升 1.5 倍 |
Vera Rubin | 2026年下半年 | 900 倍 (Vera Rubin Ultra) | AI 超级运算 | Vera Rubin Ultra由4个GPU整合而成,沿袭Grace Blackwell的CPU+GPU设计 |
GB300 NVL72 服务器 | 即将推出 | 比 GB200 NVL72 提升 | 连接 72 颗 Blackwell Ultra GPU 与 36 颗 Grace CPU |
网络上也有人已经做好翻译版本,全长两小时,有兴趣的朋友可以直接观看,我们将内容重点整理在下方:
在本次主题演讲中,黄仁勋反复强调「AI 工厂」的概念,并将 tokens 视为未来 AI 运算最核心的单位。 这种将 AI 基础设施视为如同工业时代的工厂,而将运算资源量化为代币的想法,预示着 AI 运算模式的重大转变。 NVIDIA 将代币定义为 AI 运算的计算单位,这有助于更清晰地理解和衡量 AI 模型运行所需的资源消耗。 AI 模型现在能够主动生成答案,这从根本上改变了传统的运算方式,使得运算的每一个环节都经历了深刻的变革。 未来,计算机的角色将从单纯的文件检索者转变为软件的代币生产者,这意味着运算能力的输出将直接体现在 AI 生成的内容和服务上。

随着 AI 推理和强化学习等应用需求的持续攀升,对 AI 运算能力的需求也呈现指数级的增长。 推理作为 AI 模型生成代币的过程,对于企业而言至关重要。 因此,构建能够高效且高性能地产生这些 tokens 的「AI 工厂」就成为了关键。 为了应对未来 AI 模型参数规模可能达到数兆级别的挑战,以及提供更精确的响应,在推理阶段投入更多的运算资源(即测试时的扩展)将变得至关重要。 这也解释了为何需要像 Blackwell 系列这样强大的系统,才能够应对日益增长的 AI 运算需求。

具备推理能力的 Agentic AI 与 Physical AI
黄仁勋在演讲中强调,人工智能正处于一个重要的转折点,其智能程度不断提升,应用领域日益广泛,并获得了更多的资源支持。 NVIDIA 正在积极开发能够逐步进行推理的 AI 技术,并深入探讨推理和强化学习的需求如何驱动对 AI 运算能力的需求。 这种「一步一步」的推理能力,代表着 AI 正朝着更强大的问题解决和决策能力迈进。 所谓的「物理 AI (Physical AI)」是指能够理解物理世界基本规律的人工智能,例如摩擦力、惯性、因果关系以及物体的持久性等概念。 这种能力对于机器人技术和自主系统的发展至关重要。

另一方面,「具备代理能力的 AI (Agentic AI)」则更进一步,它指的是拥有自主性的 AI,能够感知和理解周遭环境的状况,进行复杂的推理,制定行动计划并付诸实施,甚至可以使用各种工具来完成任务。 这种 AI 能够独立解决问题并达成目标,展现出类似人类的自主性。 值得注意的是,相较于传统的大型语言模型(LLM),推理模型在获取正确答案时,需要消耗多达20倍的代币和150倍的运算资源。 这再次凸显了高性能运算系统对于发展更智能 AI 的重要性。

机器人技术重大突破:Isaac GR00T N1与Newton平台加速产业转型
NVIDIA 在机器人技术领域也取得了显著的突破。 黄仁勋宣布推出一系列旨在增强人形机器人开发的技术,其中包括已经上市的NVIDIA Isaac GR00T N1。 这被誉为全球首个开放、完全可定制的通用人形推理和技能基础模型。

黄仁勋认为,机器人技术将有助于解决全球面临的劳动力短缺问题,并且这个领域蕴藏着巨大的发展潜力。 为了进一步推动机器人技术的发展,NVIDIA还与百度DeepMind和迪士尼研究院合作开发了Newton机器人平台。 这是一个开源的物理引擎,专为机器人学习进行了优化。 Newton 基于 NVIDIA Warp 框架构建,不仅针对机器人学习进行了优化,还能与百度DeepMind 的 MuJoCo 和 NVIDIA Isaac Lab 等模拟框架兼容。 精密的物理模拟技术对于提升机器人接近人类的运动能力至关重要,它能使机器人通过触觉反馈来学习并优化其行为模式。

值得一提的是,美国最大的汽车制造商通用汽车(GM)将与NVIDIA展开合作,利用AI、模拟技术和加速计算,共同开发下一代汽车、智能工厂以及机器人技术。 两家公司将携手运用英伟达的加速计算平台,包括搭载英伟达 Cosmos 的 NVIDIA Omniverse,来构建定制化的 AI 系统,用于训练 AI 制造模型,从而优化通用汽车的工厂规划和机器人技术。 此外,通用汽车还将采用英伟达A DRIVE AGX作为其车载硬件,以实现未来更先进的驾驶辅助系统和车内增强型安全驾驶体验。


Spectrum-X与Quantum-X交换机打造超大规模AI工厂
为了应对 AI 运算爆炸性增长所带来的资料中心数据传输瓶颈,NVIDIA 宣布与台积电 (TSMC)、鸿海科技集团、日月光投控旗下的矽品精密工业股份有限公司以及波若威科技股份有限公司等多家厂商携手合作,推出了全新的 NVIDIA Spectrum-X 和 NVIDIA Quantum-X 硅光子共同封装光学 (CPO) 网络交换器。 这项技术的目标是打造能够跨越不同地点、连接数百万个 GPU 的超大规模 AI 工厂,预示着「AI 世界的光通讯时代」的来临。 通过将硅光子技术直接整合到交换器内部,可以突破过去超大规模和企业网络所面临的限制,实现信号损耗的减少和功耗的降低。 Spectrum-X Photonics 以太网和 Quantum-X Photonics InfiniBand 平台均能实现高达每端口 1.6Tb/s 的速度,总带宽更可达到 400Tb/s。

相较于传统的网络解决方案,这些新型交换器集成了光学创新技术,不仅减少了四倍的激光器使用量,更实现了3.5倍的能源效率提升、63倍的信号完整性增强以及10倍的网络弹性提升。 Quantum-X 硅光子交换器预计将于今年稍晚时候上市,而各大系统厂商则计划在2026年推出Spectrum-X硅光子交换器。 值得一提的是,NVIDIA Spectrum-X 和 Quantum-X 硅光子共同封装光学网络交换器采用了台积电的 COUPE 平台及其先进的 SoIC-X 封装技术。

英伟达携手通用汽车等产业巨擘加速创新
NVIDIA 正积极与各行各业的领导者展开合作,共同推动技术创新。 与美国汽车巨头通用汽车(GM)的合作便是其中的一个重要例证。 双方将携手利用AI、模拟技术和加速运算,共同开发下一代汽车、智能工厂以及机器人技术。 这项合作不仅仅局限于自动驾驶技术的研发,更涵盖了生产制造和工业机器人等广泛领域。

两家公司将共同利用英伟达的加速计算平台,包括搭载英伟达 Cosmos 的 NVIDIA Omniverse,来构建定制化的 AI 系统,以训练 AI 制造模型,从而优化通用汽车的工厂规划和机器人技术。 此外,通用汽车还将采用英伟达A DRIVE AGX作为其车载硬件,以实现未来更先进的驾驶辅助系统和提升车内的安全驾驶体验。

软硬件生态系统持续扩展:Dynamo与DGX系列强化开发者能量
为了进一步完善其AI生态系统,NVIDIA还推出了一项名为Dynamo的重要技术。 这是一个开源的 AI 推论服务,黄仁勋将其形象地比喻为「AI 工厂的作系统」,其命名灵感源自于推动工业革命的第一台发电机。 NVIDIA表示,Dynamo这项技术能够将AI模型的推论性能提升高达30倍,为企业带来更高的生产效率和商业价值。

此外,为了让 AI 开发人员、研究人员、数据科学家和学生能够更便捷地进行大型模型的原型设计、微调和推理,NVIDIA 推出了前身为 Project DIGITS 的「DGX Spark」,以及一款由 NVIDIA Blackwell Ultra 平台支持的新型高效能 NVIDIA Grace Blackwell 桌上型超级计算机「DGX Station」。 NVIDIA 还与华硕、戴尔等业者合作,共同推出为开发者量身打造的「DGX 个人 AI 超级计算机」系列。 这些举措旨在降低 AI 开发的门槛,并赋予开发者更强大的工具和平台。

展望未来,英伟达持续引领AI技术发展
尽管 NVIDIA 在 GTC 2025 上展示了其在 AI、机器人、数据中心等多个前瞻技术领域的重大突破,以及在运算能力上的显著提升,但华尔街和投资者的反应却相对平淡。 在盘后交易中,NVIDIA的股价下跌了约4%。 这可能反映出市场对NVIDIA的高期望值已经被部分消化,或者投资者对新技术的短期财务影响仍持谨慎态度。 另一方面,以「低成本、高效能」为卖点的 AI 新创公司 DeepSeek 的崛起,在全球范围内引发了关于 AI 军备竞赛的讨论,并被视为 NVIDIA 在 AI 硬件领域主导地位的潜在挑战。 包括AMD和Intel在内的传统芯片制造商也在积极开发其AI导向的芯片,预计将在2025年对NVIDIA的市场领导地位构成更直接的竞争。 此外,包括 Google、Amazon 和 Microsoft 等科技巨头也开始设计和生产自己的 AI 芯片,以期减少对 NVIDIA 产品的依赖。 这些因素都预示着 AI 芯片市场的竞争将更加激烈。
总体而言,NVIDIA 在 GTC 2025 上所展示的一系列创新技术和战略布局,再次巩固了其在人工智能和加速计算领域的领导地位。 无论是次世代GPU架构的性能飞跃,还是硅光子技术所带来的互联革命,都展现了NVIDIA持续突破技术边界的决心和能力。 公司在机器人技术、软硬件生态系统以及跨界合作方面的积极投入,也预示着 AI 技术将在未来几年内迎来更加显著的进步。 尽管面临来自市场和竞争对手的挑战,NVIDIA凭借其前瞻性的技术 vision 和强大的执行力,有望继续引领全球 AI 技术的发展方向。