人工智能不仅会“思考”,还会“动、推理”的时代已经开始。 NVIDIA 在 CES 2026 上宣布的 Rubin 平台和 Alpamayo 将使自动驾驶汽车能够口头解释其行为的原因,同时将代币成本降低 10 倍。这是物理 AI 革命的开始。
NVIDIA创始人兼首席执行官黄仁勋在CES 2026上宣布,该公司首款6芯片AI平台Rubin已进入全面量产。与上一代平台相比,Rubin 将代币生成成本降低了约 10 倍。组件包括具有 50 petaflops NVFP4 推理性能的 Rubin GPU、Vera CPU、NVLink 6、Spectrum-X 以太网光子、ConnectX-9 SuperNIC 和 BlueField-4 DPU。它还宣布了 Alpamayo,这是一个用于自动驾驶开发的开放推理模型系列,该模型将于今年在美国的梅赛德斯-奔驰 CLA 中部署。
NVIDIA 在六个领域提供开放模型,包括用于医疗保健的 Clara、用于气候科学的 Earth-2 以及用于机器人技术的 Cosmos。 DGX Spark 在大型模型中实现了高达 2.6 倍的性能提升,并在游戏领域宣布了 DLSS 4.5。超过 250 个游戏和应用程序支持 DLSS 4 技术。
【编辑部评论】
NVIDIA此次发布的不仅仅是一款新产品的推出。它标志着人工智能从“大脑”进化为“身体”的转折点。
首席执行官黄仁勋“物理AI的ChatGPT时刻”如上所述,人工智能目前还仅限于生成文本和图像,现在已经进入了对物理世界的理解、推理和行动的阶段。
Rubin平台的技术意义在于六颗芯片的极致协同设计。Rubin 将芯片、托盘、机架、网络、存储和软件作为一个整体进行优化,而传统上的组件是单独开发的。我正在做。
结果,我们实现了 50 petaflops 的推理性能(比 Blackwell 快 5 倍)和 35 petaflops 的训练性能(比 Blackwell 快 3.5 倍)。晶体管数量也从Blackwell的2080亿个大幅增加到3360亿个。
值得注意的是,与 Blackwell 相比,它需要四分之一的 GPU 数量来训练相同的 MoE(专家混合)模型。这不仅仅是性能的提升,还有可能从根本上改变人工智能基础设施的经济性。
宣布进军自动驾驶领域阿尔帕马约超越了传统的“感知→计划→行动”的三步过程。 100亿参数的视觉-语言-动作模型“Alpamayo R1”不仅直接根据摄像头输入生成动作,还输出“我们为什么采取该动作”的推理过程。
这使得自动驾驶能够解决“长尾问题”——罕见且难以预测的边缘情况。它是像人类一样做出灵活决策的能力,即使在基于规则的系统无法处理的未知情况下也是如此。
梅赛德斯-奔驰 CLA 将于 2026 年第一季度在美国开始实施。最初部署为 Level 2+ 系统,传感器配置(10 个摄像头、5 个雷达、12 个超声波传感器)和双栈架构允许未来迁移到 Level 4。
同样重要的是,NVIDIA正在推动开放模型战略。我们的目标是通过发布 Clara(医疗保健)、Earth-2(气候科学)、Cosmos(机器人)和 GR00T(体现智能)等各个领域的模型来构建全球人工智能生态系统。
另一方面,人工智能在现实世界中运行也带来了新的风险。推理过程越复杂,验证意外行为就越困难。 Alpamayo 的双堆栈设计——人工智能驱动的堆栈和基于物理规则的安全堆栈——是应对这一挑战的一个答案。
从长远来看,未来的愿景是整个制造工厂将成为一个“巨型机器人”。与西门子扩大合作伙伴关系是一次尝试将物理人工智能集成到从设计到模拟到生产的所有流程中。
过去十年建造的价值约 10 万亿美元的计算基础设施将根据这一新范式进行更新。鲁宾和阿尔帕马约处于这一转变的中心。
【术语解释】
Physical AI(物理的AI)
人工智能的总称,它能够理解物理世界、做出推理并实际采取行动。它不仅生成文本和图像,还可以作为物理系统运行,例如机器人或自动驾驶汽车。
VLA(视觉-语言-行动)模型
集成视觉信息(摄像头图像)、语言理解(推理过程)和物理行为(例如方向盘操作)的人工智能模型。它不是传统的“感知→规划→行动”的逐步过程,而是直接端到端地生成行动。
代币
AI 模型处理的最小信息单元。对于文本来说,它指的是单词的片段;就推理而言,它指的是思维单位。由于生成AI的成本与代币数量成正比,因此降低代币成本与经济效率直接相关。
千万亿次浮点运算
每秒可执行 1,000 万亿(10 的 15 次方)次浮点运算的计算性能单位。作为表达AI模型训练和推理速度的指标。
教育部(专家组合)
结合了多个专门神经网络(专家)的人工智能架构。根据输入选择最优专家,高效实现大规模模型。
边缘情况/长尾问题
这种情况很少发生,但很难处理。在自动驾驶中,这是指无法通过基于规则的方法处理的无数特殊情况,例如意外物体的出现或异常天气条件。
极限协调设计(Extreme Codesign)
一种将所有组件(包括芯片、网络、存储和软件)作为一个整体而不是单独优化的设计方法。瓶颈是可以从根本上消除的。
[参考链接]
英伟达官方网站(外部)
开发GPU和AI计算技术的全球半导体公司官网
NVIDIA DRIVE – 自动驾驶人工智能解决方案(外部)
自动驾驶汽车开发端到端平台的官方页面
NVIDIA Alpamayo – 自动驾驶的开放模型(外部)
开放VLA模型和仿真蓝图,实现4级自动驾驶
GeForce RTX 官方网站(外部)
面向游戏创作者的 GPU,集成了光线追踪和 AI 技术
梅赛德斯-奔驰官方网站(外部)
汽车制造商计划于2026年第一季度在美国推出搭载Alpamayo的新款CLA
[参考视频]
NVIDIA 与首席执行官黄仁勋现场直播 – CES 2026 完整主题演讲
通过 NVIDIA 官方渠道观看 CEO 黄仁勋在 CES 2026 主题演讲的完整版(3 小时 17 分钟)。包括有关 Rubin 平台、Alpamayo 和物理 AI 生态系统的详细演示和演示。
NVIDIA Rubin 平台:六款新芯片、一台 AI 超级计算机
NVIDIA官方6芯片集成AI平台技术讲解视频。介绍Rubin GPU、Vera CPU、NVLink 6、ConnectX-9 SuperNIC和BlueField-4 DPU的协同运行,以及15,000个工程师年的开发过程。
[参考文章]
“物理 AI 的 ChatGPT 时刻”:Nvidia CEO 展示新的 AI 模型和芯片(外部)
首席执行官黄解释了他所描述的物理人工智能 ChatGPT 时刻背后的背景
NVIDIA 与 Rubin 携手开启下一代 AI(外部)
宣布将推理代币成本降低至 1/10,并将 MoE 模型训练 GPU 数量降低至 1/4
Nvidia 在 CES 2026 上推出其下一个主要人工智能平台 Vera Rubin(外部)
报告的性能改进数据为 5 倍推理性能、3.5 倍训练性能和 3360 亿个晶体管
Nvidia 推出用于自动驾驶的开源 AI,并于 2026 年第一季度搭载梅赛德斯-奔驰 CLA(外部)
Alpamayo R1百亿参数VLA模型及奔驰CLA实现细节报告
黄仁勋 CES 主题演讲点燃分析师对 Nvidia 未来的乐观情绪(外部)
分析 10 万亿美元的计算基础设施更新中的竞争优势
Nvidia 在 CES 上展示下一代 Rubin AI 芯片以平息泡沫担忧(外部)
鲁宾指出,大幅降低成本有可能加速人工智能的实际应用并维持需求
Nvidia 在 CES 2026 上推出 Vera Rubin AI 计算平台(外部)
关于人工智能基础设施经济转型的报告将把教育部模型训练所需的 GPU 数量减少到四分之一
[编者后记]
人工智能不仅会“思考”,还会“行动”的时代即将正式开启。您是否曾经想象过未来您的汽车会用语言向您解释为什么您以某种方式驾驶汽车?
NVIDIA的公告表明,这样的未来可能会比预期更早到来。由于成本降低和开放,物理人工智能将不再是少数公司的专利。
您认为推理机器人和自动驾驶汽车需要多长时间才能成为您日常生活的一部分?如果您对这项技术有任何期望或疑虑,我们愿意与您一起考虑。
