智东西6月1日报道,今日,在GTC台北大会上,英伟达创始人兼CEO黄仁勋穿着闪亮的黑色皮衣发表主题演讲,发布2款芯片、1款桌面级AI超算、多款开源AI模型、框架、函数库,还与宇树科技联合发布了基于宇树H2 Plus机器人的全新人形机器人参考设计。
传闻已久的英伟达首款Arm架构PC芯片终于亮相,名为RTX Spark超级芯片。黄仁勋宣布与微软推出全新PC产品线年来PC产品线首次全面革新”,同样的智能体处理模式还将延展到各种设备上。
他说,计算机的这次革命,重要程度不亚于普通手机演变为智能手机,英伟达已为此制定产品路线图,每一代架构(Grace Blackwell、Vera Rubin、Rosa Feynman)都将配备台式机、笔记本和工作站。
英伟达还发布了全球最强大的Windows平台桌面AI超级计算机DGX Station,以及英伟达豪赌2000亿美元市场的大招——专为智能体设计的Vera CPU。这正是英伟达为智能体运行开拓的两大全新市场。
在Q1财报期间,英伟达曾透露全新Vera CPU将开启一个价值2000亿美元的市场,预计Vera芯片收入将在本财年末达到200亿美元,成为“第二大销售贡献者”。
今日,黄仁勋称Vera CPU具有革命性意义,其产能爬坡令他非常满意,“目前的订单量已注定它将是我们公司历史上最快速、最成功的产品发布。”
面向智能体部署,英伟达推出迄今最强模型Nemotron 3 Ultra、企业级智能体工具箱。其中,Nemotron 3 Ultra的智能体生产力测试分数超过或打平了三个领先的国产智能体模型智谱GLM 5.1、月之暗面Kimi K2.6、阿里Qwen3.5。
面向物理AI,英伟达开源世界基础模型Cosmos 3、无人驾驶推理模型Alpamayo 2 Super,并宣布成立Cosmos联盟。
面向AI工厂,英伟达宣布Vera Rubin全面投产,并掏出了帮AI工厂更稳定、节能的两大利器DSX OS和DSX MaxLPS。
黄仁勋也一如既往地晒了一下英伟达庞大的“朋友圈”,并继续巩固热爱美食的人设,特别感谢了在夜市的水果摊贩,还给了花娘小馆、富霸王猪脚餐厅等几家饭店名字的特写镜头。
黄仁勋认为,在AI工厂时代,每产生1个token就能盈利,每瓦性能、可靠性和系统寿命才是核心财务杠杆。
AI工厂每吉瓦成本是200亿~300亿美元起步,现已攀升至500亿~600亿美元,不久后将达到800亿~1000亿美元。这些投资必须确保一次成功。
在黄仁勋看来,AI会减少工作岗位的说法“完全是无稽之谈”,AI反而推动了软件工程师需求的增长。
最后,在演讲末尾,英伟达播放了由一群人形机器人、OpenClaw龙虾、黄仁勋数字人共同参演的音乐MV。
“时隔40年,微软与英伟达将重新发明PC(个人计算机)。”黄仁勋宣布,英伟达与微软面向个人智能体时代重新构想PC,推出为游戏和智能体而生的RTX Spark超级芯片。
黄仁勋将RTX Spark称作“世界上制造过的最神奇的芯片”,“英伟达100%的软件栈都在其上运行”。
RTX Spark融合了英伟达33年的创新成果,为全球首款专为个人智能体打造的Windows PC提供动力。英伟达CUDA可在RTX Spark上原生运行。
以前使用PC,用户要启动应用程序,点击鼠标,输入文字。现在使用RTX Spark和微软Windows,用户只需提出请求,电脑就能完成工作。
此外,Adobe为RTX Spark重新设计了Adobe Photoshop和Premiere的架构,新版本在创意工作流程中,可将AI、编辑、调色和特效的处理速度最高提升至2倍。
微软与英伟达正在对整个PC做全面重塑,发布了面向智能体的全新三大Windows产品线,涵盖笔记本电脑、台式机、桌面超算。
笔记本电脑厚度仅为14mm,重量仅3磅,有14至16英寸多种尺寸选择,可以24小时不间断本地“养龙虾”。
英伟达今日还推出了一款适用于Windows的桌面AI超级计算机DGX Station。
它支持额外配置一张RTX Pro 6000工作站级GPU,将前沿AI算力与光线追踪可视化相融合,用于跨创意设计和工程应用运行智能体。
黄仁勋预言,未来有一天,每个家庭都会有一台AI超级计算机,运行着你所有的智能体和助手。
传统CPU追求每颗插槽的核心数,切片、虚拟化、按小时出租。在智能体时代,CPU已成为GPU利用率的瓶颈,直接影响token吞吐量、时延与用户体验。
Vera CPU采用LPDDR5X内存(带宽1.2TB/s)、支持PCIe Gen6,内外带宽均达同类最高性能CPU的2至3倍,也是首款在纠正多位错误的同时不损失带宽的CPU。
它基于英伟达第二代可扩展一致性架构,将88个英伟达定制Arm核心Olympus统一在一个单片Mesh网络上,在智能体工作负载上实现了最高的单线程性能与最佳能效比。
其核心并未分散在多个Chiplet上,核心之间的通信速度比传统CPU快50%。Vera支持内存一致性,NVLink-C2C芯片间互联可将GPU直连到架构,还可以将Vera扩展到多个插槽,在CPU之间实现巨大频宽。
与Grace CPU相比,Vera的每个核心每时钟周期可多执行50%的指令。
与配备DDR5的x86 CPU相比,Vera每个核心的带宽多达3倍;与x86 CPU相比,峰值内存延迟降低了40%,在检索分析与沙箱执行中保持核心供给及时。
在Python代码分析、代码编译等常见智能体工具的行业标准基准测试中,Vera的智能体沙箱性能是与x86 CPU竞品性能的1.8倍。
该处理器有四大核心设计原则:领先的每时钟指令数(IPC)/ 单线程性能、每核心带宽、总带宽以及能效。
英伟达Olympus核心专为现代数据中心工作负载、分支密集型Python运行时、工具调用和沙箱代码执行而优化。
每颗核心均为吞吐量调优:神经分支预测器可在每个周期评估两个选定分支,10-Wide解码引擎可在每个周期代入更多工作负载,大型乱序执行引擎维持着指令的运作,新型图引擎的高阶预取器可预测下一个数据路径。
Ver上高速互联总线TB/s,无芯粒税(chiplet tax),无跨片边界损耗,所有核心可与其他任何核心及缓存无延迟通信,不存在调度冲突。
Nemotron 3 Ultra是英伟达迄今最强的新一代开源基础模型,也是面向自主智能体能力最强的模型,共有5500亿个参数。
(1)Alpamayo 2 Super:一款拥有320亿参数的开放无人驾驶推理模型,专为推理、规划、标注和评估设计。
(2)AlpaGym:一款开源闭环强化学习框架,让开发者能够在仿真环境中训练无人驾驶策略,模型动作能够真实影响后续仿线)OmniDreams:一款基于Cosmos构建的专用角色模型,可大规模生成稀有、逼真的长尾驾驶场景。
(4)全新Omniverse NeRF函数库:能在单块GPU上以25ms以内的速度完成真实世界的重建与渲染,使开发者可实时评估模型的感知效果。
这些发布共同为无人驾驶开发者提供了一条更快速、更安全的L4无人驾驶实现路径。
以前组装一个 Grace Blackwell机架需要2小时,现在只需5分钟。产能更高,出货速度也大幅提升。
单个液冷Vera CPU机架容纳256颗CPU,负责模型编排、内存调度与工具调用。
可将威胁检测时间从分钟缩短至毫秒;DOCA Vault可在机架规模上保护AI数据。09
英伟达曾经在计算机内部设计一颗芯片,然后在计算机内部仿真一个系统,如今终于能在数字框架、数字仿真器、数字世界中构建这些庞大的系统,在破土动工、投入真金白银之前验证一切。黄仁勋解释说,
世界正在竞相建设AI工厂芯片、机架、网络、电力、冷却、电网每一层都必须从头到尾协同设计,因为“计算即收入”。
NVIDIA DSX是以最高效率和盈利能力设计、建设与运营AI工厂的参考设计,致力于实现最低Token成本,并守护能源电网安全。今日,英伟达推出适用于DSX平台的全新AI工厂操作系统
。DSX OS是一款模块化、开源、可扩展的基础设施软件,专为AI工厂运营商设计,负责配置、运营、监控和修复基础设施,将已安装的系统转化为可信赖的多租户、高弹性、AI就绪的算力容量。
DSX OS开源组件的生态合作伙伴可接入自有软件,并通过ISV(独立软件供应商)生态加以扩展。
的GPU,每年可新增数十亿美元的营收。热液冷却技术在45℃下运行,耗水更少、能耗更低,将更多电力导向创收算力;
将电力从机架到机架灵活调度,回收闲置功耗,将其输送至有工作负载的地方;机架内削峰平滑技术抑制电流尖峰和功率浪涌,稳定整个工厂的供电;智能体团队与DSX MaxLPS协作,持续协调冷却与电力,以满足工作负载需求。10
2026年正成为AI发展史上很重要的一年。智能体的拐点正在推动生产力大幅度的提高,创造巨大的商业机遇。黄仁勋总结了英伟达构建AI基础设施的优势:
2、每瓦吞吐量、每瓦Token数是世界顶级。仅仅因为芯片更便宜就选择错误的架构,这不划算。每瓦Token数才是关键,买得越多,赚得越多。
4、系统常规使用的寿命。每隔几个月,软件行业就会涌现出新技术。英伟达的系统遍布全球,软件开发者从英伟达CUDA起步,因此生态系统和资产的有效常规使用的寿命自然会更长。如果资产寿命长,则总拥有成本(TCO)低。
正如黄仁勋强调的,英伟达已经不单单是一家GPU公司和系统公司,而是一家基础设施公司,一切都是为了帮客户实现最大营收、最高利润,并尽快实现目标。
上一篇:消费品 - OFweek机器人网