2025年,人工智能 芯片制造商的命运发生了巨大变化,尤其是英伟达受益匪浅。OpenAI等公司的人工智能增长使英伟达跃居全球最有价值公司榜首,而其他公司则逐渐被淘汰。
在一月的CES上,英伟达宣布了其桌面AI机器,当时名为Digits。该系统使用GB10芯片,搭载Grace处理器和Blackwell图形处理器(GPU)及128GB统一内存,可运行参数高达2000亿的型号。这一型号经过一年演变,最终成为DGX Spark,首个版本于九月交付给特斯拉和SpaceX的首席执行官埃隆·马斯克。
DGX Spark的其他早期受益者包括Anaconda、Cadence Design Systems、ComfyUI Docker、Google、Hugging Face、JetBrains、LM Studio、Meta、Microsoft、Ollama 和 Roboflow,他们正在验证和优化其桌面设备的工具、软件和模型。240W设计还由宏碁、华硕、戴尔科技、技嘉、惠普、联想和微星等厂商生产。
Blackwell的继任者Rubin CPX也正在崛起,为下一代AI工厂提供动力。该芯片于九月宣布,计划于2026年底上市。结合Vera CPU和100TBytes高带宽内存(HBM4),Rubin CPX将在数据中心的单机架中提供8倍次的AI性能,是目前出货GB300 NVL72系统的7.5倍。
“Vera Rubin平台将标志着AI计算前沿的又一飞跃——同时推出下一代Rubin显卡以及一类名为CPX的新处理器,”NVIDIA创始人兼首席执行官黄仁森表示。“正如RTX革新了图形和物理人工智能,Rubin CPX是首款专为大规模上下文AI设计的CUDA GPU,模型能同时处理数百万个知识符号。”
Rubin CPX可提供高达30拍浮点的4位计算能力,配备128GB性价比高的GDDR7内存。它还将视频解码器和编码器以及长上下文推理处理集成于一块芯片中,以实现视频搜索和高质量生成视频等长格式应用的更高性能。
AMD一直在快速追赶AI的步伐。Instinct MI350和MI355 GPU旨在利用AMD数据中心的CPU,提升4倍的AI训练能力,提升最多35倍的推理性能。它们分别在1000W和1400W时突破了功率极限。
然而,情况并非全是积极的。行业分析师强调人工智能互联互通性带来的风险,许多人工智能芯片项目未来将失败。
行业见证了RISC-V AI芯片开发商Esperanto Technologies关闭,Untether AI资产被AMD收购,MIPS于8月被Global Foundries收购,Kinara被NXP半导体收购。
类人机器人是人工智能的新兴领域之一,三星年初加速了其发展。英伟达再次以其Jetson GPU、模型和开源工具走在前沿,用于训练这些机器人。
但也有其他创新。例如,加州大学伯克利分校制造的MAVERIC芯片采用16纳米工艺,配备四个RISC-V处理器核心和13个AI加速器核心。这些设备能够以72帧/秒的速度提供AI视觉分析,应用于机器人应用。
中国一直在推动类人机器人技术的发展,起初是汽车制造商,也着眼于军事应用。
上海傅里叶智能公司开发了第二代GR-2双足机器人,具备53自由度,并声称拥有汽车制造商首款商业化人形机器人。中国汽车制造商也可以在深圳的UBtech预订类人原型车,该公司表示迄今已收到500份订单。
上海开普勒机器人正与50家目标客户合作,开发其K2人形机器人在智能制造、仓储和物流领域的实际场景,公司表示K2“几乎”掌握了自主完成特定任务的能力。
深圳的Engine AI还推出了基于英伟达Jetson Orin计算模块的PM01机器人。这些类人机器人已在汽车工厂测试至2025年,预计技术从工业应用向消费市场的推广将在两到五年内完成。
美国的1X公司正计划加快这一进程,将于十月推出全球首款面向消费级的人形机器人。NEO表示,公司采用英伟达的Jetson Thor芯片实现日常家务自动化,该芯片于八月发货,同时也被用于人工智能,为从汽车到卡车的无人驾驶车辆提供四级自动驾驶。
“类人生物早已是科幻小说……当时它们只是研究的一部分,但如今——随着NEO的推出——类人机器人成为了产品。你我都能伸手触摸的东西。NEO缩小了我们想象力与现实世界之间的鸿沟,让我们能够真正向类人机器人求助,而帮助也会得到满足,“1X的首席执行官兼创始人伯恩特·伯尼希说。
其中一个有趣的新兴芯片供应商是DeepX。这家韩国公司正在考虑为其DX-M1 edge AI加速芯片设计一款树莓派显卡,该芯片于年初进行了采样。它还计划推出2纳米版本M2,功率同样为5W。
它面临的竞争对手是以色列公司Hailo,后者推出了其10H边缘AI处理器,旨在直接在设备上运行生成式AI模型,无需依赖云基础设施。新芯片实现了变换器算法,为边缘应用提供大型语言模型(LLM)和视觉语言模型(VLM)的原生支持。公司还与Avnet ASIC签署协议,使用台积电晶圆厂的最新技术。
BrainChip还筹集了2500万美元,以加速其神经形态边缘人工智能技术的开发和商业化。这笔资金将扩大其面向传感器、医疗设备和可穿戴设备的AKD1500前沿人工智能芯片的生产,这些领域需要低物料清单成本和极小的功耗预算。该芯片支持使用其TENNs架构的设备内大型语言模型,实现实时和私有生成式AI,无需将数据发送到云端。Akida 2平台增加了低功耗的设备端学习,针对需要边缘自适应智能而非固定推理的应用。
恩智浦还利用其3.07亿美元收购变压器边缘AI芯片设计师Kinara,打造类似英伟达CUDA的汽车行业AI生态系统。
NXP连接边缘高级副总裁兼战略主管Rutger Vrijen表示,Kinara Ara-2生成式AI芯片的初始目标是在车内,供驾驶员监控或信息娱乐副驾驶查询手册或监控车内情况并响应环境。
“结合更广泛的产品组合,帮助Kinara实现规模化有巨大机会。但从长远来看,是让客户能够非常容易地在所有设备上采用这一技术,“他说,”我们还没达到CUDA的水平,但软件和工具链优先战略将帮助我们实现这一目标。Kinara不仅是硅片供应商,更专注于让硅片变得可用。”
NXP 已经将工具链和模型动物园整合进其 eIQ 工具,以及 NXP Linux 和 FreeRTOS 发行版。
英伟达以4.4万亿美元的估值结束了这一年,领先苹果的40万亿美元,Alphabet/Google的36万亿美元,以及Microsoft的36万亿美元
这为英伟达带来了显著优势。这使得公司能够投资购买其芯片的人工智能公司,包括OpenAI、xAI和CoreWeave,以及电信巨头诺基亚,并为交易提供了强劲的货币。其中一项关键交易是投资英特尔,开发一款定制CPU与Ruben显卡并行,并可能收购该公司的部分业务。
人工智能市场的强劲对英伟达来说尤其有利,而它一直在利用这一优势。随着Jetson Thor现已上市,Rubin CPX将于2026年上市,公司正加大在多个AI市场的性能提升。
<!-- 非定向300*250按钮 17/09 wenjing begin -->
<!-- 非定向300*250按钮 end -->
</div>