来源:DeepTech深科技
尽管只是一名高中肄业生,但是詹姆斯·达克穆比(James Dacombe)已经在半导体这个最烧钱、最难撼动的赛道之一,从英伟达的眼皮底下硬生生抠出了 10 亿美元的芯片独角兽估值。
就在本周,詹姆斯创办的名为 OLIX 的神秘芯片初创正式对外承认:融资 2.2 亿美元,约合人民币 15 亿元。领投方是当年押中欧洲估值最高金融科技独角兽之一 Revolut 和“英国版美团”Deliveroo 的 Hummingbird,跟投名单里还躺着 Plural、LocalGlobe 等一众欧洲顶流 VC。
图 | 25 岁的詹姆斯已经有点少年老成(来源: Charlie Bibby/FT)詹姆斯公司官网首页的宣言火药味十足:“我们正在摆脱 HBM。”HBM 高带宽内存,是英伟达 GPU 称霸 AI 算力的心脏起搏器。从 V100 到 H100,再到刚发布的 Vera Rubin,英伟达每一代旗舰芯片的背后都站着 SK 海力士和三星,每颗芯片里堆叠的那几层 DRAM,一直都是黄仁勋身后最坚固的护城河之一。
而这名 00 后小孩却说:不玩这个了。这是仗着年轻耍狠、还是真有新洞见?翻开 OLIX 那份在圈内广为流传的《计算宣言》,你会看到一群平均年龄可能不到 30 岁的 Z 世代们,正在试图使用一种近乎降维打击的逻辑,拆解整个 GPU 圈子的物理极限。
图 | 计算宣言(来源:https://olix.com/blog/compute-manifesto)詹姆斯的核心洞察有点反常识, 他认为 AI 推理真正的瓶颈其实是“搬砖”。今天的模型参数动辄达到万亿级,每生成一个 token,就要把几百 GB 的权重从 HBM 里搬进搬出。 这个过程的能耗占到了单次推理的 60% 以上,而搬得越快,热死的风险就越高。
为了摊薄这笔搬运成本,GPU 只能想尽办法拼车,也就是把几千个用户的请求捆成一捆同时处理。吞吐量上去了,交互性却崩了。这就是就算使用比较新的 GPT-5.2 Pro,每秒依然只能往外蹦十几个 tokens 的原因。詹姆斯把这种困境叫做冯·诺依曼墙,并直言英伟达自己也翻不过去。
从 Hopper 到 Rubin,封装面积已经膨胀了几倍,接近光罩极限;之前那种从 HBM3e 到 HBM4 的能量效率提升,未来十年可能都不会再复现。哪怕是全球唯一能够挑动台积电 CoWoS 产能的客户,哪怕账上存有几百亿美金预付款,物理定律始终无法绕开。
当超大规模云厂商都在抢产能的时候,初创公司根本挤不进去,所以詹姆斯选择彻底绕开它。绕开的方案听起来有点混搭:SRAM + 光子学。
SRAM 堪比是缓存界的法拉利,速度比 HBM 快上百倍,缺点是一颗晶体管只能存六分之一个比特。以前没人敢用它做主存,因为容量永远喂不饱模型。但詹姆斯打算赌一把:既然搬运的代价已经超过了计算的代价,那不如把数据焊在计算单元的隔壁,哪怕少存点也要做到随时可以使用。
这恰好踩中了 2026 年 AI 领域最大的范式转移之一。随着 OpenAI o1、Anthropic Claude Code 这类具备慢思考能力的推理模型的大规模落地,单次任务的 token 消耗正在以超指数级的速度膨胀。任务长度每翻一倍,所需要的 tokens 预算却不只翻一倍。METR 研究所的数据显示,到 2027 年底 AI 将能处理相当于人类两周工时的工作量。
在这种新型负载下,内存带宽的重要性正在被内存延迟所取代。你不再需要一次性灌进去整个维基百科,但你需要每一毫秒都能以极低延迟捞出来一段 KV cache,而这便是 SRAM 发挥作用的主场。
但是,纯 SRAM 方案有个死穴:光靠硅是长不大的。Cerebras 公司的晶圆级芯片使用了 44GB SRAM,功耗惊人且只能服务极少数头部客户。而詹姆的解法是在 SRAM 中引入第三元素也就是光。
虽然詹姆斯对于自己公司的光学架构讳莫如深,但从有限的公开信息推测,他们的光学数字处理器极有可能在使用光子做互连。光线在硅波导中的传输速度是电信号的数倍,且几乎没有电阻热损耗。当几千个 SRAM 计算单元需要高频同步时,使用电线连接会因为电容电阻导致信号畸变,而使用光连接则像是在芯片内部修了一条超宽光纤高速道路。
这其实不是天方夜谭,从英特尔分拆出来的 Ayar Labs 已经做出了光学中介层,能把芯片面积拓展到几十平方厘米,远超英伟达的 Blackwell。詹姆斯的激进之处在于,他要把光和 SRAM 焊死在一个系统里,进而从机架层面重新设计数据的流动方式,等于从零开始建设一座光速工厂。
然而,过去十年试图把光搬进数据中心的公司不下二十家,活下来的寥寥无几。就算技术跑通了,客户还要问:CUDA 兼容吗?PyTorch 能无缝迁移吗?詹姆斯公司的芯片可能到 2027 年才流片,那时英伟达的 Rubin Ultra 已经跑起来了。
面对这些质疑,詹姆斯反复强调的是兼容性, 他表示自己和团队打造的 OTPU 支持标准 AI 模型,无需强制量化感知训练,也不需要所谓的类脑热力学架构,等于造了一台能够跑通现有代码、而且跑得比谁都快得异类引擎。
作为一名 00 后,詹姆斯身上似乎带有一定的审慎。这或许和他虽然年轻但在 16 岁就从高中退学进入初创公司写代码,17 岁创办脑机接口企业 CoMind 并在 8 年内把这家公司做到融资一亿美元有关。所以你光看他的照片,会觉得这可能不是一名 00 后,因为看起来似乎有点成熟,这可能是因为他已经经过技术商业化的全周期,明白供应链三个字有多么重要。
创办 CoMind 的经历让他比同龄人更早地明白:传感器精度并不是医疗器械的最大瓶颈,其实是拿到 FDA 许可后怎么保证一千台设备的神经探针不断货。同样的逻辑映射到 AI 芯片,当连 HBM 都抢不到的时候,架构再领先也只是一纸 PPT。
所以,詹姆斯此次创办 OLIX 把去 HBM 上升到了战略高度。这算是一个比较讨巧的生存策略,在 2026 这个节点,台积电 CoWoS 产能被英伟达和博通买断三年,SK 海力士的 HBM3e 订单已经排到 2027 年。詹姆斯的公司作为一个新玩家哪怕融资了 2.2 亿美元,在前面两座大山之前依然渺小。唯一的活路就是赌一条尚且宽松的道路,然后跑得足够快。
目前来看,资本是愿意押注的。前 Meta 基础设施一号位、Vertex Ventures 的合伙人乔纳森·海利格(Jonathan Heiliger)给出了极高评价,其表示这种量级的系统级重构,难到令人发指。而詹姆斯团队的执行速度,是有着十倍更多资源公司的十倍。
Heiliger 是见过大世面的人。他在 Meta 主导过开放计算项目,亲眼见证了英伟达从显卡厂商变为 AI 基建定义者。如今他把赌注押在一个 25 岁的伦敦男孩身上,赌的是摩尔定律终结之后,算力霸权不会永远属于单一架构。
英国政府也在赌。就在詹姆斯公司融资消息公布没多久, 英国 AI 大臣卡尼什卡·纳拉扬(Kanishka Narayan)公开喊话,要求英国本土创业者拥抱风险,并宣布另一家英国光芯芯片初创 Fractile 将投资 1 亿英镑拓张布里斯托工厂。 经历过 Arm 被软银收购、Graphcore 被软银打包带走的阵痛之后,英国太想留住一直属于自己的 AI 独角兽了。
但是,詹姆斯和公司要跨越的不仅是技术和资本。他和团队需要证明 OTPU 不只是论文里的 benchmark 榜首,也是能在某家云厂商的数据中心里连续跑几个月推理任务不出错的工业级产品。
他需要说服那些习惯了 CUDA 生态的算法工程师,为了更低的延迟和 TCO 去重写部分底层调度逻辑。他还需要在 2027 年之前从几乎为零的客户名单里,撬开第一个愿意吃螃蟹的早期采用者。据了解,第一批 OTPU 芯片预计在 2027 年投用,那时詹姆斯 26 岁,依然比当年创办英伟达的黄仁勋年轻了几岁。
参考资料:
https://olix.com/
https://www.ft.com/content/cba54e86-2b2a-422c-861b-dc9280d6aa65
https://www.datacenterdynamics.com/en/news/uk-chip-startup-olix-raises-220m-for-development-of-photonic-ai-chips-that-forgo-the-need-for-hbm-report/
https://fudzilla.com/olix-is-pitching-a-new-way-to-do-ai-chips/
https://www.beauhurst.com/blog/the-uks-youngest-entrepreneurs/
https://www.linkedin.com/company/flux-corp/
运营/排版:何晨龙
]article_adlist–>
<!-- 非定向300*250按钮 17/09 wenjing begin -->
<!-- 非定向300*250按钮 end -->
</div>