Oracle和AMD扩大AI超级集群与Instinct GPU 的合作伙伴关系

甲骨文和 AMD 正在扩大与下一代人工智能超级集群的长期合作伙伴关系，该集群旨在为人工智能工作负载提供巨大的可扩展性和性能。从 2026 年第三季度开始，甲骨文云基础设施（OCI）将成为第一家公开提供由 50,000 个 AMD Instinct MI450 系列 GPU 提供支持的人工智能计算集群的超大规模企业，并计划扩展到 2027 年。

这一公告标志着竞争激烈的云人工智能基础设施领域的又一重大举措，凸显了芯片制造商和超大规模企业如何联手满足前所未有的计算能力需求。此外，此次合作凸显了开放标准、节能设计和可扩展架构对于欧洲数据中心和人工智能生态系统日益增长的重要性。

人工智能工作负载的增长超出了当今集群的限制，因此需要灵活、高性能的计算基础设施。甲骨文即将推出的人工智能超级集群将采用 AMD 全新的“Helios”机架设计——集成 Instinct MI450 系列 GPU、下一代 EPYC CPU（代号 Venice）和 Pensando 网络（代号 Vulcano）。这种垂直优化的设置旨在提供极致的性能和可扩展性，同时最大限度地减少功耗。

Oracle 云基础设施执行副总裁 Mahesh Thiagarajan 表示：“我们的客户正在构建一些世界上最雄心勃勃的 AI 应用，这需要强大、可扩展和高性能的基础设施。”通过将最新的 AMD 处理器创新与 OCI 安全、灵活的平台和由 Oracle Acceleron 提供支持的高级网络相结合，客户可以充满信心地突破界限。”

AMD 数据中心解决方案事业群执行副总裁兼总经理 Forrest Norrod 补充道：“AMD 和甲骨文继续引领云中人工智能创新的步伐。借助我们的 AMD Instinct GPU、EPYC CPU 和先进的 AMD Pensando 网络，Oracle 客户可以获得强大的新功能，用于训练、微调和部署下一代 AI。

新的MI450系列GPU将配备高达432GB的HBM4内存和20 TB/s的带宽，能够训练比前几代处理器大50%的模型。密集的液冷 Helios 机架每个机架将容纳 72 个 GPU，并集成 UALink 和 UALoE 开放互连，以减少延迟并简化加速器之间的通信。

每个 GPU 可以通过多达三个 800 Gbps Pensando“Vulcano”AI-NIC 连接，提供符合新兴超以太网联盟（UEC）标准的高速、无损网络。该架构还将包括下一代 EPYC CPU，支持机密计算和增强的数据安全性。

除了推出 MI450 之外，Oracle 还宣布全面推出使用 AMD Instinct MI355X GPU 的 OCI 计算实例，该实例可在其 zettascale Supercluster 平台上使用，可扩展至 131,072 个 GPU。这些新模式旨在为企业和研究组织提供灵活、开源兼容的解决方案，用于大规模训练、推理和高性能计算工作负载。

通过这次最新的扩张，甲骨文和 AMD 押注于大规模人工智能基础设施的开放、节能的未来——一个旨在处理未来万亿参数模型的未来。

            <!-- 非定向300*250按钮    17/09  wenjing  begin -->

            <!-- 非定向300*250按钮  end -->
        </div>

Source link

相关推荐

近期文章