CPO 技术崛起:在 AI 网络数据中心的应用突破
在当今科技飞速发展的时代,半导体行业正经历着深刻的变革。2025 年 11 月 24 日消息,电源问题正成为数据中心运营商面临的一大挑战,随着人工智能的蓬勃发展,他们需要支持越来越大规模的 GPU 服务器部署。而这一现状正推动着曾经被认为不成熟且易出错的共封装光(CPO)交换机技术的采用。
在本周于圣路易斯举行的 SC25 超级计算大会上,英伟达宣布 GPU 位集群运营商 Lambda 和 CoreWeave 将采用其 Quantum - X Photonics CPO 交换机,德克萨斯高级计算中心 (TACC) 也将进行部署。不过,英伟达并非一家独大,博通展示了基于 Tomahawk 5 和 6 的 CPO 交换机。尽管 CPO 交换机有望在 2026 年迎来爆发式增长,但这一路走来并非一帆风顺,且发展之路仍在继续。

那么,是什么推动了 CPO 的更迭呢?答案是 “速度和力量”。AI 网络需要极快的端口速度,高达 800 Gbps,英伟达更是通过下一代 ConnectX - 9 网卡制定了实现 1.6 Tbps 端口速度的计划。然而,在这样的高速下,直连铜缆传输距离仅有一两米,且通常需要昂贵的重定时器。将成千上万个 GPU 连接在一起,可能需要数十万个耗电的可插拔收发器。
网络设备厂商如博通多年来一直在尝试 CPO 技术。该技术将传统位于可插拔收发器中的光组件集成到设备本身,使用与交换机 ASIC 封装在一起的一系列光子芯片。光纤直接连接到交换机前面板,不再需要 QSFP 插槽和可插拔模块。
虽然单个收发器功耗不多,约 9 到 15 瓦,但在 AI 后端网络的大型无阻塞胖树网络中,功耗会迅速累积。拥有 128,000 个 GPU 的计算集群,改用 CPO 交换机后,可将可插拔收发器数量从近 50 万个减少到约 128,000 个。英伟达估计其光子交换机能效提高了 3.5 倍,博通数据表明该技术可将光器件功耗降低 65%。
CPO 普及的最大障碍之一是其可靠性及故障影响范围。在传统交换机中,光插拔模块故障可能仅损失一个端口;而 CPO 技术中,一个光子芯片故障可能导致 8 个、16 个甚至更多端口失效。这也是多数 CPO 供应商选择外部激光模块的原因之一,这样不仅方便维修,还能在故障时通过提高其他组件输出来补偿。
但实际情况是,博通和 Meta 的早期测试显示,该技术不仅通过减少电气接口数量降低延迟,可靠性也显著提高。上个月,Meta 透露在数据中心部署了博通代号为 Bailly 的 51.2 Tbps 共封装光交换机,并记录了 400 Gbps 等效端口速度下累计 100 万小时无抖动运行的数据。同时,英伟达声称其光子网络平台弹性提高了 10 倍,训练工作负载等应用程序运行时长可延长 5 倍。
目前,博通和英伟达是最早采用 CPO 进行数据包交换的公司。今年春季 GTC 大会上,Nvidia 展示了首款 CPO 交换机,包括 InfiniBand 和以太网版本。英伟达的 Quantum - X Photonics 平台采用全液冷设计,配备 144 个 800Gbps InfiniBand 端口,总带宽达 115.2Tbps。TACC、Lambda 和 CoreWeave 计划在未来计算基础设施中部署这些交换机。对于以太网用户,Nvidia 将提供多种版本的 Spectrum - X Photonics 交换机,满足不同端口数量和性能需求。不过,英伟达的光子以太网套件明年才上市,且已面临博通等公司的竞争,Micas Networks 已开始出货基于博通技术的 51.2 Tbps CPO 交换机,博通还展示了配备 102.4 Tbps Tomahawk 6 交换机 ASIC 的 Davisson CPO 平台。
未来,Nvidia 目前将大部分光模块注意力集中在 CPO 交换机,网卡端倾向于使用 QSFP 插槽和可插拔收发器。而博通等公司正致力于将共封装光学器件应用于加速器本身。在 2024 年 Hot Chips 大会上,博通介绍了面向大规模计算领域的 6.4 Tbps 光学引擎。包括 Celestial AI、Ayar Labs 和 Lightmatter 等公司也在寻求将光 I/O 引入加速器。Ayar 和 Lightmatter 在 SC25 上展示了最新的 CPO 和光中介层技术,Ayar 展示的参考设计可提供高达 200 Tbps 的带宽,Lightmatter 的 CPO 芯片和 Passage M1000 硅光子中介层也具有出色性能。最终,这些技术或许能完全消除对可插拔光学器件的需求,为构建更高效的可扩展计算域奠定基础,让数千个加速器协同工作。
的真实性如本站文章和转稿涉及版权等问题,请作者及时联系本站,我们会尽快处理。
网址:https://www.icpdf.com/design/2510.html
热门文章
- 高通推出首款RISC-V架构可编程连接模组QCC74xM,多协议支持引领智能家居新潮流 2024-11-14
- Arm 服务器芯片突围:五大关键难题待解 2025-08-04
- DIODES(美台) 霍尔传感器产品选型手册 2024-10-18
- 苹果下一代芯片曝光:A19、M5 及蓝牙 WiFi 芯片全知晓 2025-07-10
- 国内功率器件崛起,哪些产品最受市场追捧? 2025-08-29
- 硅芯片专家Rehan Sheikh跳槽谷歌,助力Google Cloud技术创新 2025-01-06
- Allegro 电机驱动方案:应对工业自动化与机器人应用挑战 2025-06-30
- 掌握 TVS 防护元件 PCB Layout 的注意事项 2025-11-19
- 泰瑞达宣布收购英飞凌功率半导体测试团队 2025-02-05
- 英伟达计划在中国台湾设立海外总部,深化亚洲市场布局 2024-12-24