您的位置:首页 > 行业资讯 > 正文

CPO 在数据中心的应用:技术创新与最新发展态势

时间:2025-11-03 11:43:03 浏览:19

在当今科技飞速发展的时代,对互连带宽的需求呈现出永无止境的态势,这一关键趋势正深刻塑造着数据中心的发展方向。互联网流量的持续增长以及人工智能大型语言模型的快速扩展,成为推动带宽需求不断攀升的主要驱动力。然而,带宽的提升往往伴随着功耗的显著增加,这在数据中心能耗急剧飙升的当下,无疑成为了一个棘手的问题。据预测,到 2027 年,一个英伟达机架的功耗将高达 600 千瓦。因此,业界迫切需要寻求以皮焦耳 / 比特为单位的更高数据传输能效解决方案。

在这样的背景下,共封装光器件(CPO)技术应运而生,并迅速发展成为网络交换机(数据中心横向扩展)中传统可插拔光模块的有力替代方案。CPO 技术通过将电子芯片和硅光子芯片集成在同一封装中,使得光纤能够尽可能靠近 ASIC 或 FPGA,从而显著降低了功耗,并带来了诸多其他优势。

CPO 是必经之路

一般而言,数据中心内部互连的能源效率可以通过尽可能用光纤替代铜线来实现。然而,这种替代的实际可行性以及最终获得的收益,不仅取决于传输速度和距离,还受到许多其他因素的影响。理想情况下,光纤应直接连接到网络交换机核心的硅芯片(ASIC 或 FPGA),以避免铜缆混合互连带来的缺点。即使是相对较短的铜线,如连接 ASIC/FPGA 和交换机前面板的 PCB 走线,也会造成信号损耗,并对信号完整性产生负面影响。

这需要耗电量巨大的基于DSP的重定时器和纠错电路,这会降低整体能效并增加延迟。但是,要将多根光纤尽可能靠近ASIC或FPGA,需要复杂的封装技术和连接器,而且由于板级或机架级的限制(例如空间限制或散热要求),实现起来也可能很困难。因此,迄今为止,大多数网络交换机都采用可插拔光模块,这意味着光纤仅延伸到前面板,仍然使用铜线(PCB走线)来连接前面板和ASIC或FPGA。

尽管面临诸多挑战,但过去几年中,CPO(互连封装)的优势日益凸显。一方面,随着传输速度的提高、前面板连接密度的增加以及提高电源效率的迫切需求,数据中心互连的要求也越来越高;另一方面,得益于器件小型化(摩尔定律)和芯片组趋势推动的 2.5D - 3D 封装技术的不断进步,CPO 解决方案也得到了显著改进。

通过将电子芯片和硅光子芯片封装在同一封装内,CPO 技术相比可插拔模块具有多项优势。例如,电路板上通往前面板的损耗较大的铜线被低损耗光纤所取代;通常用于 25G / 通道以上速率的两个高功耗 DSP 中的一个可以被移除,从而降低功耗和成本;更少的 DSP 和更长铜线的移除可以实现更高的带宽和更低的延迟;摆脱笨重的可插拔模块可以提高前面板的连接密度,和 / 或释放面板面积以改善散热。

据博通公司(Broadcom)称,作为该技术投入最深的公司之一,CPO 技术可以节省 30% 的功耗,降低 40% 的每比特光器件成本,并实现 1 Tbps/mm 的带宽密度。可插拔模块在可维护性方面可能仍然具有优势,因为它们易于更换。然而,由于光链路中最容易出现故障的组件是激光源,许多 CPO 解决方案通过采用可插拔激光源来解决可维护性问题。

巨头纷纷投身其中

过去几年,众多公司纷纷看好 CPO 市场的前景,投身于这一领域的研发和应用。博通作为该技术投入最深的公司之一,其产品系列包括 25.6 Tbps 的 Humboldt CPO 交换机器件和 51.2 Tbps 的 CPO 以太网交换机Bailly,后者于 2024 年 3 月推出。据该公司称,与可插拔收发器解决方案相比,Bailly 可使光互连的功耗降低 70%,并且硅面积效率提高 8 倍。

2025 年 1 月,Marvell 宣布将 CPO 技术集成到定制 AI 加速器中。该方案基于 Marvell 于 2023 年 12 月发布的 6.4 Tbps 3D SiPho 引擎,该引擎已在 2024 年光纤通信大会暨展览会(OFC)上首次亮相。3D SiPho 引擎将数百个组件(包括驱动器、跨阻放大器、调制器等)集成到一个芯片中,该芯片本身也成为 XPU 的一部分。

思科在 2023 年光纤通信展(OFC 2023)上展示了其 CPO 解决方案的优势,通过并排比较传统路由器(配备可插拔光模块)和搭载共封装硅光子学光纤模块的 CPO 路由器的实际功耗降低情况。康宁等主要光纤供应商也积极参与到 CPO 生态系统的建设中。康宁在 2025 年 OFC 上展示了其 CPO FlexConnect 光纤,这是一种新型单模、抗弯曲光纤,专为短距离共封装光器件而优化。

近来,随着台积电和英伟达这两大巨头的加入,CPO(共封装光学)技术获得了进一步的发展动力。总部位于台湾的台积电在该领域拥有得天独厚的优势,有望发挥关键作用:正如我们所见,CPO 需要极致的器件小型化和先进的 2.5D-3D 封装技术,而这家全球领先的晶圆代工厂在这两方面都表现出色。在 2024 年技术研讨会上,台积电发布了名为 COUPE(紧凑型通用光子引擎)的硅光子解决方案,该公司将利用该方案开发 CPO 技术。台积电计划于 2026 年将 COUPE 集成到其 CoWoS 封装技术的基板上,实现功耗降低 2 倍、延迟降低 10 倍。该公司还在探索一种更先进的共封装光学方案,该方案将 COUPE 集成到 CoWoS 中介层上,预计功耗将进一步降低 5 倍,延迟将降低 2 倍。

0.png

至于英伟达,其首席执行官黄仁勋在2025年GTC大会上宣布,在其即将推出的网络交换机中采用CPO技术是其创新举措之一。除了将CPO解决方案视为满足AI数据中心极端横向扩展需求的一种方式外,英伟达还推出了一项重要的技术创新,即使用微环调制器代替马赫-曾德尔调制器,以实现更高的密度。英伟达声称,与传统网络相比,其CPO创新可提供3.5倍的更高能效、10倍的网络弹性以及1.3倍的更快部署速度。该公司将使用CPO技术构建其全新的Quantum-X和Spectrum-X硅光子网络交换机,这两款交换机将分别于今年晚些时候和2026年上市。 Nvidia 与包括台积电、Browave、相干公司、康宁公司、Fabrinet、富士康、Lumentum、Senko、SPIL、住友电工和 TFC Communication 在内的合作伙伴生态系统合作开发了其 CPO 解决方案。

最新进展和预测

尽管目前 CPO 技术备受关注,但该解决方案仍处于不断发展和完善的阶段。分析师认为,CPO 在标准化、可制造性和测试等多个方面仍需进一步改进。然而,从市场趋势来看,目前规模较小的 CPO 市场势必会迎来显著的增长。根据 Yole Group 的数据,CPO 市场在 2022 年的收入约为 3800 万美元,预计到 2033 年将达到 26 亿美元,2022 年至 2033 年的复合年增长率(CAGR)为 46%。

LightCounting 在八月份的一场会议上对 CPO 的发展做出了预测。目前,CPO 的研发活动正处于历史最高水平,预计 2027 年将实现大规模部署。LPO 的部署现已开始,明年将部署数百万个 LPO 模块(在 LPO 预测中包含了半时序 (LRO) 模块)。时序重整的可插拔模块在未来一段时间内仍将存在,从 2025 年到 2030 年,800G 及更高速度收发器的出货量将增长两倍。

博通和英伟达已将 CPO 应用于以太网和 InfiniBand 交换机,用于 scale - up 网络。预计英伟达将在其未来的 NVLink 交换机版本中使用 CPO。博通近期发布的专为横向扩展网络设计的 Tomahawk Ultra 交换机,也有望很快采用 CPO 技术。该交换机每通道 100G,是博通成熟的 CPO 设计。

博通公司的 Anand Ramaswamy 介绍了 CPO 的最新测试数据。截至 2025 年 7 月 7 日,CPO 已累计完成超过 86,000 小时的 HTOL 压力测试。这些测试数据相当于 800G CPO 端口 550 万小时的运行时间,并且显示 CPO 在 “FEC tails” 方面性能极其稳定,在 1,200 小时内未出现链路抖动。这一指标对于大规模网络中的连接至关重要。

下图总结了博通 CPO 的性能,表明其在各项参数上均表现出较大的裕量。此外,在 35°C 的温度下,每个端口的功耗也非常稳定,为 5.5W。

22.png

此外,众多公司也在 CPO 相关技术领域取得了一系列进展。Coherent 公司的 Vipul Bhatt 指出,CPO 和可插拔收发器针对的是两个需求不同的市场,高性能插座可以弥合需求上的差距,为 CPO 和共封装铜 (CPC) 连接提供选择,从而支持可插拔光器件。Lumentum 公司的 Matt Sysak 展示了用于 CPO 的外部激光源 (ELS) 中的高功率 CW 激光器的性能数据。Alfalume 公司的 Alexey Kovsh 分享了量子点(QD)激光器的最新研究成果,量子点激光器有望替代目前所有主流激光器供应商使用的量子阱激光器,并且在高温下表现出更优异的性能。

Senko 公司的 Ryan Vallance 讨论了光纤与 CPO 的连接,其中最关键的是可拆卸的光纤芯片连接器,如 MPC36。Poet Technologies 公司的 Raju Kankipati 介绍了该公司针对晶圆级集成和封装的解决方案。Scintil Photonics 的 Jim Theodoras 讨论了该公司在绝缘体上硅 (SOI) 晶圆上异质集成 InP 芯片的独特方法,并提供用于支持 CPO 的外部激光源的多波长 DFB 激光阵列。

Avicena 公司的 Chris Pfistner 展示了产品路线图,其二维微型 LED 阵列可进行调整,以支持高速 AOC、板载和可插拔连接,从而扩展网络规模。Nubis Communications 开发的产品采用二维阵列互连技术,基于高速硅光子技术,无需齿轮箱。

Celestial AI 和 LightMatter 作为业内最具雄心且资金最雄厚的初创公司,致力于开发更先进的 CPO 技术,远超博通、英伟达和其他新兴供应商目前提供的解决方案。第四代 CPO 并非将光引擎置于 ASIC 周围,而是将光互连置于 ASIC 下方,这与目前诸如台积电开发的 CoWoS 等芯片封装技术截然不同。LightCounting 认为,这将是第四代 CPO 普及应用的一大障碍,但趁着投资者愿意投资,尽早开始研发并尽可能多地筹集资金永远不会太早。

在七月,LightCounting发布了一份关于 Tomahawk 6 的研究报告,指出博通针对 AI 集群扩展互连技术的新定位。然而,一款专为扩展以太网 (SUE) 重新架构的截然不同的交换机却仍处于保密状态。尽管名称不同,Tomahawk Ultra 代表了一种全新的设计,旨在提供更低的延迟和更高的小数据包性能。博通最初启动该设计时,目标是在高性能计算 (HPC) 领域取代 InfiniBand。随着项目的推进,英伟达的 NVLink 扩展互连技术成为了新的目标。

由于开发周期较长,Tomahawk Ultra (TH-U) 与 Tomahawk 5 (TH5) 的相似之处远多于与新款 Tomahawk 6 (TH6) 的相似之处。事实上,博通将 TH-U 设计为与 Tomahawk 5 100% 引脚兼容。TH-U 采用单片式设计,与 TH5 共享相同的 512x100Gbps Peregrine SerDes,并沿用了成熟的 5nm 设计。这使得 TH-U 成为一款 51.2Tbps 的交换机,能够驱动长达 4 米的 DAC 或铜质背板,且插入损耗相当。这也意味着 TH-U 应与通过 TH5 认证的 LPO 模块兼容,并且如果客户需要完整的 CPO 版本,它还可以与 Bailly CPO 引擎结合使用。TH-U 目前正在进行样品测试,预计将于 2026 年上半年投入生产。

为了实现 250ns 的宣称延迟,博通不得不使用比 TH5 更多、更快的包处理流水线。此外,它还必须重新设计其流量管理器和缓冲存储器架构。由于 TH5 已经将光刻技术的尺寸限制在芯片尺寸的极限范围内,TH-U 牺牲了数据包缓冲区的大小,为更多的流水线以及全新的网络内集合 (INC) 引擎腾出空间。因此,在需要更大缓冲区的现有应用中,TH-U 无法取代 TH5。

博通公司明确宣传了TH-U的各项功能,这些功能正是其“扩展以太网”(SUE)规范所必需的。这些功能包括链路层重试(LLR)和基于信用的流量控制(CBFC),它们能够实现类似InfiniBand一贯提供的硬件级可靠性。LLR和CBFC都是上个月发布的Ultra Ethernet Specificationv1.0的可选功能。TH-U还支持一种优化的以太网报头,SUE规范将其称为AI转发报头(AIFH)。AIFH本质上是将标准的IP+UDP报头压缩成一个更小的熵值,而该熵值对于负载均衡仍然至关重要。

TH-U提供最大256个200GbE端口,允许其在单跳中连接多达256个XPU。这仅为TH6最大端口数的一半,而TH6-200G版本还支持两倍的通道速度。不难想象第二代 TH-U 芯片采用 3nm 工艺,搭载 200G SerDes,但这样的芯片不太可能很快面世。与此同时,TH-U 芯片比 NVLink5 落后一代,后者已经实现了 200G/通道的出货速度。

CPO 技术作为数据中心互连领域的新兴力量,正展现出巨大的发展潜力。尽管面临一些挑战,但随着技术的不断进步和市场的逐步成熟,CPO 有望在未来的数据中心建设中发挥重要作用,引领数据中心互连技术的变革。


版权声明: 部分文章信息来源于网络以及网友投稿.本网站只负责对文章进行整理、排版、编辑.是出于传递更多信息之目的.并不意味着赞同其观点或证实其内容
的真实性如本站文章和转稿涉及版权等问题,请作者及时联系本站,我们会尽快处理。

网址:https://www.icpdf.com/news/2419.html