您的位置:首页 > 技术方案 > 正文

下一代数据中心与高性能计算:OIO 光互连技术新突破

时间:2025-09-10 14:47:50 浏览:59

在当今科技飞速发展的时代,数据中心和高性能计算领域正面临着前所未有的挑战与机遇。本文将深度解析下一代数据中心的核心 ——OIO 芯片级光互连的技术、挑战与未来。

当我们关注当前热门的 NVIDIA Blackwell 架构或 Grace Hopper 超级芯片时,往往只看到其强大的单体算力。然而,芯片间的通信瓶颈,即带宽墙与功耗墙,正逐渐成为制约其发展的关键因素。传统电 I/O 技术利用电子通过铜线传输数据,不仅性能受限、利用率下降,还存在能耗巨大、信号衰减等问题。随着算力增长的瓶颈从计算本身转向连接,OIO(Optical Input/Output)技术应运而生,它有望开启一个全新的计算时代。

随着带宽需求的增加,光模块和交换机ASIC的容量在过去十年中都迅速增长。铜互连的电子I/O在满足下一代计算架构对带宽密度、功率效率、延迟和传输距离的要求方面面临巨大挑战,包括云计算、高性能计算(HPC)、人工智能(AI)、网络等。

然而,由于对大带宽、高密度、低功耗和高性价比的要求,可插拔光模块的发展遇到了巨大的挑战,OIO(光输入输出)技术是一种利用大带宽、高密度光接口解决交换机ASIC、CPU、GPU等大容量芯片I/O扇出问题的方法。光入芯核,OIO是光电融合的终极形态。

光电同构技术部分研究

1.png

目前,OIO技术在开关中的应用需要通过光学引擎(OE)和激光源的结合来实现。OIO应用的说明性图如图1.1所示,例如,51.2 Tb/s交换机由ASIC芯片、16个OE和16个PELS组成。每个 OE 传输 3.2Tb/s,总共 32 个 LD/Rx 通道,并通过光连接向交换机 ASIC 提供光 I/O。外部激光源 (ELS) 为 OE 产生连续波长 (CW) 激光,通过外部调制解决方案将 ASIC 输出的电信号转换为光信号。它并非简单的光模块小型化,而是将光子学与微电子学在芯片层面进行深度协同设计,从根本上改变数据传输的方式。

OIO技术的激光源通过两种方法解决:一种是利用外部激光源提供非调制激光器,另一种是在硅光子芯片上集成激光二极管。

在外置激光器解决方案中,ELS可分为可插拔外置激光源(PELS)和板载外置激光源两种。板载外部激光源直接设置到开关中。与集成激光二极管相比,该解决方案更加成熟。此外,激光器和ASIC之间的光连接可以固定在交换机中,减少光连接接口损耗。然而,与硅光子芯片上的集成激光二极管类似,该解决方案不能单独取代激光器。它还需要备份。可插拔外部激光源解决方案通过前面板为交换机提供激光源,就像可插拔光模块一样。该开关通过特定的光电连接端口实现驱动和光连接。

2.png

图显示了三种技术解决方案。PELS散热环境好,所以温度最低。集成硅激光器和芯片在同一块PCB上,需要额外的散热,因此温度最高。一般来说,PELS在可靠性、可作性、可维护性、可维护性和稳定性方面具有优势。相比于CPO(共封装光学)或LPO(线性驱动光模块),OIO在带宽密度、能效比和延迟上实现了数量级的提升,是未来实现ZB(泽字节)级别数据交换的必然选择。

3.png

由于外部激光器的输出光功率远大于可插拔光模块,出于激光安全考虑,PELS的电光(E/O)连接器应设计在同一侧(朝向开关),如图1.4所示。在该方案中,电接口和光接口设置在同一侧。因此,需要采用新的接口规范来支持光电接口。由于连接器在开关内部,而光接口和电气接口是在同一个接口中制作的,因此接口(尤其是光接口)的清洁会变得非常复杂和困难。设计因素应包括分支或波融合应用、每个波长的功率、光纤数量、连接器类型、光纤分离和排列。

4.png

OIO的成熟度与商业化进程,将成为下一代AI算力基础设施的胜负手。其产业链涉及半导体、光通信、先进封装等多个领域,将催生新的产业分工模式,并重塑全球半导体价值链。这一领域的前景也吸引了资本的关注,据Technavio预测,从2023年到2028年,全球光互连市场规模将增长168亿美元,年均复合增长率高达20.62%。

光电同构,架构颠覆

OIO的技术架构之所以具备革命性,在于它实现了计算与通信在物理层面的深度融合。

●芯粒(Chiplet)与3D封装: OIO架构巧妙地借助了2.5D/3D先进封装技术,例如台积电(TSMC)的CoWoS。它将负责光收发的光引擎(I/O Die)与计算核心(Compute Die)以芯粒的形式并排放置在同一基板上,实现毫米级的超短距离互连。这种设计带来的带宽密度可以达到惊人的5 Tbps/mm,将数据传输能力提升到了新的维度。

外置光源与微环调制: 当前主流的OIO方案,如Ayar Labs的技术路径,普遍采用外置激光源(ELS)。激光器被放置在芯片封装之外,通过光纤将稳定、高质量的光源泵入芯片。在芯片内部,数据通过微环谐振器(MRR)这样的硅光器件进行高速调制。这种设计的优势在于将发热量最大的激光器与计算核心物理隔离,同时微环调制器本身能效极高,可低至3 pJ/bit,极大地缓解了功耗问题。

协议协同与无缝通信: OIO并非要推翻现有的计算生态。它通过UCIe等开放的芯粒互联标准,能够将CXL、NVLink等上层协议的数据包(Flits)无缝转换为光信号进行传输。这意味着从一颗芯片到另一颗芯片的通信,可以在一个计算体系内高效完成,绕过了传统基于以太网协议的机柜间通信,让数据搬运更为直接和高效。

三座大山,量产之困

尽管前景广阔,但OIO的商业化与规模化量产之路,仍面临着“三座大山”般的严峻挑战,展现了其技术实现的艰巨性。

异质集成之难: 这是最核心的工艺瓶颈。OIO需要在硅基衬底上集成III-V族材料(用于发光的光源)和硅基波导、调制器等。两种材料晶格常数、热膨胀系数的巨大差异导致制造良率成为最大障碍,匿名人士向「数聚势能」透露,业内顶尖水平的良率仍低于60%。IBM等机构正在探索通过微转移印刷等技术来突破这一难题,但距离大规模量产仍有距离。

极致散热之困: 将光路和电路高密度地封装在一起,带来了巨大的热管理挑战。据测算,OIO芯片的局部热流密度可超过300W/cm²。传统风冷早已无能为力,这要求液冷、新热界面材料(如纳米银烧结)等下一代散热技术的协同创新,以确保芯片在极端工况下的稳定运行。

高精度测试之艰: OIO对测试提出了全新的要求。它不仅需要对10^-15量级的超低误码率(BER)进行精确测量,还需要在晶圆级对光链路损耗、器件性能进行自动化、高通量的在片测试。同时,光电混合芯片的长期可靠性也需要遵循比传统芯片更为严苛的标准,例如升级版的Telcordia GR-468,这对测试设备和方法学都是全新的挑战。

群雄逐鹿OIO,生态之争

OIO带来的不仅是技术变革,更是对现有产业格局的深刻重塑,一场围绕新生态的竞争已经拉开序幕。两大阵营对垒: 目前,行业内已初步形成两大阵营。

一方是以Intel为代表的垂直整合模式,其利用自身从芯片设计到制造的全栈能力,试图打造一个闭环的硅光生态系统。另一方则是以台积电/博通为代表的开放生态模式,Foundry(如台积电)专注于提供标准化的硅光制造工艺,芯片设计公司(如博通、Ayar Labs、Xscape Photonics)在此基础上进行产品开发,再交由封装厂完成集成。据「数聚势能」获悉,AI巨头英伟达就同时押注了Ayar Labs与Xscape Photonics,意在通过多元化投资,加速开放生态的成熟。

产业链价值重构: OIO的兴起,将彻底改变传统产业链的角色分工。传统光模块厂商面临转型压力,需要向更底层的芯片和封装领域渗透。芯片设计公司(EDA)需要提供支持光电协同设计的全新工具链。设备商需要开发用于光子晶圆制造和测试的新设备。而像台积电这样的晶圆代工厂,其在先进封装领域的领导地位将得到进一步巩固,成为新生态中的核心枢纽。台积电近年来在美国亚利桑那州高达650亿美元的投资,并规划建设生产2纳米芯片的工厂,也为其在下一代光电融合技术上的竞争储备了弹药。

中国的机遇与策略: 在这场变革中,中国拥有庞大的应用市场和完整的电子制造产业链,短期内,可采取技术跟随+场景创新的策略。

在光源、EDA、先进封装等关键环节奋力追赶,同时利用国内在AI大模型、下一代通信等领域的巨大需求,寻找差异化的应用场景作为突破口,以市场换技术,逐步建立起自主可控的OIO产业链。

产业专家怎么说

在由中国光学工程学会主办,中国光学工程学会,光电融合专委会、《光电融合-前沿与工程》期刊等共同承办的光电融合大会,来自中兴、光迅、华为、腾讯、阿里、百度、联通、奇点光子、摩尔线程、中国科学院半导体研究所、上海交通大学、国防科技大学、浙江大学等企业和科研机构的专家汇聚一堂。

针对高速光互连中CPO、OIO、可插拔光模块技术的成熟度、功耗、可维护性、产业链的协同和未来发展等方面进行研讨,分享前沿洞察,探讨在超大规模数据中心快速发展的背景下如何定位与协同发展。

8.png

CPO 与 OIO 作为高度集成化的光电融合技术,因强耦合、系统封闭的特点,引发终端用户对 “生态封闭性” 的担忧。相比之下,OIO 因与芯粒耦合的互联特性,集成一体性更高,标准和生态构建的难度也更大。专家一致认为,打破 “封闭” 局限需依靠开放平台搭建、标准化流程推进及多厂商协同合作。

CPO 与 OIO 已具备一定技术成熟度,但在生态支持、运维体系与标准制定上仍存挑战,且三者并非对立关系,应根据应用场景混合部署、长期共存,同时强调 “技术决定路径,需求决定节奏”,光电融合落地需兼顾运维性、可扩展性与经济性,呼吁产业界加强平台建设、推动标准化与 “竞合” 协作。

决胜未来,算力无疆

总而言之,OIO是解决未来算力互连瓶颈的范式革命,其实现路径虽然充满挑战,但全球的产业力量已经集结。

展望未来,其发展路径将分阶段展开:

●近期(2025-2027): 这将是一个混合架构的过渡期。以NVIDIA即将推出的Rubin平台为标志,采用外置光源(ELS)的OIO方案将率先落地,成为主流。同时,UCIe标准的普及将驱动一个初步的开放生态走向成熟。

●远期(2028+): 这将是全集成光芯片的时代。随着异质集成技术的良率取得突破性进展,激光光源将被直接集成进芯片封装乃至片上,标准化的硅光Foundry工艺将大幅降低设计门槛和成本,届时OIO技术有望在数据中心、AI计算集群中全面爆发。

OIO不仅仅是光通信技术的胜利,更是半导体定律得以延续、人工智能潜力得以充分释放的基石。可以说,掌握OIO,就是掌握了通往下一个计算纪元的钥匙。

OIO 是解决未来算力互连瓶颈的范式革命,其实现路径虽然充满挑战,但全球的产业力量已经集结。掌握 OIO,就是掌握了通往下一个计算纪元的钥匙。由芯师爷主办的第七届硬核芯生态大会暨 2025 汽车芯片技术创新与应用论坛将于 9 月 11 日在深圳国际会展中心 16 号馆正式举办,届时将汇集半导体全产业链的领军者,共同探讨如何把握芯片本土化的窗口期,抓住中国新兴市场的发展机会。


版权声明: 部分文章信息来源于网络以及网友投稿.本网站只负责对文章进行整理、排版、编辑.是出于传递更多信息之目的.并不意味着赞同其观点或证实其内容
的真实性如本站文章和转稿涉及版权等问题,请作者及时联系本站,我们会尽快处理。

网址:https://www.icpdf.com/tech/2222.html