您的位置:首页 > 新品速递 > 正文

MRDIMM—— 存储领域的新兴 “宠儿” 来袭

时间:2025-05-08 09:11:20 浏览:31

在当今 AI 时代,以数据为中心的工作负载需求呈现出持续攀升的态势,这使得现代服务器面临着前所未有的挑战。如何确保计算能力与内存带宽相匹配,已然成为亟待解决的关键问题。人工智能、高性能计算和实时分析等前沿行业,对内存子系统的数据传输速度提出了极为严苛的要求。因为在这些领域,稍有延迟就可能导致性能瓶颈,进而影响整个系统的运行效率。

与此同时,一种新型内存技术 ——MRDIMM 横空出世,迅速在行业内掀起了波澜。人们不禁要问,它能否成为 AI 存储产业的下一个 “宠儿”?又将对内存市场产生何种深远的影响呢?

MRDIMM 新型内存出世

MRDIMM 的诞生并非一蹴而就,它的起源可以追溯到 DDR4 世代的 LRDIMM(Load Reduced DIMM,减载双列直插内存模块)。LRDIMM 的设计初衷是为了减轻服务器内存总线的负载,同时提升内存的工作频率与容量。与传统的服务器内存模组 RDIMM 仅采用 RCD(Registered Clock Driver,寄存时钟器)不同,LRDIMM 创新性地加入了 DB(Data Buffer,数据缓冲器)功能。这一巧妙设计不仅降低了主板上的信号负载,还为使用更大容量的内存颗粒创造了条件,进而显著扩充了系统内存容量。

在 DDR4 世代,JEDEC 对 LRDIMM 架构进行了多轮讨论。最终,中国澜起科技公司提出的 “1 + 9”(1 颗 RCD + 9 颗 DB)方案脱颖而出,成为 DDR4 LRDIMM 的国际标准。这一成就意义非凡,要知道,当时全球仅有 IDT(后被日本瑞萨电子收购)、Rambus 和澜起科技三家公司具备提供 RCD 及 DB 芯片套片的能力。或许正是基于以上契机和强大的研发实力,澜起科技在 2021 年成功入选 JEDEC 董事会,行业话语权得到进一步提升。

1.png

进入 DDR5 世代,LRDIMM 的架构演变为 “1 颗 RCD + 10 颗 DB”。然而,由于 DDR5 内存模组容量大幅增加,DDR5 LRDIMM 的性价比优势逐渐缩小,在服务器内存中的占比也不尽人意。此时,MRDIMM 应运而生。它沿用了与 LRDIMM 类似的 “1 + 10” 技术架构,即搭配 1 颗 MRCD(多路复用寄存时钟驱动器)芯片和 10 颗 MDB(多路复用数据缓冲器)芯片,能够实现更高的内存带宽,满足现代服务器对内存带宽日益增长的需求。

随着 CPU 核心数量和速度不断提升,内存必须以更快的速度提供数据。MRDIMM 通过同时操作两个内存通道,实现了比标准 DDR5 DIMM 更高的数据吞吐量。简单来说,它就像是将两个 DDR5 DIMM 结合,向主机提供两倍的数据速率。例如,将两个速度为 4400MT/s 的 DDR5 DIMM 组合,输出结果可达 8800MT/s。目前,第一代 MRDIMM 的速度可达 8800MT/s,第二代达到 12800MT/s。虽然预计未来几代产品速度还会大幅提升,如第三代有望达到 17600MT/s,但可能要到 2030 年以后才能问世,研发之路任重道远。

值得一提的是,英特尔与 SK hynix、瑞萨合作,基于与 MRDIMM 类似的概念开发了多路复用器组合等级(MCR)DIMM。AMD 也在积极筹备类似的 HBDIMM。不过,目前尚无公开资料对 MCR DIMM 和 HBDIMM 进行详细比较。

此外,高尺寸(TFF)MRDIMM 具有独特优势,它无需增加物理插槽就能扩充内存容量。这类模块更高,可容纳更多内存芯片,不过仅适用于 2U 或更大尺寸的服务器设计。凭借更快、更高效的数据传输能力,MRDIMM 为面向未来的服务器设计提供了有力支持,助力其满足高性能计算的需求。

“运力” 成为 AI 发展最大瓶颈

近年来,服务器 CPU 技术发展呈现出一个明显趋势:CPU 厂商不断增加内核数量,核心数呈指数级增长。英特尔和 AMD 最新一代 CPU 的核心数已达到数十甚至上百量级。与此同时,自 2012 年起,数据中心服务器内存对速度和容量的要求每年以超过 10 倍的速度增长,且丝毫没有减缓的迹象。可以说,在过去十年里,“算力” 和 “存力” 都取得了前所未有的进步。

然而,“内存墙” 的存在却成为了制约系统性能提升的关键因素。传统内存 RDIMM 传输带宽的增长较为缓慢,远远跟不上 CPU 核心数量指数级增加的速度。这也是 AMD 和英特尔在主流处理器上转向 DDR5 内存的重要原因之一。DDR5 市场也因此迎来了快速发展期。

如果这种情况持续下去,当 CPU 核心数量超过一定限度,就会出现带宽分配不足的问题,导致 CPU 无法充分发挥增加核心数量带来的性能优势,严重制约系统性能平衡,“内存墙” 的负面影响愈发凸显。

在美光和英特尔的联合测试中,研究人员使用英特尔 Hibench 基准测试套件中的 2.4TB 数据集进行测试。结果显示,在内存容量相同的情况下,MRDIMM 的运算效率相比 RDIMM 提高了 1.2 倍;使用容量翻倍的 TFF MRDIMM 时,运算效率更是提高了 1.7 倍,内存与存储之间的数据迁移减少了 10 倍。

在 AI 推理方面,MRDIMM 同样表现出色。以运行 Meta Llama 3 8B 大模型为例,在内存容量相同的条件下,使用 MRDIMM 后,词元的吞吐量是 RDIMM 的 1.31 倍,延迟降低 24%,首个词元生成时间降低 13%,CPU 利用效率提升 26%,末级缓存(LLC)延迟降低 20%。

MRDIMM 采用 DDR5 的物理和电气标准,实现了内存技术的重要突破,有效扩展了 CPU 单核心的带宽和容量,极大地缓解了大算力时代 “内存墙” 对系统性能的桎梏,对提升内存密集型计算效率具有重要意义。随着 AI 产业的蓬勃发展,DDR5 内存接口芯片的需求和渗透率大幅提升。随着支持 MRDIMM 的服务器 CPU 上市,第二子代 MRDIMM 有望成为高性能计算、人工智能等应用系统的优选方案。

行业巨头推出

在存储市场竞争日益激烈的当下,各大行业巨头纷纷布局相关技术。除了前文提到的英特尔、AMD 等在类似内存技术上的探索,其他企业也在密切关注 MRDIMM 等新型内存技术的发展。随着技术的不断进步和市场需求的持续增长,存储领域的竞争将更加激烈,而 MRDIMM 能否在这场竞争中脱颖而出,成为存储市场的 “新宠”,值得我们拭目以待。