您的位置：首页 > 新品速递 > 正文

MRDIMM—— 存储领域的新兴 “宠儿” 来袭

时间：2025-05-08 09:11:20 浏览：77

在当今 AI 时代，以数据为中心的工作负载需求呈现出持续攀升的态势，这使得现代服务器面临着前所未有的挑战。如何确保计算能力与内存带宽相匹配，已然成为亟待解决的关键问题。人工智能、高性能计算和实时分析等前沿行业，对内存子系统的数据传输速度提出了极为严苛的要求。因为在这些领域，稍有延迟就可能导致性能瓶颈，进而影响整个系统的运行效率。

与此同时，一种新型内存技术 ——MRDIMM 横空出世，迅速在行业内掀起了波澜。人们不禁要问，它能否成为 AI 存储产业的下一个 “宠儿”？又将对内存市场产生何种深远的影响呢？

MRDIMM 新型内存出世

MRDIMM 的诞生并非一蹴而就，它的起源可以追溯到 DDR4 世代的 LRDIMM（Load Reduced DIMM，减载双列直插内存模块）。LRDIMM 的设计初衷是为了减轻服务器内存总线的负载，同时提升内存的工作频率与容量。与传统的服务器内存模组 RDIMM 仅采用 RCD（Registered Clock Driver，寄存时钟器）不同，LRDIMM 创新性地加入了 DB（Data Buffer，数据缓冲器）功能。这一巧妙设计不仅降低了主板上的信号负载，还为使用更大容量的内存颗粒创造了条件，进而显著扩充了系统内存容量。

在 DDR4 世代，JEDEC 对 LRDIMM 架构进行了多轮讨论。最终，中国澜起科技公司提出的 “1 + 9”（1 颗 RCD + 9 颗 DB）方案脱颖而出，成为 DDR4 LRDIMM 的国际标准。这一成就意义非凡，要知道，当时全球仅有 IDT（后被日本瑞萨电子收购）、Rambus 和澜起科技三家公司具备提供 RCD 及 DB 芯片套片的能力。或许正是基于以上契机和强大的研发实力，澜起科技在 2021 年成功入选 JEDEC 董事会，行业话语权得到进一步提升。

进入 DDR5 世代，LRDIMM 的架构演变为 “1 颗 RCD + 10 颗 DB”。然而，由于 DDR5 内存模组容量大幅增加，DDR5 LRDIMM 的性价比优势逐渐缩小，在服务器内存中的占比也不尽人意。此时，MRDIMM 应运而生。它沿用了与 LRDIMM 类似的 “1 + 10” 技术架构，即搭配 1 颗 MRCD（多路复用寄存时钟驱动器）芯片和 10 颗 MDB（多路复用数据缓冲器）芯片，能够实现更高的内存带宽，满足现代服务器对内存带宽日益增长的需求。

随着 CPU 核心数量和速度不断提升，内存必须以更快的速度提供数据。MRDIMM 通过同时操作两个内存通道，实现了比标准 DDR5 DIMM 更高的数据吞吐量。简单来说，它就像是将两个 DDR5 DIMM 结合，向主机提供两倍的数据速率。例如，将两个速度为 4400MT/s 的 DDR5 DIMM 组合，输出结果可达 8800MT/s。目前，第一代 MRDIMM 的速度可达 8800MT/s，第二代达到 12800MT/s。虽然预计未来几代产品速度还会大幅提升，如第三代有望达到 17600MT/s，但可能要到 2030 年以后才能问世，研发之路任重道远。

值得一提的是，英特尔与 SK hynix、瑞萨合作，基于与 MRDIMM 类似的概念开发了多路复用器组合等级（MCR）DIMM。AMD 也在积极筹备类似的 HBDIMM。不过，目前尚无公开资料对 MCR DIMM 和 HBDIMM 进行详细比较。

此外，高尺寸（TFF）MRDIMM 具有独特优势，它无需增加物理插槽就能扩充内存容量。这类模块更高，可容纳更多内存芯片，不过仅适用于 2U 或更大尺寸的服务器设计。凭借更快、更高效的数据传输能力，MRDIMM 为面向未来的服务器设计提供了有力支持，助力其满足高性能计算的需求。

“运力” 成为 AI 发展最大瓶颈

近年来，服务器 CPU 技术发展呈现出一个明显趋势：CPU 厂商不断增加内核数量，核心数呈指数级增长。英特尔和 AMD 最新一代 CPU 的核心数已达到数十甚至上百量级。与此同时，自 2012 年起，数据中心服务器内存对速度和容量的要求每年以超过 10 倍的速度增长，且丝毫没有减缓的迹象。可以说，在过去十年里，“算力” 和 “存力” 都取得了前所未有的进步。

然而，“内存墙” 的存在却成为了制约系统性能提升的关键因素。传统内存 RDIMM 传输带宽的增长较为缓慢，远远跟不上 CPU 核心数量指数级增加的速度。这也是 AMD 和英特尔在主流处理器上转向 DDR5 内存的重要原因之一。DDR5 市场也因此迎来了快速发展期。

如果这种情况持续下去，当 CPU 核心数量超过一定限度，就会出现带宽分配不足的问题，导致 CPU 无法充分发挥增加核心数量带来的性能优势，严重制约系统性能平衡，“内存墙” 的负面影响愈发凸显。

在美光和英特尔的联合测试中，研究人员使用英特尔 Hibench 基准测试套件中的 2.4TB 数据集进行测试。结果显示，在内存容量相同的情况下，MRDIMM 的运算效率相比 RDIMM 提高了 1.2 倍；使用容量翻倍的 TFF MRDIMM 时，运算效率更是提高了 1.7 倍，内存与存储之间的数据迁移减少了 10 倍。

在 AI 推理方面，MRDIMM 同样表现出色。以运行 Meta Llama 3 8B 大模型为例，在内存容量相同的条件下，使用 MRDIMM 后，词元的吞吐量是 RDIMM 的 1.31 倍，延迟降低 24%，首个词元生成时间降低 13%，CPU 利用效率提升 26%，末级缓存（LLC）延迟降低 20%。

MRDIMM 采用 DDR5 的物理和电气标准，实现了内存技术的重要突破，有效扩展了 CPU 单核心的带宽和容量，极大地缓解了大算力时代 “内存墙” 对系统性能的桎梏，对提升内存密集型计算效率具有重要意义。随着 AI 产业的蓬勃发展，DDR5 内存接口芯片的需求和渗透率大幅提升。随着支持 MRDIMM 的服务器 CPU 上市，第二子代 MRDIMM 有望成为高性能计算、人工智能等应用系统的优选方案。

行业巨头推出

在存储市场竞争日益激烈的当下，各大行业巨头纷纷布局相关技术。除了前文提到的英特尔、AMD 等在类似内存技术上的探索，其他企业也在密切关注 MRDIMM 等新型内存技术的发展。随着技术的不断进步和市场需求的持续增长，存储领域的竞争将更加激烈，而 MRDIMM 能否在这场竞争中脱颖而出，成为存储市场的 “新宠”，值得我们拭目以待。

上一篇：Arm PC 芯片即将发布，能否撼动 PC 市场格局？下一篇：96MHz 主频 M0 + 内核低功耗单片机 CW32L011 全解析

MRDIMM—— 存储领域的新兴 “宠儿” 来袭

热门文章

电子百科