中国算力芯片“新十年”:统一指令集架构成关键突破口
过去 40 年,处理器芯片的发展宛如一条 “否定之否定” 的螺旋曲线,经历了自研、放弃自研,再到如今重新回归自研的历程。近 5 年,越来越多的整机和平台厂商投身于这场 “芯片战争”,并且呈现出一个显著的新趋势 —— 计算系统正从以 CPU 为中心的同构模式,转变为 CPU 联合 xPU 的异构模式。
在这场激烈的 “芯片战争” 中,参与者们面临着几个核心问题。首先是 xPU 架构的创新程度以及其持续创新的潜力;其次,应用规模能否有效摊薄硬件和生态的创新成本。刚刚公布的 “十五五” 规划建议稿明确指出,要加快科技高水平自立自强,全面增强自主创新能力,大力实施 “卡脖子” 迭代攻关,尤其聚焦半导体等关键技术环节。那么,在接下来的五年乃至十年里,国产 “算力芯片” 的突破口究竟在哪里呢?我们认为答案在于指令系统结构(指令集架构)的统一。
系统结构的一致性对于推动架构层面的创新至关重要。例如,将 RISC - V 作为统一指令系统,让所有的 CPU、GPU 和 xPU 都基于 RISC - V 及其扩展进行开发,这样不仅能够扩大规模效应,还能高效利用研发资源。

指令集就像是软硬件之间的 “连接器”,按照标准编写软件,就能向硬件发出计算指令。
经济规模与生态成本决定架构的 “生与死”
计算机发展至今已有八十多年历史,其计算模式经历了多次变革。早期是集中式处理,只有少数专业人员能通过终端设备访问昂贵的计算资源。20 世纪 80 年代后,以微处理器为基础的 PC 和计算机网络出现,计算模式转变为分布式。随后智能手机和云计算系统的兴起,使计算模式进化为集中式云中心与 “泛在分布” 智能终端构成的复杂体系,且云中心本身也是一个巨大的分布式系统。
目前,计算领域中最为核心的 CPU 主要以两种指令集为代表:PC 和服务器领域采用 x86 架构,智能手机领域则以 ARM 架构为主。

x86 架构能够在竞争中脱颖而出,一方面是因为它不断向高端 RISC 学习,根据新应用需求增加指令子集、拓展新功能;另一方面,PC 与服务器的 CPU 同为 x86 架构,巨大的芯片出货量分摊了服务器 CPU 的研发成本。而 RISC CPU 的失意,表面上是由于软硬件投入成本过高,实际上是因为无法颠覆已有的软硬件生态系统,大量现存的标准或事实标准接口,如指令架构系统,形成了强大的生态统治力,即使是英特尔、惠普等联合体也难以撼动。
回顾 1990 年代超算领域,许多创业公司如 nCUBE、KSR、Thinking Machine 等,既自研 CPU 又开发 MPP 超算系统,在系统架构上提出了诸多创新方案。例如 KSR 提出的 Allcache 纯缓存存储架构(COMA),实现了第一个基于纯缓存的并行超算系统,其 CPU 运行频率低、功耗和散热效率却远高于同期的英特尔 486。然而,最终这些创新性架构都不敌 x86。这并非是因为它们缺乏创新性,而是架构创新难以抗衡经济规律。因此,我们呼吁未来中国的算力芯片应统一指令集架构。
架构创新难,生态构建更难:壁垒在软件与协同
进入纳米工艺时代后,摩尔定律逐渐失效,晶体管开关速度放缓。如今,业界主要通过增加晶体管数量来提升性能,基本思路是并行计算,如增加数据位宽、功能部件和处理器核的数量等。但随之而来的问题是,如何对这些增加的部件进行有效控制和管理,这就需要依靠计算机体系结构。
计算机体系结构作为硬件与软件的接口,决定了两者的分工,大致可分为激进、保守和折中三种类型。激进的结构强调在硬件上进行大量动态优化,但容易导致硬件过于复杂、功耗过高;保守的结构依赖软件实现高性能,虽简化了硬件,但编程不便且性能难以保障;折中结构则在硬件和软件上都进行一定程度的优化,通过软硬件协同解决性能和编程问题。
高端 CPU 常采用激进结构,但由于结构复杂,正确性验证困难,研发工作量大,还容易受到瞬态执行攻击。目前,业界倾向于通过增加处理器核的数量来提升性能,如代表算力的 xPU 芯片采用众核结构,可匹配图像处理、神经网络等并行计算需求。然而,众核结构 xPU 芯片的大规模应用面临着生态系统问题。以英伟达为例,其 CUDA 拥有成熟的并行软件生态,因此受到用户青睐。
英特尔和惠普联合开发的 IA - 64 安腾处理器,尽管投入巨大,但最终未能成功,关键原因在于 x86 架构经过 40 多年的发展,形成了难以复制的产业生态环境。从市场数据来看,软件开发费用远高于硬件,这也意味着未来很长一段时间内,x86 CPU 在服务器市场仍将占据主导地位。
ARM - 64 的机会在于打破英特尔在 x86 服务器市场的垄断。ARM 服务器若要取得成功,可能取决于两个关键因素:一是掌握全栈技术的大厂放弃 x86,如苹果、亚马逊等,它们能够自主控制生态迁移和产量、毛利率;二是端云融合,ARM 在终端的优势延伸到云端,如 Android Cloud,ARM 服务器更适合支持 Android Apps,应用可在云和端之间自由迁移,云游戏在云端也无需依赖虚拟机。
开源的 RISC - V 虽然备受关注,但目前仍面临商业化困境。近年来,RISC - V 在软件相对简单的场景,如以微控制器为代表的嵌入式领域应用较多,但由于嵌入式场景需求碎片化,定制芯片会失去集成电路产业的规模效应。此外,RISC - V 的硬件生态也不成熟,缺乏有竞争力的高性价比处理器核和支持多核互连的高性能片上网络。尽管有人希望通过跨平台语言和虚拟机技术降低指令集架构的重要性,但英特尔持续扩展指令集的做法表明,硬件指令的直接支持对性能和能效比至关重要。因此,RISC - V 进入通用平台仍需漫长的过程。
统一指令集:中国算力芯片规模化的关键路径
近年来,系统和平台厂商纷纷开启计算芯片的研发之路,美国有苹果、谷歌、亚马逊、微软等,中国也有众多企业参与其中。在所有自研模式中,云厂自研芯片的模式具有可行性。因为云厂商的盈利主要依赖增值服务,而非硬件销售。并且云厂商掌握全栈软硬件,生态移植难度较小,凭借自身规模也能够承担芯片研发费用。不过,现阶段多数企业自研芯片主要用于内部,外部客户仍需要独立的芯片供应商。
苹果公司是自研芯片的成功典范,其基本实现了核心产品线处理器的全线自研,涵盖手机、平板、PC、手表和耳机等产品。苹果自研芯片性能高、成本也高,但通过与自研系统软件的配合,优化了用户体验,再加上强大的营销体系,塑造了高端形象,从而能够实现高定价。然而,很多失败的项目只看到了苹果 “自研芯片” 的表面,却忽略了软件差异化和生态能力提升对用户体验的重要性。
无论是 CPU 还是 GPGPU,都需要在软件生态上与现有成熟产品形成差异化,提升附加值。但这并不意味着一切都要重新构建和创新,例如指令系统。指令系统越多,软件生态的投入就越大,统一起来也更加困难。目前,软件投入不足的问题在领域专用架构和 xPU 研发领域较为突出,许多国产智算中心虽投资规模大,但由于配套软件不全,实际利用率较低。
实际上,体系结构创新并非一定要采用全新的架构,也可以在现有指令系统框架内实现,而 RISC - V 恰好具备这样的支撑能力。例如,国外 Tenstorrent 等企业基于 RISC - V 指令集扩展支持 AI 的子指令集,开发了 AI 加速计算方案;国内外不少科研机构也在 RISC - V 上扩展了密码学相关子指令集,实现了对后量子密码的支持。因此,我们呼吁将 RISC - V 作为统一指令系统,让所有 CPU、GPU 和 xPU 都基于 RISC - V 及其扩展进行开发,以避免重复劳动和研发资源的浪费。
的真实性如本站文章和转稿涉及版权等问题,请作者及时联系本站,我们会尽快处理。
网址:https://www.icpdf.com/news/2408.html
热门文章
- PCB 地与金属机壳采用阻容连接的原因 2025-08-01
- 中国订单激增推动,三星平泽晶圆代工全速复产 2025-02-14
- IMEC推动7埃米制程,提出双列CFET结构 2024-12-10
- 氮化镓芯片新突破:实现 800°C 高温工作 2025-08-18
- 三星重奖存储业务部门:绩效奖金达基本工资200% 2024-12-24
- 松下(Panasonic)热对策产品选型手册(2024) 2024-09-14
- Simplex 创新芯片技术:五十年来芯片架构的重大变革 2025-09-08
- 索尼三层 CIS 来袭,图像传感器性能或迎飞跃 2025-08-01
- 典型LED驱动器电路图实例及深度解析 2025-04-09
- 特斯拉与SK海力士洽购1万亿韩元的企业级固态硬盘 2024-10-25