您的位置:首页 > 设计应用 > 正文

解构天玑9400:揭秘顶级SoC芯片设计精髓

时间:2024-10-12 15:58:30 浏览:43

10月9日,联发科技(MediaTek)发布旗舰5G智能体AI芯片——天玑9400。这款芯片备受业界瞩目。

天玑9400沿用了CPU全大核架构设计方向:1个超超大核+3个超大核共同组成性能核心,配以4个超大核能效核心。其中的1个超超大核,是由其前代芯片4个超大核中的1个升级而来。

1.png

大量的用机经验告诉我们,参数不能代表体验。显然,天玑9400同样“不唯参数论”,联发科技认为,参数最好看,并不一定等于性能最强,更不等于体验最佳。 性能最终要为体验服务,因此性能并非核心重点,体验才是。对于天玑芯片的设计思考,联发科技高管在媒体会上表示,要先确定(用户)要什么,然后再去选择怎么做,想要同时有低能耗和性能领先,但不去追求极致的IP频率,这个目标要靠新的CPU全大核架构实现。在这种设计思路引导下的天玑9400,整体性能升幅很可观,能效表现更是惊艳。这种平衡性,对端侧AI极为有利:天玑9400在端侧AI方面的技术水平因此达到了惊人的程度:摆脱此前必须依赖云侧训练的过程,在端侧就能完成全部训练,这对C端用户的应用体验而言,进步巨大。这样的技术成就,并非仅限于技术本身所具有的意义,更涉及到联发科技的智能化深度布局。通过做端侧训练,带给消费者“越来越懂你”的智能化体验,也是联发科技智能化布局的一部分。

何以主频非顶级?

何以主频非顶级?天玑9400采用台积电第二代3nm制程工艺,CPU则采用第二代全大核架构:用了1个超超大性能核心,再配以3个超大核性能核心和4个超大能效核心,频率也做了程度不等的升级。什么是超超大核?本代旗舰芯片的CPU,将天玑9300的4个超大性能核心中的一个,升级成Arm今年最新推出的Cortex-X925核心(主频3.62GHz),另外又配置了3个Cortex-X4超大核(3.3GHz),以及4个Cortex-A720大核(2.4GHz),单核性能相较天玑9300提升35%,多核性能提升28%。这些都是大核,其中的Cortex-X925因为主频为3.62GHz,IPC(每时钟周期指令数)达到PC级,故而可称之为超超大核。 Cortex-X925主频虽然有3.62GHz,但与高通即将推出的骁龙8 Gen 4的CPU超大核主频相比,有所不如。没人会怀疑联发科技的芯片设计能力,故而,联发科技为什么这么设计?华尔街见闻了解到,联发科技在做芯片设计时,对于CPU的IP选择,并不是“非最强不用”。联发科技实行了“以果为因”的倒推策略,即以终端用户需求为导向,比如在重载场景、中载场景或轻载场景中,用户的最优体验应用需求是什么,以此选择合适的IP和定频,优化性能和功耗。所谓IP,在芯片领域,特指具有特定功能、可重复使用的IC设计模块。这些模块已经过验证,设计方能直接用在芯片设计工作中,从而缩短设计周期,降低研发成本,提高设计成功率。Cortex-X925是Arm新近推出的、具有强悍性能的旗舰IP,是一款基于Arm v9.2-A架构的高性能(最高提升150%)、低功耗(最高提效30%)处理器核心。在Geekbench 6.2基准测试中,Cortex-X925实现了15%的IPC性能提升,达到了PC级水准,适用于高性能和异构计算场景,尤其适合AI、高清视频处理等资源密集型任务。对于此次天玑9400为何没有将频率推升到非常高,联发科技表示,只要实现与终端需求能匹配的性能,CPU的内核主频本身不是重点;若有个很好的(CPU)架构,即使采用相对低频的内核(好处是功耗更低),照样能实现能满足需求的性能。自从摩尔定律放缓,IC性能就开始存在高度冗余,俗称性能过剩。因此,如何实现兼顾性能和功耗的平衡,达成优异体验的设计目标,与芯片设计者对“用户要什么”的洞察和理解密切相关。天玑9400沿用的全大核CPU架构设计,除了Cortex-X925超超大核(核心是PC级的IPC性能提升),其余IP没有全部采用Arm全新推出的产品,比如没有采用最新的A725,反而继续搭载了老的A720,也是出于同样的思考。 什么是美?和谐就是美,协调就是美。同样,什么是好的体验?这需要适当的取舍,合适的、高度匹配的取舍组合——天玑9400采用“大底”、适合的频率和低压,这些就是好体验的本源。事实也是如此,没有采用极高IP主频的天玑9400,采用的CPU全大核架构和提升IP的IPC性能,故而竟在CPU、AI(NPU)、GPU、Modem和Connectivity(连接)等方面,都实现了架构层级的性能提升。

实现完全端侧训练的意图

实现完全端侧训练的意图性能更强,功耗更低,对智能手机未来的体验革新——端侧AI应用,极为有利。联发科技对天玑9400的官方定义是“旗舰5G智能体AI芯片”,AI性能和能效有显著提升:大语言模型(LLM)的提示词处理性能提升80%,功耗节省35%。在天玑9300实现极速端侧AI大模型终端无延迟优异体验的基础上,天玑9400将传统AI应用程序升级到体验更好的智能体AI应用,同时也为万千AI创新应用构建了面向未来的智能计算底座。作为联发科技推出的第二款旗舰AI芯片,天玑9400的AI训练成功摆脱了对云侧的依赖,实现完全的端侧训练,而无需联网,C端用户的应用体验,因此会有极为明显的良好感受。这能凸显AI手机与传统智能手机的巨大差异,以及突破这种市场缺憾的核心要素。天玑9400搭载了生成式AI引擎:联发科技第八代NPU 890,拥有出色的生成式AI性能:支持端侧LoRA训练和端侧高画质视频生成,两者都是业界首发。


2.png


其中,对于用户来说,前者带来的直接好处,是能保护个人隐私,因为个人数据不必上传到云端;后者得益于全新时域张量(TemporalTensor)硬件加速技术和全新高画质Diffusion Transformer(DiT)模型的技术能力,实现了从生成图到视频的巨大跨越。华尔街见闻注意到,天玑9400集成MediaTek天玑AI智能体化引擎(Dimensity Agentic AI Engine),能将传统AI应用程序升级为更先进的智能体化AI应用。比如,利用用户晚上睡觉的6个小时,通过天玑9400 NPU的训练能力,可以让手机去做一些低功耗训练;当用户睡醒时,手机就会更懂用户一些。长期如此,用户的手机就会变成他的个人智能体。智能体化AI技术能力,这是天玑9400带来的生成式AI技术能力的进化。联发科技在发布会现场,演示了搭载天玑9400的终端设备,用天玑AI智能体化引擎完成KFC的自动点餐功能。这就与以往的传统AI能力不同,这相当于智能终端变成了个人AI智能体——智慧化的AI助手。当然,要实现更多的即时功能,满足用户对于衣食住行和娱乐等多方面的需求,需要天玑生态支持。但在技术角度,联发科技展现了构成个人AI智能体必要的技术能力,这是未来天玑AI生态的基础。 目前,联发科技正在积极与开发者合作,为 AI智能体、第三方应用程序和大模型之间提供统一的标准接口,实现AI跨应用串联,从而高效地运行边缘AI计算和云服务,最终目的是缩短AI产品的开发周期,有利于加速构建应用更丰富、体验更出色的天玑AI生态。


3.png


与亮点频闪的天玑9400技术能力相比,更重要的是联发科技设计SoC芯片的技术策略。天玑9400实现完全的端侧训练,也是出于这样的考虑:提升用户体验。更深层的着眼点,这展现了联发科技在洞察了用户的AI需求之后,做出的个人智能体化的深度布局。这也许就是生成式AI的真正意义,也是AI手机存在的真正价值:高度理解用户,每台手机都代表了高度的个人化和个性化,具有不可通用性和无可替代性价值。当智能手机向智能体发展的趋势如潮涌动,联发科技选择了一条难而正确的路,就像发布会联发科技所讲的,路虽远,行则将至,而这种更坚定的长期价值,才是手机行业发展的源动力。