Bolt 创新 GPU,以路径追踪技术挑战英伟达霸主地位
在 GPU 领域,长期以来英伟达、AMD、英特尔三家巨头占据主导地位。尤其是英伟达,凭借强大的生态、深厚的技术积累和卓越的品牌影响力,在高端游戏与专业图形市场稳坐头把交椅。从 RTX 20、30 系列引入光线追踪技术,到 RTX 40 系列实现 AI 加速,英伟达的产品充分展现了工业级性能与软件生态的完美融合。
然而,在这片竞争激烈的红海中,一家名为 Bolt Graphics 的初创公司崭露头角。他们推出了一款名为 Zeus 的新型 GPU,目标是挖掘路径追踪技术的终极潜力。这不仅仅是对英伟达等巨头的挑战,更是从全新的维度重新定义 “GPU” 的未来发展方向。
为何路径追踪成为突破口
过去十年,实时光线追踪(RT)为游戏画质带来了显著提升,让游戏世界在阴影、反射、全局光照等方面更接近真实。但 RT 本质上只是对可见线路的近似,通过局部采样来达到 “足够好” 的效果。许多游戏开发者为了保证性能和效率,在灯光设计中不得不牺牲物理真实性。
而路径追踪(Path Tracing)则是一条截然不同的技术路线。它从场景出发,能够探测出在任意波段传播的所有光线路径,甚至可以处理烟雾、毛发、次表面散射等复杂效果。通过精确采样,路径追踪可以得到无噪点的渲染结果,有效解决了几何锯齿、高频纹理振铃、摩尔纹等走样问题。尽管其计算成本极高,但输出效果的细腻度和动态范围表现,使其向真正物理精确的渲染迈出了重要一步。
对于追求极致视觉精度的用户来说,路径追踪是真正的 “无妥协画质”。然而,传统方式下实时路径追踪所需的算力是普通 GPU 的十数倍甚至百倍,这也限制了其广泛应用。
路径追踪的早期理论源于 Jim Kajiya 1986 年发表的开创性论文《渲染方程》。这篇论文正式定义了一个积分方程,涵盖了现代渲染理论的全部内容。它整合了光在物体间反射的所有可能路径及能量贡献,统一了漫反射、镜面反射和焦散效应,摒弃了 “光源与几何分离” 的观念,提出所有几何都能反射和发射能量,终结了点光源概念,要求包括光源在内的所有几何都具备物理面积。
为了阐释其统一渲染理念,Kajiya 实现了一个暴力路径追踪器来求解该积分方程。当时,他的理念远超时代,渲染一张 512×512 像素、每像素 40 次采样的图像需要 20 小时。此外,他还提出了重要性采样概念,以及如何用层次 k - d 树加速计算。
1997 年,Eric Veach 在博士论文《稳健蒙特卡洛光传输模拟方法》中,为图形行业提供了大量理论和技术,推动了路径追踪的实际应用。metropolis 光传输和双向路径追踪技术,让渲染研究者得以开发渐进式求解器,通过高效采样光路实现无噪点结果。再加上通用可编程 GPU 的普及,计算能力大幅提升,进一步加速了路径追踪技术的发展。如今,路径追踪技术在多个行业得到了广泛应用。
为了实现电影级的画面效果,如 4K、60 FPS 的路径追踪渲染,迪士尼、皮克斯等机构仍然依赖 CPU 农场,以每帧上千小时的渲染时间来换取高质量的画面。从诸多公开资料可以看到,一部动画电影中某个城市街区的场景渲染甚至耗尽了当年 64GB 的服务器内存,折算下来连 256 个 CPU 核心也得跑上小时级别。
面对这一挑战,初创公司 Bolt Graphics 决定另辟蹊径。他们放弃了传统光栅化图形流水线,选择从芯片底层出发,定制一整条路径追踪算力通道,致力于打造一款终极路径追踪 GPU。
一家专注于光追技术的公司
Bolt Graphics 成立背景相对低调,其团队主要由来自图形、渲染、计算架构领域的工程师组成,其中大多来自英伟达、AMD、Intel 等知名企业,还有部分成员具有电影制作公司背景。这些工程师意识到,尽管光追技术已经得到广泛应用,但路径追踪技术的 “极致潜力” 仍未被充分挖掘。
他们的使命是 “重新设计 GPU,为架构师、玩家、艺术家和研究人员提供改变世界的工具”。这一目标明确且具有挑战性,定位为高性能路径追踪、可视化与 HPC 兼容性。
目前,Bolt Graphics 公布了三种计划中的 Zeus 版本。“单芯片” Zeus 1c 的 TDP 约为 120W,基于 RISC - V 自定义乱序标量 + 向量单元,采用小容量高速 LPDDR5X + 大容量 DDR5。其路径追踪性能约为 77 亿射线 / 秒,支持 INT8、INT16、AV1 等加速功能,核心设计以高密度路径追踪加速单元为主,不做张量计算。
“双芯粒” Zeus 2c 集成了两颗计算和两颗 IO 芯粒,芯粒间带宽高达 768GB/s,功耗翻倍的同时性能也翻倍,更适合专业工作站。该版本的 LPDDR5X 焊死,DDR5 可定制,适度下放给中小型预算客户。
最贵的 “四芯粒” Zeus 4c(数据中心版本)的 TDP 达到了 500W,内含 2TB DDR5 + 256GB LPDDR5X,设计为 2U 服务器卡,一机可配四块组成集群,支持 NVMe、400Gb/800Gb 以太网、Redfish BMC 级监控,旨在构建可扩展路径追踪与 HPC 集群平台。
目前,Bolt Graphics 的 Zeus GPU 主要可能在三个方向进行发展。在专业工作站市场,该市场对 FP64、单精度算力和图形精度都有较高要求,Zeus GPU 可以与英伟达 RTX A6000、Blackwell 工作站版展开竞争。在数据中心租赁市场,4c Zeus 配上 800G 网络和 180TB 内存集群,可用于渲染农场、数字孪生平台、雷达仿真等领域。而在消费级游戏市场,如果 Bolt Graphics 未来推出低功耗单芯片卡,也有可能配合 DirectX/Vulkan 进入游戏市场。
Zeus,有何优势
Zeus GPU 最引人注目的特点之一是其独特的内存架构。传统 GPU 通常采用 GDDR 内存,为了追求带宽而牺牲了容量。而 Bolt Graphics 选择了 LPDDR5X(提供高带宽) + DDR5(保证大容量)的组合,后续还计划支持堆栈 SRAM、共封装光学芯片。一个 Zeus 4c 卡的总内存将直逼 2.25TB,远超消费级显卡。这种内存架构不仅有利于路径追踪数据集场景,而且对 HPC 数据集也非常友好。
在接口方面,Zeus GPU 也考虑得十分周全。它配备了双 PCIe 5.0 x16 接口和 400G Ethernet 接口,未来还将支持 800G 接口,明显瞄准了数据中心通信需求。这表明 Zeus GPU 从一开始就定位在专业工作站甚至服务器机柜级集群领域,而不是面向普通消费市场。
Bolt Graphics 宣称,在一套典型的 4K 路径追踪场景(20 次反射、30 FPS)下,英伟达 RTX 5090 需要 280 张卡才能完成渲染任务,而 Zeus GPU 仅需 28 张卡,效能提升了整整 10 倍。在功耗方面,Zeus GPU 更是以惊人的 1/10 全面碾压传统 GPU。
从提供的数据源来看,RTX 5090 在 4K 120 FPS 状态下每像素支持 8 条光线,而 Bolt 的 1c 卡支持 “25 条以上”,2c 版可达到 “100 条”。这意味着 Zeus GPU 在单位时间内处理路径追踪的密度比英伟达现实用途 GPU 强 4 - 12 倍。不过需要注意的是,目前 Bolt Graphics 的测试主要依靠模拟器和仿真环境,尚未通过实卡验证。但从整体技术方向和发展趋势来看,Zeus GPU 的架构似乎已经具备了实现真实路径追踪的能力。
除了在图形渲染方面表现出色外,Zeus GPU 在 HPC 领域也宣称能够提供显著的加速效果。FP64 是 HPC 的核心计算需求,而英伟达主要专注于 AI 领域的 FP16、FP32 计算,因此在 64 - bit 运算上不占优势。Bolt Graphics 发布的资料显示,在 FP64 计算方面,单芯版 Zeus GPU 约为 5090 的 3 倍,双芯版约为 6 倍;在电磁波模拟(如 CT、MRI、EM 兼容性扫描)中,其性能高达 Blackwell GPU 的 300 倍;APC 数据还提及,4c 卡的模拟空间是 Blackwell B200 的 40 倍(38 亿模拟单元 vs. 9110 万)。
值得一提的是,Zeus GPU 支持 IEEE - 754 FP64 标准并执行数值一致性,这对于 HPC 和科研人员来说,意味着计算结果具有可复现性和可靠性。
生态或是打破垄断的关键
通用 GPU(包括英伟达、AMD、Intel)基本都采用封闭的 ISA,如英伟达的 PTX、AMD 的 LLVM IR + GCN、英特尔的 Xe - LPG。而 Bolt Graphics 则另辟蹊径,完全基于开源 RISC - V 标量 + 向量扩展 RVV 1.0。这意味着其 CPU 核设计具有高度的自由度和可定制性,编译器也可以全开源,容易被社区接受。客户还可以通过 LLVM 自行构建工具链。
换言之,Bolt Graphics 不仅在研发芯片,还在努力打造一个开放、定制、可融合的生态平台。当然,一块 GPU 如果没有配套的软件支持,就如同一块石头,无法发挥其真正的价值。因此,Bolt Graphics 投入了大量资源开发专属路径追踪引擎 Glow Stick,并承诺与主流渲染工具高度兼容,包括 Blender、Maya、3DS Max、Houdini、Nuke 等。该引擎支持高精度采样和物理蒙特卡洛积分,能够处理 Ptex、OpenShadingLanguage、多级 MipMaps 等复杂效果,全路径追踪所有光学特效,包括焦散、散射等,API 还提供 Shader/Pipeline 定制功能,让开发者可以深度控制渲染过程。最重要的是,Glow Stick 将免费配套,捆绑在 Zeus GPU 上发售。
据了解,接下来 Bolt Graphics 还将推出 Apollo 电磁仿真器,与 Glow Stick 并行运作,将 HPC 和渲染结合起来,为科研、工程领域提供一个统一的平台。目前,Bolt Graphics 已开始与多家行业软件进行 SDK、插件形式的合作,包括引擎集成商(如 Unreal、Unity)、渲染农场管理(如 Deadline)、主机操作系统厂商、芯片合作伙伴等。他们甚至在构建能对接 DirectX、Vulkan 的驱动环境,但要在 Windows 驱动生态方面取得进展比 Linux(HPC)更为困难,Bolt Graphics 仍有大量工作要做。
大规模量产依旧遥遥无期
尽管 Zeus GPU 展现出了巨大的潜力,但目前 Bolt Graphics 仅有模拟器与仿真环境。按照计划,他们要到 2025 Q3 才会交付首批开发套件,2026 年底才可能进入量产阶段。这种初创企业常见的时间压力将考验其资金实力、团队管理能力和合作伙伴的信任度。
一旦在流片(Tape - out)过程中出现问题、交付延误或成本远超预期,都可能导致项目规模缩减。更何况,过去英特尔 Arc、英伟达 40 系卡,甚至 AMD RDNA 家族产品都曾出现 “产品性能远低于宣传” 的情况。因此,Bolt Graphics 面临着巨大的压力,他们必须在交付硬件时,能够提供与演示数据相匹配的性能表现。
此外,软件生态的构建也给量产带来了一定压力。由于没有 CUDA,没有成熟的驱动程序,无法运行主流游戏引擎,Zeus GPU 需要在渲染和 HPC 之外寻找新的应用途径,比如专注于行业软件和科研领域。他们设想先让电影工作者、设计师、科研人员试用,再逐步拓展到游戏开发者社区。但这需要几十个样板项目和成功的商业案例才能确定合作关系。
据了解,Bolt Graphics 当前已启动早期访问计划(EAP),吸引了一批视觉特效艺术家和研究机构参与测试。如果这些早期用户的评价良好,Bolt Graphics 就有机会借助他们的作品树立成功案例。但真正的挑战在于,这些项目能否及时转化为商业机会,以及用户是否愿意为一套尚未量产的显卡支付数万甚至数十万美金。
写在最后
对于光追应用来说,Bolt Graphics 的 Zeus GPU 未来可期。如果 Zeus GPU 真能实现每帧几十条路径追踪线,游戏画面将迎来前所未有的提升:光照效果将更加逼真,阴影投射更加柔和,大气效果更加真实。这种 “电影般画质” 的游戏可能成为未来 AAA 游戏的新追求目标。如果有平台支持这种技术,玩家所能体验到的 “图形上限” 将被重新拉高。
此外,未来的渲染将逐渐与模拟融合,例如建筑渲染时同时进行光学、温力、电磁多物理耦合计算。如果 Zeus GPU 能够实现 “路径追踪 + 物理耦合” 联合加速,它可能开辟一个全新的跨领域市场。Bolt Graphics 的 Apollo 与 Glow Stick,从目前来看就是这种融合路线图的第一步。
然而,从乐观的角度展望未来的同时,我们也必须认识到 Bolt Graphics 面临的挑战。从概念设计到实际生产,从模拟测试到真实应用,从部分应用到生态整合,Bolt Graphics 需要同时克服时间、安全性、合作、用户信任等多方面的难题。成功的可能性和失败的风险并存,但即使最终项目失败,这也是一场 “次世代 GPU 赛道” 的技术试验,将为未来的 GPU 发展提供宝贵的思路和经验。
所以,如果你关注 GPU 行业的发展动态,对图形技术感兴趣,或者期待高保真渲染与模拟的结合,不妨将 Bolt Graphics 和 Zeus GPU 列入你的观察列表。因为它可能正是 GPU 领域的下一个 “极端挑战者”。

热门文章
- 台积电斥资2000亿新台币扩建CoWoS封装厂,力破砍单谣言 2025-01-21
- High NA EUV 光刻技术竞争:台积电观望 2025-04-29
- 运算放大器输入保护:噪声隐患与 JFET 解决方案 2025-07-15
- 解析为何普通电容难以替代安规电容的关键原因 2024-08-19
- 三星业绩下滑引发人才危机,大批高级员工或跳槽SK海力士 2024-10-22
- JTAG在嵌入式系统开发全生命周期中的系统调试与测试关键角色 2024-08-08
- "ROHM发布四款工业级SOP封装AC-DC控制器IC 2024-08-23
- 顺络电子(Sunlord)功率器件产品目录(2024-2025) 2025-04-21
- 三星电子NRD-K半导体研发综合体迎来重要里程碑:将导入ASML High NA EUV光刻设备 2024-11-21
- 大联大世平集团推出基于NXP产品的工业BMU方案 2024-09-03