显卡大神Raja Koduri加盟闪迪,推动HBF内存技术破局AI显存瓶颈

2025年7月25日,闪迪官宣前英特尔图形架构负责人Raja Koduri正式加入其HBF(High-Bandwidth Flash,高带宽闪存)内存技术顾问委员会,要在不增加成本前提下,实现AI GPU显存容量的提升,目标是最高部署4TB内存,远超当前HBM标准8-16倍

Raja与闪迪的合作意义重大,因为其拥有GPU开发背景,尤其是在计算架构设计方面的经验,这与闪迪致力于生产HBF实现更高容量VRAM(显存)的使命契合。未来,闪迪计划将HBF打造为一个开放标准生态系统,进一步促进与GPU供应商的合作。

以下是关于HBM与HBF GPU内存对比及运行Frontier LLM的相关情况:

192GB配置HBM的GPU,HBM内存具有较高的带宽和较低的延迟,适合处理需要快速数据访问的计算任务。

3,120GB配置HBF的GPU,HBF内存能够提供更大的存储容量,适合处理大规模数据集和复杂模型,尤其是在需要长时间数据存储和频繁数据交换的场景中表现优异。

在运行Frontier LLM时:

• 模型参数:Frontier LLM拥有1.8万亿(1.8T)参数。

• 权重精度:以16位权重进行计算。

内存需求方面,对于配置HBF的GPU,需要3600GB内存来运行该模型,而配置HBF的GPU的总内存为4096GB,能满足运行需求。相比之下,配置HBM的GPU的192GB内存显然无法满足此类大规模模型的内存需求。

总结来说,HBF GPU拥有超大内存容量,在运行大规模模型如Frontier LLM时展现出明显优势,而HBM GPU则在需要高带宽和低延迟的小规模、高性能计算任务中更为适用。

Raja Koduri这样说的当我们开始开发 HBM 时,我们的重点是提高每瓦带宽和每平方毫米带宽(这两者都是移动设备的重要制约因素),同时保持与现有解决方案的竞争力。HBF 的重点是大幅提升内存容量(每美元、每瓦和每平方毫米),同时提供具有竞争力的带宽。

理解一下就是,HBM(高带宽内存)和HBF(高带宽闪存)在内存技术的发展路径上,两者设计不同,HBM的出现重点是为了提升单位功耗(每瓦)和单位面积(每平方毫米)的带宽密度,满足移动设备、显卡等对高带宽和低功耗的双重要求。而HBF则转向解决大模型时代最核心的痛点——内存容量不足。

两者分别服务于“算的快”和“装的多”两种不同任务场景,共同推动AI存力架构的演进。

最后分享一下Raja Koduri这位大佬的背景:

AMD时期:2001年加入AMD的前身ATI Technologies,担任高级技术开发总监。

ATI 被AMD收购后2009年之前一直担任AMD的图形首席技术官。

2015年AMD重组图形部门并成立Radeon技术部门,他被提升为高级副总裁兼首席架构师,简单来说,这个部门负责从零开始设计、生产、优化Radeon系列显卡,让它能跑得快、玩得爽、画得美,还支持新技术。

苹果时期:2009年至2013年,在苹果公司担任图形架构总监,参与苹果的图形硬件开发,助力苹果Mac电脑实现向高分辨率视网膜显示屏的转变。

重返AMD时期:2013年重返AMD,担任视觉计算副总裁,负责GPU硬件和软件。2015年AMD重组其图形部门后,其被任命为新成立的Radeon技术集团的高级副总裁兼首席架构师。

英特尔时期:2017年加入英特尔,担任核心和视觉计算集团的首席架构师和高级副总裁,负责开发高端独立GPU,并扩展英特尔在PC市场的集成显卡领先地位。

2023年3月,英特尔CEO帕特・基尔辛格宣布,Raja Koduri 将于3月底离开公司,此后他创立了一家专注于游戏、媒体和娱乐领域生成式人工智能的初创公司,并加入了 Tenstorrent在人工智能和 RISC-V半导体领域的董事会。

然后是现在加盟闪迪,开启HBF新时代。