清华大学尹首一教授谈国产高算力芯片发展两大路径：架构创新、开源开放

作者：谢世诚整理 • 2026年06月13日 • 智能算力

通过架构创新与软件协同，国产芯片有信心支撑国内人工智能始终站在全球人工智能能力的前沿。

在当前人工智能快速发展的当下，我国高算力芯片面临工艺受限与生态缺失双重挑战。

6月13日上午，“2026北京智源大会”进入第二天，在“ 智算前沿 - 下一代架构及基础软件 ”分论坛上，清华大学集成电路学院院长、IEEE Fellow尹首一教授以“高算力芯片发展路径探讨”为题发表演讲，他建议以架构创新破解工艺瓶颈、以开源开放应对生态壁垒的总体战略，系统梳理了数据流、可重构、存算一体、三维集成，推出了了晶圆级芯片五大创新路径，强调通过软硬协同突破国产算力瓶颈，支撑中国AI持续发展。

清华大学集成电路学院院长、IEEE Fellow尹首一教授

时代背景：算力规模的指数级扩张驱动技术突破

AI大模型的发展已进入依靠海量资源投入换取性能飞跃的阶段。从2012年AlexNet的出现，到如今GPT及国内基础模型的涌现，模型的泛化能力显著增强，编程、开发、创造等高阶任务均可由模型完成。然而，模型能力提升的背后是对算力的爆炸性需求。Google工程师Jeff Dean指出，未来需要的算力可能是当前能提供算力的一百倍。国内外对算力中心的建设均极为迫切。

尹首一教授认为，我国自主高算力芯片面临工艺受限与生态缺失两大挑战。工艺方面，自2018年以来境外对我国芯片工艺的限制持续收紧。生态方面，从传统IT到移动互联网再到人工智能，最终都会形成生态竞争。过去西方主导的生态体系在人工智能时代需要被打破，必须建立自己的生态体系。生态体系包含三个要素：基础创新、开源开放、应用驱动。

破局总体思路：架构创新破解工艺受限，开源开放应对生态缺失

基于上述挑战，尹首一提出以架构创新来破解工艺受限，以开源开放来应对生态缺失的总体战略。

从芯片算力的基本公式来看，算力取决于三个要素：每个晶体管提供的算力（由芯片架构决定）、芯片上的晶体管密度（由制造工艺决定）、芯片面积（由光刻设备决定）。在当前晶体管密度受限于制造工艺的现实下，如果仅沿传统GPU路径发展，最终将被晶体管密度卡住。因此，必须重点考虑另外两个要素：计算架构与芯片面积（集成架构），两者结合可开辟算力提升的新空间。

计算架构面临的核心困难被称为“三堵墙”：一是利用率低，算力中心中单芯片的晶体管利用率不高；二是存储墙，处理器速度远快于存储器，数据搬运严重限制了性能；三是功耗墙，芯片功耗过大，不得不降频运行。通过计算架构的突破，即使制造工艺不向前迭代，芯片性能也能得到提升。

集成架构方面，过去芯片面积受光刻设备限制，最大约八百平方毫米。随着先进集成技术的发展，国内有机会将芯片做得更大，突破单芯片的光照限制，或将芯片三维堆叠起来。黄仁勋在OSC会议上提出，未来可以将一个算力中心看成一个芯片，这带来了新的设计空间。

1.五大创新路径

尹首一对国际上能看到的新型芯片架构进行了归纳总结，形成一个三维坐标系：横轴代表不同的计算架构，纵轴代表三维集成的堆叠层数，另一横轴代表芯片面积。在非传统GPU架构的算力芯片中识别出五个创新路径。

创新路径一：数据流芯片

数据流芯片的特点是所有计算由数据驱动，而非传统的指令驱动。GPU采用指令驱动，需要取指、译码、发射等操作，占用晶体管资源并影响处理速度。数据流芯片直接由数据驱动计算，规避了指令处理的约束。谷歌TPU是典型代表，采用脉动阵列架构。第七代TPU比H200性能高1.5倍，TPU V8将在最新GPU基础上进一步提升。

创新路径二：可重构芯片

数据流芯片采用固定数据流，任务需适配数据。可重构芯片则通过硬件上的可编程能力，让芯片上的计算微架构适配软件和算法，具有动态构建最适计算架构的能力。典型案例如SambaNova（斯坦福技术成果），其SN30系统已部署于全球第二的富岳超算中心。英伟达收购的Groq（LPU）也是软件定义可重构技术体系，英伟达已发布LPU产品，未来GPU加LPU构成七核芯片。

创新路径三：存算一体芯片

常规芯片采用冯·诺依曼架构，存储与计算分离。存算一体通过将存储与计算物理距离拉近来解决存储瓶颈。近存计算是第一步，更进一步是将存储与计算放在同一个单元内。存算一体有两个技术方向：一是模拟存算一体，利用物理定律在模拟电路中实现等效计算；二是数字存算一体，在存储器阵列中加入数字计算逻辑。三星在HBM芯片中加入计算能力，推出HBM-PIM产品，可缩短运行时间11倍。三星、铠侠等正在LPDDR存储器中加入计算能力，拓展存算一体产品系列。

创新路径四：三维集成芯片

三维芯片为芯片架构和设计带来新空间：一是拓展了互联，芯片间互联从边缘互联变为平面互联，互联能力呈数量级提升；二是创造新的架构空间，芯片上可堆叠逻辑、存储器、电源等新功能。典型案例包括Broadcom发布的3.5D结构，通过垂直方向3D堆叠与平面方向2.5D扩展结合。英国公司Delv的芯片在算力芯片上叠加全电容芯片，通过垂直电容改善供电能力，提升运行性能。

创新路径五：晶圆级芯片

由于光刻限制，单芯片最大面积约800平方毫米。如果将芯片做大，晶体管数量必然增加。十二寸晶圆的可用的计算面积约四万多平方毫米，比单芯片大五十倍。晶圆级芯片的思路是将整张晶圆作为一个芯片。两个可见案例：一是Cerebras公司，采用整晶圆一体制造方式，完全靠光刻能力将整张晶圆制造成一个芯片，已迭代三代，上个月已在纳斯达克上市；二是特斯拉，采用多芯粒加高密度集成的方式，将多个芯片集成并视作一个整体。今年一月份，OpenAI拿出一百亿美金采购Cerebras晶圆芯片产品。

2.软件生态：开源开放突破壁垒

面对已形成的CUDA生态壁垒，软件生态建设同样迫切。开源开放的成效已在Linux、PyTorch等项目中得到证明，以开源开放的生命力有机会突破CUDA的垄断。算力芯片软件生态面临“四座大山”：分布式训练、推理框架、丰富且准确的算子库、高性能可编程模型、高性能可扩展集合通信。清华大学与智源合作，依托FlagOS已提供统一的、开源的基础软件生态，支持底层多种硬件和创新架构芯片，为芯片与软件结合带来新的优化空间。

总结

国产算力芯片面临诸多挑战。硬件上需通过创新计算架构突破传统设计思维，在先进工艺受限的情况下进一步提升芯片性能。尹首一教授强调，软件方面需通过开源生态协同，解决芯片推广与使用问题。硬件与软件协同起来，突破国产算力瓶颈。通过架构创新与软件协同，国产芯片有信心支撑国内人工智能始终站在全球人工智能能力的前沿。

本文来源于DOIT传媒，文章内容仅供参考，不构成投资建议。

清华大学尹首一教授谈国产高算力芯片发展两大路径：架构创新、开源开放

通过架构创新与软件协同，国产芯片有信心支撑国内人工智能始终站在全球人工智能能力的前沿。

2026年06月13日 23点36分
对话阿里云王坚和智源理事长黄铁军：总有人比时代早十年

对话认为，人工智能并非替代人类，而是与人类智能互补的机器智能形态，当前技术虽处混沌期、面临可控性与解释性等挑战，但人类应以乐观心态驾驭这一变革，最终实现人与智能体的共存融合。

2026年06月13日 21点49分
Day-0支持｜摩尔线程率先完成MiniMax M3大模型适配

这是国产大模型与国产算力芯片完成适配的又一例证，也彰显了摩尔线程凭借原生FP8算力底座与高效MUSA软件生态，对前沿大模型需求的即时响应与稳定支撑能力。

2026年06月13日 21点05分
小米小米小米

智源大会深度对话：大模型自进化、智能体与世界模型的下一步

要选对赛道，做重要的事

2026年06月13日 10点44分
会写字、懂排版、能分镜：HiDream-O1-Image-1.5 全能图像生成能力解析

近日，智象未来（HiDream.ai）全新推出的商用版图像生成模型 HiDream-O1-Image-1.5 再次实现 SOTA，在全球知名独立 AI 模型评测与分析平台 Artificial Analysis的文生图榜单（Text to Image Leaderboard）上，一举登上中国图像生成模型第一，成为评分仅次于OpenAI的中国大模型公司，超越Google Nano Banana 2（Gemini 3.1 Flash Image Preview）、NVIDIA Cosmos3-Super-Text2Image 和字节跳动的Seedream 4.0等国内外大厂的主流图像生成模型。

2026年06月12日 23点24分
硬核技术局｜打破存储瓶颈！业内首创智能中断聚合技术

在线业务最让人焦虑的，往往不是一直慢，而是偶尔“卡一下”。同一套系统，有时秒开，有时停半拍——当技术团队也不知道发生了什么时，用户只会觉得是整套系统不稳定。

2026年06月12日 23点18分
神州控股携供应链AI核心能力亮相“数云原力2026”

6月9日，数云原力2026·原力论坛在北京正大中心收官。神州控股以「xᴬᴵ·供应链」为主题打造展区，系统呈现AI在供应链及多行业场景的全链条能力，让参会者零距离感受“可触摸、可落地”的智能化实践。

2026年06月12日 23点15分
智源大会｜技术、应用、生态协同发力面壁智能描绘端侧 AI 新图景

当大模型突破云端算力桎梏，开始扎根各类终端设备实现感知决策，AI 正在迈入“从云到端”的全新阶段。6月12日，在 2026 北京智源大会上，面壁智能以多元化的应用场景、全栈自研的技术体系、成熟的生态孵化能力等三重优势，全方位展示了端侧 AI 发展全景，加速让 AI 从云端交互走向物理世界。

2026年06月12日 23点07分
从万卡集群到端侧AI：摩尔线程全栈创新亮相2026智源大会

摩尔线程深度参与大会，多位技术专家在多个论坛及Open Talk环节发表演讲，系统呈现覆盖“云-边-端”的软硬协同全栈创新成果。

2026年06月12日 12点00分
逐代码星河战算力之巅！2026第十三届并行应用挑战赛正式启航

多位院士领衔、超算领军人物坐镇、产学研顶尖力量齐聚

2026年06月12日 12点57分
西部数据

AI数据分层下，高带宽硬盘技术在卷什么？

高带宽硬盘技术不是要让HDD去和SSD、HBM比速度，而是为了回应AI数据分层架构中的现实需求。

2026年06月12日 18点17分
2026奇点智能产品大会首批嘉宾官宣

全球产品经理大会正式更名为奇点智能产品大会

2026年06月12日 18点06分
慕尼黑上海电子展揭示电子行业未来重要主线：从芯片性能迈向系统整合

第三代半导体、数字电源以及高压供电架构成为热门的话题之一

2026年06月12日 18点03分
算力「芯」动向 | 2026北京智源大会：当硅谷还在卷参数，有人已经换了考场

2026年06月12日 17点27分
OpenAI的Token大降价？对上Anthropic，本质上是一场关于AI公司该怎么定价的静默战争

2026年06月12日 17点22分
驾驭AI超级增长周期，AI for Process构筑企业智能化完整落地体系

神州数码提出的AI for Process理念跳出单点工具化应用的传统误区，直击企业经营核心流程，从思维模式、协作关系、落地路径三大维度重构企业经营底层逻辑，为产业破解AI落地难题、实现组织可持续自我成长提供了完整解法。

2026年06月12日 17点15分