算力芯动向 · 深度观察
2026北京智源大会行业视角分析
2026年6月12日,第八届北京智源大会开幕。表面看这是一场例行的学术盛会,但本质上是智源研究院在向整个行业喊话:大模型的竞争规则已经变了,从预测下一个词,切换到预测下一个物理状态。这不是产品迭代,是赛道迁移。

从悟道到悟界,智源研究院在给AI换底层操作系统
智源研究院这次发布的核心不是某个单一模型,而是一整套新的技术范式。王仲远院长在报告中明确提出,AI正在从Next-Token Prediction走向Next Physical State Prediction。这句话的潜台词是,过去三年全球AI行业卷生卷死的参数竞赛、benchmark刷分,在其看来已经触及天花板。
悟界·Physis-v0.1被定位为全球首个通用世界基座模型,它的核心能力不是生成更流畅的文本或更逼真的视频,而是理解物理世界的因果规律。模型把视频、RGB-D、3D点云、力触反馈等多模态信息统一编码为物理状态Token,支持50多个复杂物理场景的长程推演。这意味着AI开始从被动回答转向主动预判,从数字世界的旁观者变成物理世界的参与者。

与此同时,悟界·RoboBrain Orca完成了从Next Token、Next Frame、Next Action到Next State的跃迁,构建起统一表征、建模、预测、交互的完整闭环。这直接指向具身智能的终极命题:机器人不是缺手脚,是缺一个能预判后果的大脑。

世界模型的分类体系,一场话语权暗战
智源研究院这次最具战略野心的动作,是系统性地梳理了世界模型的四大技术路线并逐一指出局限。第一类以语言为中心,包括VLM和VLA,学到的是语言描述的世界而非物理后果;第二类以像素为中心,代表是Sora和Seedance,学到的是像素描述的世界;第三类以三维结构为中心,包括李飞飞团队的World Labs Marble,但重建3D空间不等于理解世界;第四类以视觉表征为中心,代表是LeCun的JEPA系列,视觉嵌入演化不等于物理规律演化。
这套分类体系的厉害之处在于,智源研究院在定义什么是真正的世界模型,同时也在划定竞争对手的边界。当OpenAI用Sora占领视频生成心智、LeCun用JEPA推进自监督学习时,智源研究院用悟界·Emu3.5和Physis-v0.1给出了自己的答案:真正的世界模型必须以物理状态为中心,以预测下一物理状态为核心范式。这相当于在世界模型这个新兴领域,试图建立中国机构的话语权。
学术顶刊与独角兽孵化,新型科研机构的北京模式
智源研究院的打法不是闷头写论文,也不是单纯做开源,而是学术突破与产业孵化双轮驱动。悟界·Emu3.5今年1月登上Nature正刊,这是国产科研机构主导的大模型成果首次在Nature正刊发表。悟界·Brainμ的相关研究也已刊发于Science。在学术层面,智源研究院已经拿到了国际顶级期刊的背书。
在产业层面,智源研究院孵化的具身大脑公司星源智成立仅10个月累计融资已达10亿元人民币,投资方涵盖高瓴、松禾资本、中车资本等头部机构。此前智源研究院还孵化出了智谱AI,后者港股市值已突破8000亿港元。这种从基础研究到开源生态再到商业独角兽的传导链条,正在形成一种新型科研机构的北京模式。
FlagOS的隐形价值,国产算力生态的粘合剂

容易被忽略但极其关键的一点是众智FlagOS 2.1。这个系统软件栈支持18家芯片厂商的32款芯片,是全球覆盖芯片数量最多的统一开源AI系统软件栈。4月24日DeepSeek-V4发布当天,FlagOS就完成了在8款以上芯片的Day0适配,包括海光、沐曦、华为昇腾、摩尔线程、昆仑芯、平头哥真武、天数等国产芯片。
FlagOS解决的是一个行业级痛点:M款模型与N款芯片的适配难题。它通过FlagGems算子库实现全链路算子替代,摆脱对CUDA及NVIDIA私有库的依赖,做到一次开发、多芯运行。在国产算力自主可控的大背景下,FlagOS不是在做一个工具,而是在铺设基础设施。这是智源研究院对AI产业链最底层的卡位。
三体互动背后,AI正在成为科研新范式

智源研究院这次提出的AI、物理世界和生命科学三体互动,不是概念包装,而是有具体落点的战略布局。悟界·Brainμ1.0将人类、猕猴、小鼠跨物种的EEG、fMRI、MEG等全模态脑信号统一编码为Token,构建起多模态脑科学通用基座,辅助筛查阿尔兹海默症、抑郁症、帕金森等疾病。悟界·OpenComplex2.5则覆盖药物研发的口袋识别、反向筛选、结构预测、亲和力预测四大关键步骤。

这意味着AI正在从应用工具下沉为基础科学研究的方法论。当AI能够处理神经科学的万亿级Token数据、解析固有无序蛋白的动态构象时,它就不再是辅助工具,而是科研本身的一部分。智源在做的,是把AI变成生物学、神经科学、药物研发等基础学科的底层操作系统。
第八届智源研究院大会的真正看点,不是发布了多少个全球首个,而是智源在试图定义下一代AI的底层范式。从悟道到悟界,从预测词元到预测物理状态,从数字世界到物理世界,智源选择了一条更底层、更长期也更难走的路。这条路能不能走通,三年后才能见分晓,但至少在考场切换的这个节点上,智源已经率先交卷了。
今日阅读文章分享:
2026北京智源大会开幕 | 从“悟道”到“悟界”,智源研究院推动人工智能、物理世界和生命科学“三体互动”
(链接:https://mp.weixin.qq.com/s/4s8WOn55aTYOonTocBjFEg)
本文若有歧义欢迎读者分享指正。
我们以算力为线,持续跟进算力基础设施的报道,输出洞察,伴随算力行业实现算力自由。敬请关注!

本文来源于DOIT传媒,文章内容仅供参考,不构成投资建议。
评论列表