算力豹算力产业链月刊(2025年4月)

导读

在这个数字洪流激荡、创新浪潮翻涌的新时代,算力不仅是衡量一个国家科技版图上璀璨星辰的亮度标尺,更是驱动数字经济巨轮破浪前行的澎湃引擎。

本月刊是精心策划的专栏,为您缓缓展开2025年4月份以来算力世界以及人工智能领域的精彩篇章,涵盖公司新闻、产品动态、政策发布与会议活动四大板块。

文字编辑|李祥敬

1

公司新闻

OpenAI终于open了!开放权重模型,AI江湖再掀风云?

2025年4月1日,AI界扔下了一颗“重磅炸弹”!OpenAI首席执行官SamAltman,在社交媒体上大手一挥宣布:未来几个月,将推出自GPT-2以来首个带推理能力的开放权重语言模型。好家伙,这消息一放出,整个AI江湖瞬间炸开了锅。

想当年,OpenAI自发布GPT-2后,就像个“守财奴”一样,对模型权重严防死守。如今却突然“改弦更张”,简直比六月的天变得还快。

不少业内人士纷纷猜测,这大概率是被DeepSeekR1等开源模型逼得“走投无路”了。就好比武侠小说里,原本闭关修炼的武林高手,突然发现江湖上冒出一堆后起之秀,再不出来溜达溜达,江湖地位可就保不住喽。

虽说OpenAI这一决定看似是迫于竞争,但背后其实暗藏玄机。毕竟AI这玩意儿,就像一把双刃剑,玩得好能造福人类,玩不好可就成了潘多拉的魔盒。OpenAI这次既要打开技术开放的大门,又得时刻警惕,别让安全风险钻了空子,这难度,可不亚于走钢丝。不知道这次OpenAI能否成功拿捏平衡,给AI江湖带来一场良性变革,咱们就拭目以待吧!

国家天文台基于通义千问打造国际首个太阳大模型“金乌”

2025年4月1日,国家天文台联合阿里云宣布成功打造国际首个太阳大模型——“金乌”。这一创新成果基于阿里云的通义千问系列开源模型,标志着人工智能在天文学领域的应用取得了重大突破。

“金乌”太阳大模型在M5级太阳耀斑预报上实现了超过91%的准确率,这一成绩达到了该级别太阳预报的最高水平。太阳耀斑的爆发对地球的影响深远,不仅影响地球的电磁环境,还可能对全球电力系统、在轨卫星以及空间站的安全构成威胁。因此,准确预报太阳活动对于维护国家空间安全具有至关重要的意义。

“金乌”太阳大模型的开发基于超过90万张太阳卫星图像的样本数据,通过输入上一时段的太阳物理参数及对应的观测图像,模型能够预测未来24小时内的耀斑爆发情况。此外,“金乌”还能够推测下一时段的物理参数,并通过调用扩散模型生成下一时段的太阳模拟图像。

随着太阳观测卫星数量的增加和空间探测技术的发展,太阳观测数据呈指数级增长,传统的预报方式已经难以应对海量的数据处理需求。人工智能技术,尤其是大模型,因其在处理图像等多模态数据方面的优势,为太阳预报提供了新的解决方案。相比传统机器学习方法,大模型更擅长理解和推理复杂的物理关系,从而更适用于太阳预报。

联想发布三大AI服务品牌“擎天、百应、想帮帮”,全面抢滩AI服务市场

近日,联想中国区FY25/26财年誓师大会在北京隆重举行。大会上,联想集团执行副总裁兼中国区总裁刘军正式发布了联想全新的三大AI服务品牌:联想擎天、联想百应与想帮帮。刘军强调,此次三大品牌的发布标志着联想将全面进军AI服务领域,覆盖政企、中小企业和消费客户三大市场。

本次发布中,联想擎天解决方案与服务和想帮帮均为首次公开亮相。联想擎天专注于政企客户,核心提供智能体矩阵、xCloud智能云、AI全周期服务和ESG四大方案服务。

具身智能圈扔下一颗重磅炸弹!

智元机器人与Physical Intelligence达成深度合作

2025年4月2日,具身智能圈扔下一颗重磅炸弹!国内具身智能界的 “扛把子” 智元机器人,携手国际顶尖选手Physical Intelligence(Pi),开启了一场超硬核的技术合作。这可不是普通的 “牵手”,双方要向动态环境下的长周期复杂任务发起挑战,目标是彻底革新具身智能的玩法!

值得一提的是,这次合作由智元机器人新任首席科学家罗剑岚博士亲自操刀。在他的带领下,这场合作或将让全球具身智能领域 “改头换面”,直接进入技术协同的新阶段!

重磅发布!Meta Llama 4震撼登场

发布即开源,MoE架构重塑AI算力格局

2025年4月6日凌晨,Meta以“周末突袭”的方式开源Llama 4系列模型,标志着AI开源生态进入“超参数密度”与“多模态协同”的新阶段。此次发布的三个版本——Scout(轻量级)、Maverick(旗舰级)和Behemoth(超大规模)——不仅首次全面采用混合专家(MoE)架构,更以1000万token上下文窗口刷新行业纪录,直接对标DeepSeek、GPT-4o等顶尖闭源模型。

英伟达完成收购Lepton AI,阿里前副总裁贾扬清携团队加盟

据TheInformation援引知情人士消息,英伟达已完成对LeptonAI的收购,这家由AI领域知名专家、阿里巴巴前副总裁贾扬清创办的初创企业,交易价值高达数亿美元。

据悉,LeptonAI成立于2023年,定位为AI基础设施公司,专注于为初创企业提供高效的云端解决方案。其核心业务包括出租英伟达GPU服务器并开发配套软件,帮助客户在云中构建、管理和优化AI应用。目前,LeptonAI团队规模较小,仅约20名员工,但其技术实力和市场潜力已受到业界关注。

谷歌云Next 2025大会:全面布局“推理时代”,引领AI新篇章

拉斯维加斯,2025年4月10日——在刚刚落幕的Google Cloud Next 2025大会上,谷歌通过一系列创新发布,展现了其在人工智能领域的雄心壮志。此次大会以“推理时代”(Age of Inference)为主题,标志着AI技术从简单的即时响应向主动检索、生成数据以及协作提供见解的新阶段迈进。谷歌云CEO Thomas Kurian在会上强调,谷歌的战略是提供世界级基础设施、模型、平台和代理,构建开放、灵活的互操作性生态系统。

OpenAI又搞偷袭,GPT-4.1深夜登场

史上最小、最快、最便宜三大模型,百万token上下文!

北京时间4月15日凌晨,OpenAI突然发布GPT-4.1系列模型(标准版、Mini、Nano),以“史上最小、最快、最便宜”的标签,搭配百万token上下文处理能力。这场发布不仅颠覆了其自身产品迭代逻辑,更在谷歌、Anthropic等对手的围堵中撕开一道缺口。

爱簿智能AIBOOK算力本:AI开发新时代的破局之匙

2025年4月7日,在爱簿智能2025战略暨产品发布会上,爱簿智能创始人兼CEO孙玉昆指出,DeepSeek开源后成为全球增速最快的AI应用,在无广告投入的情况下,7天用户增长到1亿,远超当时ChatGPT达到1亿用户所花的两个月时间。中国生成式AI用户已达3亿,企业用户通过云端API或部署一体机等方式接入DeepSeek大模型。据浙商证券测算,到2027年,DeepSeek一体机规模将超5200亿。

OpenAI发布最强推理模型o3和o4-mini

图像深度思考首秀,还能自主调用工具

北京时间4月17日凌晨时分,OpenAI正式推出了两款具有划时代意义的AI模型——o3与o4-mini。这两款模型不仅具备通过图像进行复杂推理的能力,还能自主调用并整合多种工具资源,被业界专家誉为人工智能领域的一次重大飞跃。作为OpenAI“o系列”推理模型的最新力作,o3与o4-mini在训练过程中被赋予了更长时间的思考能力,即在响应之前能够进行更为深入和全面的分析。同时,它们也是OpenAI迄今为止发布的最智能、功能最强大的模型。

这些先进的推理模型能够自主组合并运用ChatGPT平台内的所有工具,涵盖网页搜索、利用Python编程语言分析上传的文件与数据、对视觉信息进行深度解析,甚至包括图像生成功能。尤为关键的是,它们不仅具备判断何时使用何种工具的能力,还能精确规划工具的使用方式,从而以恰当的输出格式,在极短的时间内(如一分钟内)给出经过深思熟虑的详细答复,有效解决更为复杂的问题。这一特性意味着它们能够更高效地处理多层次、多步骤的问题,赋予ChatGPT“自主执行任务”的全新能力。

比例高达20%!英特尔被曝将启动史上最大规模裁员计划

4月23日,多家媒体披露,英特尔预计于本周正式宣布裁员计划,裁员比例将超过20%。此次调整为英特尔自1968年创立以来规模最大的一次组织变革,亦是新任CEO陈立武(Lip-Bu Tan)上任后主导的首轮重大战略重组。截至2024年底,英特尔全球员工总数为10.89万人,按20%比例计算,此次裁员规模将超过2.18万人。

近年来,英特尔因财务压力、市场竞争加剧及战略转型需求,频繁实施大规模裁员。2022年10月,为应对PC市场下滑,英特尔首次启动大规模业务收缩,全球裁员约1.2万人,占当时员工总数的5%。2023年5月,为推动业务向AI和先进制程聚焦,英特尔对CCG和DCAI部门实施结构性裁员,裁员比例约20%,同时削减10%的预算。2024年第二季度,因盈利未达预期,英特尔进一步扩大裁员规模至15%以上,涉及1.5万人。此次裁员后,英特尔员工规模将回退至2010年的水平。

2

产品动态

Runway惊艳发布AI视频生成模型Gen-4

备受瞩目的AI研究公司Runway近日隆重推出其下一代人工智能模型系列——RunwayGen-4。本次发布的Gen-4模型专注于媒体生成和世界一致性,旨在为用户带来前所未有的创作自由和控制力。其中,最引人瞩目的功能便是其能够精确地生成并保持角色、场景和物体在不同镜头中的高度一致性。

DeepSeek“开源周”技术落地,元脑企智一体机R1超10404Tokens/s

浪潮信息元脑企智DeepSeek一体机近日完成重大升级,通过多重优化策略,元脑企智EPAI平台实现与DeepSeek“开源周”技术的深入融合,显著提升大模型推理运行性能。在饱和压力测试场景下,元脑DeepSeek一体机单机运行R1的峰值吞吐性能超越10404 tokens/s,通常应用场景下每用户R1推理性能平均提升50%,极大地提升了元脑一体机的服务支撑能力和实际使用体验。

元脑企智DeepSeek一体机是浪潮信息推出的面向企业级大模型私有化部署的软硬件集成解决方案。一体机基于元脑推理服务器,集成元脑企智EPAI企业大模型开发平台,兼容和适配多种深度学习框架和算力芯片。自发布以来,元脑企智DeepSeek一体机持续结合业界先进的计算方案,迭代优化计算性能。本次更新全面升级了EPAI开发平台的DeepSeek推理引擎,结合芯片架构特点,对多头潜在注意力机制(MLA)和矩阵乘(GEMM)进行了深度优化,并成功融合DeepSeek在2月份“开源周”发布的核心技术成果FlashMLA和DeepGEMM。通过异步数据传输和多级流水线编排、共享内存分配优化、精细缓存管理等策略,系统计算能力得到显著提升。

超稳定!飞桨框架3.0正式版发布

4月1日,百度发布飞桨框架3.0正式版!五大特性专为大模型设计。作为大模型时代的Infra“基础设施”,深度学习框架的重要性愈发凸显,大模型训练、推理等任务都离不开深度学习框架的优化与支撑。飞桨框架3.0,从设计理念上实现了从底层硬件适配到顶层开发体验的全面进化,在训练效率、性能、兼容性等关键指标上建立了新标杆。

可灵AI 2.0登场!快手放下狠话“世界上最强大的视觉生成模型”

4月15日,快手旗下的可灵AI正式揭晓了其基座模型的重大升级,隆重推出可灵2.0视频生成模型与可图2.0图像生成模型,这一举措标志着AI技术领域又迎来了一次里程碑式的进步。此次升级不仅显著增强了模型的语义理解能力与动态效果,还大幅提升了画面的细腻度与质感,将可灵AI推至行业发展的潮头,在视频创作与图像生成领域彰显出前所未有的技术引领优势。

上海人工智能实验室推出升级版多模态大模型“书生万象 3.0”

在人工智能迅速发展的今天,上海人工智能实验室再次引领潮流,推出了全新的多模态大模型“书生・万象3.0”。这一升级版本不仅在技术上进行了全面提升,还在多模态预训练和后训练方法的加持下,展现出了更强大的基础能力和应用潜力。

“书生・万象3.0” 具备同时处理文本和多种多模态输入的能力,这使得它在多个应用场景中都能表现出色。例如,在GUI智能体、建筑图纸理解和空间推理等方面,该模型的表现都相当领先。这样的功能无疑为设计师、工程师以及各种需要视觉与文本结合的工作带来了新的机遇。

火山引擎发布豆包1.5深度思考模型:结合视觉理解与智能项目管理

在近日举行的火山引擎FORCE LINK AI创新巡展上,火山引擎总裁谭待正式公布了豆包1.5深度思考模型,标志着这一创新技术将正式面向企业提供服务。豆包1.5不仅在基础功能上进行了升级,还引入了更多智能化的应用场景,助力企业实现更高效的数字化转型。

谭待在发布会上表示,豆包1.5深度思考模型能够结合视觉理解,提供更多创新功能。例如,该模型能够根据用户上传的照片进行地貌分析,帮助旅行者在外出时更方便地选择餐饮,并可辅助企业进行项目管理和流程图的生成,大大提升了工作效率和决策质量。

谷歌发布Gemma 3 QAT模型:一张3090显卡也能轻松驾驭

谷歌近期推出Gemma3系列全新版本,此消息令众多AI爱好者振奋不已。上线仅一个月后,谷歌便发布经量化感知训练(QAT)优化的Gemma3,旨在大幅降低内存需求的同时保持模型高质量。

具体而言,经QAT优化的Gemma327B模型显存需求从54GB大幅降至14.1GB,意味着用户如今可在NVIDIA RTX3090等消费级GPU上本地运行这一大型模型。简单测试表明,配备RTX3070的机器也能运行Gemma3的12B版本,尽管其token输出速度稍慢,但整体性能仍在可接受范围内。

全国产算力深度推理模型讯飞星火X1升级:4张华为910B即可部署满血版,重新定义国产AI技术标杆

4月20日,科大讯飞旗下的深度推理大模型——讯飞星火X1,正式宣布完成全新升级。作为当前业界中唯一一款基于全国产算力进行训练的深度推理大模型,升级后的星火X1在多个通用任务领域均取得了显著的性能提升。具体而言,该模型在数学计算、代码编写、逻辑推理、文本生成、语言理解以及知识问答等任务上的表现均有了大幅提升。

尤为值得一提的是,在模型参数规模较业界同类模型缩小一个数量级的情况下,星火X1的整体性能已经能够与OpenAI的o1模型以及DeepSeek的R1模型相媲美。这一成果再次印证了基于国产算力训练的全栈自主可控大模型不仅具备登顶业界最高水平的实力,更展现出持续创新的巨大潜力。

腾讯混元3D生成模型正式发布2.5版本 建模精细度大幅提升

4月23日,腾讯混元3D生成模型正式发布2.5版本,标志着3D生成技术迈入超高清时代。此次升级不仅在建模精细度上实现了质的飞跃,还为用户带来了更高效、更便捷的创作体验,同时进一步降低了3D内容创作的门槛。

在技术层面,混元3D v2.5版本的建模精细度大幅提升,有效几何分辨率达到1024,从标清升级到了高清画质。模型架构也实现了全面升级,总参数量从1B提升至10B,有效面片数增加超10倍。这一改进使得生成的3D模型表面更平整、边缘更锐利、细节更丰富,极大地提升了模型的真实感和质感。此外,混元3D v2.5还支持4K高清纹理和细粒度bump凹凸贴图,能够模拟物体表面高低起伏的视觉效果,并率先实现多视图输入生成PBR模型,让物体的光影、反射等效果更接近现实。

此次升级不仅在技术上取得了突破,还为用户带来了实实在在的福利。混元3D AI创作引擎全面更新至v2.5模型底座,同时免费生成额度翻倍,提升至每天20次。这一举措将吸引更多创作者尝试和使用混元3D生成模型,进一步推动3D内容创作的普及。此外,混元3D生成API也已正式上线腾讯云,面向企业和开发者开放,为企业级应用提供了强大的技术支持。

商汤“日日新V6”硬核发布:多模态推理天花板落地,重新定义AI“百姓日用”

在全球AI竞速的2025年,大模型竞争早已从“参数比拼”转向“能力落地”。4月10日,商汤科技以一场“多模态星球”发布会抛出震撼弹——“日日新SenseNova V6”大模型体系正式登场,以“最强多模态推理”为锚点,在技术精度、应用广度、成本效率三大维度同步破局,将“AI服务千行百业”的愿景推向新高度。

Qwen3开源引AI变革,芯片厂商协同推动技术进阶

2025年4月29日,阿里云正式发布并开源通义千问Qwen3系列大型语言模型,这一举措在人工智能领域引发广泛关注。Qwen3作为Qwen系列的最新一代模型,提供了一系列密集型和混合专家(MoE)模型,涵盖8款“混合推理模型”,包括两款MoE模型(Qwen3-235B-A22B、Qwen3-30B-A3B)以及六个Dense模型(Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B、Qwen3-0.6B),参数规模从0.6B至235B不等,能满足多样化的应用需求。

3

政策发布

IDC:到2028年中国人工智能投资将突破1000亿美元

国际数据公司(IDC)发布了《全球人工智能和生成式人工智能支出指南》,预计到2028年,中国人工智能总投资将突破1000亿美元,年均复合增长率达到35.2%。
根据IDC的数据显示,2024年全球人工智能IT总投资预计为3158亿美元,至2028年将增至8159亿美元,年均复合增长率为32.9%。而在生成式AI方面,全球市场将在未来五年内以63.8% 的速度增长,到2028年市场规模将达到2842亿美元,占到整体 AI 市场投资的35%。

斯坦福发布《2025年人工智能指数报告》:全球AI竞赛白热化,“中国式突围”能否持续?

2025年4月8日,斯坦福大学以人为本人工智能研究院(HAI)发布的《2025年人工智能指数报告》(以下简称“报告”)引发全球关注。这份长达456页的年度报告,以详实数据揭示了人工智能领域的关键趋势:中美AI竞争从“量”到“质”的格局转变、开源模型的崛起、硬件效率跃升引发的成本革命,以及AI技术对社会经济的深度渗透。

国际数据公司(IDC)发布《中国公有云大模型服务市场格局分析,1Q25》报告

在当今数字化与智能化飞速发展的时代,大模型与生成式AI市场正以前所未有的态势迅猛演进。国际数据公司(IDC)发布的《中国公有云大模型服务市场格局分析,1Q25》报告显示,2024年中国公有云上大模型调用量达114.2万亿Tokens(不包含出海群体使用的MaaS平台的调用量,也不包含各大模型APP上的调用量),这一数据直观地反映出市场对大模型调用的强劲需求,也预示着云计算提供大模型调用服务市场已然进入一个全新的发展阶段。

4

会议活动

从“云”到“智”:中国移动如何重塑算力生态?——2025中国移动云智算大会观察

4月10日至11日,2025中国移动云智算大会以“由云向智,共绘算网新生态”为主题,汇聚全球科技巨头、学术领袖及生态伙伴,全面展现了中国移动从“云服务商”向“智算生态构建者”的跃迁之路。这场大会不仅是一次技术成果的展示,更透露出中国在AI时代争夺全球算力话语权的战略野心。大会期间,中国移动与业内外专家院士、行业大咖齐聚一堂,探讨云计算技术和智算、AI技术融合发展的新趋势与新挑战,共话智能时代未来发展,持续发挥“科技引领、应用示范、产业赋能”作用。

智聚申城模塑未来:多方协同,共推智能化普及

近日,“智聚申城 模塑未来”主题活动暨“昇腾新动力DeepSeek新纪元”媒体沙龙于上海超级计算中心成功举行。活动吸引了上海市政产学研用等多领域的精英齐聚,共同聚焦智能化时代的关键议题。

阿里云AI势能大会:全栈技术革新与生态共筑,开启企业级AI“繁花时代”

2025年4月9日,阿里云AI势能大会在北京召开,这场聚焦“AI加速企业生产力变革”的盛会,不仅展示了阿里云在AI技术、算力基础设施及行业应用的全面突破,更释放出中国AI生态从技术自研迈向规模化落地的关键信号。

此次大会的爆点不仅在于技术参数的升级,更在于阿里云通过“开源开放+生态共建”的双轮驱动,为企业级AI的普惠化铺平道路。“大模型的社会价值正在企业市场释放,阿里云将坚定投入,打造全栈领先的技术,持续开源开放,为AI应用提速。”阿里云智能集团资深副总裁、公共云事业部总裁刘伟光表示。

人形机器人都跑上马拉松了,天工Ultra荣获冠军!

4月19日,北京亦庄半程马拉松赛事迎来创新之举——人形机器人半程马拉松开赛。来自北京、上海、广东等全国多地的20支顶尖机器人队伍齐聚赛道,展开了一场别开生面的“赛马”对决。这些机器人以先进的人形本体为依托,搭载智能人工智能系统,与人类选手并肩起跑,共同奔跑,生动展现了科技与体育的深度融合。经过激烈角逐,来自北京的“天工”机器人脱颖而出,荣获冠军。

“存力觉醒,AI未来”——2025全球闪存峰会定档南京

2025年7月9日,由DOIT传媒主办的以“存力觉醒,AI未来”为主题的2025全球闪存峰会(Flash Memory World 2025,简称FMW 2025)即将在南京金陵饭店隆重举办。闪存峰会已连续举办十一届,是国内专注于闪存领域的专业大会。

FMW 2025将汇聚全球存储产业链上下游的技术专家、生态合作伙伴和企业用户,围绕从闪存芯片到存储系统展开深入探讨,全面呈现AI时代数据存储技术的最新技术发展与应用趋势。

FMW 2025 上午的主论坛将有多位重磅嘉宾登台,聚焦AI对存储架构提出的新挑战,分享他们对大模型时代存储演进方向的深度洞察,帮助企业把握AI浪潮下的新机遇与新增长点。

当天下午将设置六大论坛,涵盖AI智能体与行业应用论坛、存储技术创新论坛、CXL技术应用论坛、存储接口与控制器技术论坛、闪存技术学术论坛以及闪存行业应用论坛,深入探讨闪存在AI驱动下的技术突破与多场景落地。

超聚变探索者大会2025:聚焦智算,开启智能体时代新篇

4月16日,超聚变探索者大会2025于郑州国际会展中心盛大举行。此次大会以“共建智能体时代”为主题,吸引了行业领袖、政府领导、专家学者、研究机构、企业高管以及产业伙伴等数千位嘉宾齐聚一堂,围绕AI、数据、算力和能源等前沿技术趋势展开深入探讨,全方位呈现了智能体时代的发展愿景与产业布局。

百度Create 2025爆点不断:大模型 “降价提速”,AI应用全面开花!

4月25日的Create 2025百度AI开发者大会,无疑成为了AI领域的焦点。百度创始人李彦宏携多款重磅AI新品亮相,从性能卓越且成本降低的文心大模型,到覆盖多领域的创新AI应用,再到助力开发者的一系列举措,这场大会处处彰显着百度在AI赛道的深耕与野心