导读
在这个数字洪流激荡、创新浪潮翻涌的新时代,算力不仅是衡量一个国家科技版图上璀璨星辰的亮度标尺,更是驱动数字经济巨轮破浪前行的澎湃引擎。

本月刊是精心策划的专栏,为您缓缓展开2025年8月份以来算力世界以及人工智能领域的精彩篇章,涵盖公司新闻、产品动态、政策发布与会议活动四大板块。
文字编辑|李祥敬
01
公司新闻
华为宣布CANN全面开源开放,共建昇腾生态
近日,昇腾计算产业发展峰会在北京召开。来自AI领军企业、伙伴、高校与科研机构的代表共同探讨了如何更好地构建开源开放的昇腾生态,加速AI创新和发展。
华为轮值董事长徐直军在主题演讲中强调:华为AI战略的核心是算力,并坚持昇腾硬件变现。徐直军在会上宣布华为昇腾硬件使能CANN全面开源开放,Mind系列应用使能套件及工具链全面开源,支持用户自主的深度挖潜和自定义开发,加速广大开发者的创新步伐,让昇腾更好用、更易用。
与会代表和华为共同发起了《CANN开源开放生态共建倡议》,以凝聚产业力量,共探AI边界,共建昇腾生态。
ChatGPT用户数暴涨至7亿创纪录新高,OpenAI年化收入飙升至120亿美元
OpenAI正在经历前所未有的爆炸式增长。该公司周一宣布,其旗舰产品ChatGPT的周活跃用户数已达到7亿,同比增长超过四倍,这一数字标志着AI应用领域的又一个重要里程碑。
ChatGPT的用户增长呈现出惊人的加速趋势。除了周活跃用户数的大幅攀升,其日均用户消息量也突破了30亿条大关。相比去年同期2.5倍的增长率,这一数据显示出用户活跃度的持续提升和对AI工具依赖程度的加深。
在商业化层面,OpenAI同样交出了亮眼的成绩单。其付费商业用户数量从今年6月的300万激增至500万,增长幅度超过66%。这一数据反映出企业和教育机构对AI工具的接受度正在快速提升,商业市场对于AI应用的需求呈现出强劲的增长态势。
谷歌DeepMind发布Genie 3:一句话生成可玩的3D世界!实时交互世界模型开启AGI新纪元
2025年8月6日,谷歌DeepMind正式发布Genie 3世界模型,首个支持实时交互的生成式环境引擎。它基于文本、图像或视频输入,以每秒24帧的速率创建长达数分钟的高保真动态世界。
相比前代Genie 2仅能维持10-20秒的360P画面,此次升级被英伟达科学家Jim Fan誉为 “游戏引擎2.0时代”的降临。
谷歌DeepMind Genie 3与Genie 2、由神经模型驱动的游戏引擎GameNGen、视频生成模型Veo对比,最突出的特点是其生成时长翻倍增长,且能做到针对已生成的环境修改。
百度智能云宣布推出全球首批AI数字员工
百度AI Day开放日上,百度智能云推出全球首批AI数字员工,覆盖营销经理、还款助理等核心业务职能。它们依托百度智能云AI全栈能力,融合大模型、数字人技术及行业经验,具备“懂业务、给结果、可进化”特性,能精准赋能垂直业务场景,成为企业可信赖的数字业务伙伴。
百度副总裁阮瑜称,大模型能力快速迭代,推动AI从Copilot向Agent形态跃迁,未来智能体将以“数字员工”形态参与企业运行,推动组织生产力变革。石峥表示,企业需要能扛KPI的Agent,百度智能云融合客悦智能客服与曦灵数字人技术,基于大模型Agent架构打造出国内首批AI数字员工,实现从功能执行到业务决策的质变。
在招聘行业,招聘顾问能实现外呼邀约等全流程闭环,面试参加率提升40%;教培行业,课程顾问可承接招生咨询等重复劳动,让教育顾问专注高价值转化,员工效率提升40%。目前,数字员工已应用于百度客服中心,实现7×24小时高效处理咨询,用户申保成功率提升60%、服务时效提升18h。石峥认为,人机协同是主流趋势,未来或实现多数字员工协同解决复杂任务。
从闭源到开源,OpenAI重磅推出gpt-oss-120b与20b,开发者狂欢!
OpenAI宣布推出两款开源权重语言模型——gpt-oss-120b和gpt-oss-20b,这是自2019年GPT-2发布以来,OpenAI首次回归开源领域。此举不仅标志着OpenAI战略的重大转向,也为全球AI开发者提供了强大的推理工具,加速AI技术的普及与创新。
根据OpenAI官方公告,gpt-oss-120b和gpt-oss-20b采用Apache2.0许可证发布,允许开发者自由下载、修改和用于商业用途。这两款模型分别是1170亿参数和210亿参数的混合专家(MoE)架构,分别激活51亿和36亿参数,兼顾高效推理与低资源消耗。
特斯拉解散Dojo超级计算机团队,放弃自研芯片转向英伟达合作
特斯拉正式解散其Dojo超级计算机项目团队,结束了这家电动汽车制造商在自动驾驶技术领域自主研发芯片的努力。据报道,这一决定标志着特斯拉AI战略的重大转向。
Dojo项目负责人Peter Bannon已经离开公司,剩余团队成员将被重新分配到特斯拉内部其他数据中心和计算项目中。这一变化是在约20名员工离职创立AI公司DensityAI之后发生的。
新成立的DensityAI由前Dojo负责人Ganesh Venkataramanan以及前特斯拉员工Bill Chang和Ben Floering共同创立,该公司正在开发面向机器人、AI代理和汽车应用的数据中心芯片、硬件和软件解决方案。
亚马逊推出全球最大AI模型平台Amazon Bedrock
在2023年AI行业激战正酣、各大公司竞相争夺“最强模型”称号之际,亚马逊云科技(AWS)却独辟蹊径,提出了“选择大于一切”的战略理念。该战略强调,在AI应用中,适合的模型才是至关重要的。为实现这一目标,亚马逊推出了AmazonBedrock平台,旨在为企业打造一个如同超市般便捷的AI模型选择环境。
这一新平台被业界誉为“模型超市”,它集成了多种AI模型,企业可根据自身需求和场景,灵活挑选最合适的解决方案。亚马逊深刻认识到,企业所追求的并非单一的最强大模型,而是能够适应不同场景的多元化模型组合。
风雪压“我”两三年,“我”比HBM还值钱
当AI模型参数突破万亿级,HBM已从“配件”升级为“算力核心”。华为8月12日发布的UCM技术以颠覆性架构撕开一道裂缝。
该成果聚焦通过算法优化、架构创新及软硬件协同,减少对HBM的依赖。HBM作为AI计算核心组件,长期受海外技术垄断和产能限制,华为的技术突破或缓解国内AI产业供应链压力,降低算力成本。
英伟达发布Cosmos Reason推动机器人智能化发展
在最近举行的SIGGRAPH国际计算机图形学和交互技术会议上英伟达展示了一系列针对机器人开发者的新技术,其中最引人注目的是其推出的开源物理AI模型——Cosmos Reason。该模型参数量达到70亿,旨在为机器人提供更高效的视觉推理能力。
英伟达指出,自从OpenAI推出CLIP模型以来,视觉语言模型在计算机视觉领域取得了显著进展,尤其是在物体识别和模式识别等任务中。然而,传统模型在面对复杂的多步骤任务时往往力不从心,特别是在处理模糊或新颖的现实情境时。Cosmos Reason凭借其卓越的记忆和理解能力,使机器人能够像人类一样进行推理,从而在现实世界中做出更加合理的行动决策。
马斯克与阿尔特曼的爱恨情仇开辟新战场,OpenAI杀入脑机接口大战!
随着GPT-5的发布,OpenAI在技术开发上面也陷入了瓶颈之中,但是阿尔特曼的动作从未停止,据《金融时报》报道,OpenAI及其联合创始人阿尔特曼正准备投资一家名为Merge Labs的创业公司,该公司的目标与伊隆・马斯克的Neuralink一致,都是连接人脑与计算机。
此外马斯克在社交平台发文称,苹果公司涉嫌通过限制措施,使除美国开放人工智能研究中心(OpenAI)外的任何人工智能公司都无法在其应用商店排行榜中登顶,称此为“明确的反垄断违规行为”。马斯克表示,其旗下xAI公司将立即采取法律行动。
两人的恩怨情仇因这两件事再度引爆!展开了一场技术空窗期下,“朴实无华的商业斗争”。
智谱视觉推理模型GLM-4.5V开源,全球100B级最佳视觉推理模型
智谱AI正式发布并开源新一代视觉推理模型GLM-4.5V,官方数据显示,其在41个公开视觉多模态基准测试中达到同级别开源模型SOTA性能。该模型已同步在GitHub、Hugging Face和魔搭社区开源,采用MIT开源协议,支持商业使用(项目地址:https://github.com/zai-org/GLM-V/)。
从技术架构上看,GLM-4.5V由视觉编码器、MLP适配器和语言解码器三部分构成。模型通过引入三维旋转位置编码(3D-RoPE),显著增强了对多模态信息中三维空间关系的感知和推理能力。同时,它支持64K tokens的多模态长上下文输入,并采用三维卷积来提升视频处理的效率。这些设计使得模型不仅能处理图像,也能理解视频内容,并对高分辨率以及极端宽高比的图像具有更强的处理能力和稳健性。
阿里达摩院宣布开源具身智能“三大件” 开源机器人上下文协议RynnRCP
在世界机器人大会上,阿里达摩院宣布开源三项自研核心技术:VLA模型RynnVLA-001-7B、世界理解模型RynnEC及机器人上下文协议RynnRCP,旨在推动数据、模型与机器人本体的兼容适配,打通具身智能开发流程。
具身智能领域发展迅速,但面临开发碎片化、适配困难等挑战。达摩院引入MCP理念,提出并开源RCP,推动不同数据、模型与本体无缝对接。其打造的RynnRCP是完整机器人服务协议和框架,已支持多款热门模型和机械臂,支持范围持续扩展。
昇腾+SGLang强强联手!大模型推理“狂飙”低延迟时代
2025年8月,经过SGLang社区与昇腾的共同努力,将SGLang的灵活编程框架与昇腾强大的异构算力深度融合,使能SGLang在昇腾上无缝运行大模型推理,并正式面向用户推出基于SGLang的大EP集群推理解决方案。当前用户可获取最新release版本的SGLang以体验低延迟、高吞吐的推理系统。
IDC报告:2024年中国AI公有云服务市场规模激增,阿里云蝉联中国市场第一
根据IDC最新发布的《中国AIP公有云服务市场份额,2024:全面向生成式AI演进》报告,2024年中国AIP公有云服务市场规模预计将达到195.9亿元人民币,较2023年增长55.3%。这一增长主要得益于生成式AI应用的不断拓展以及机器学习需求的显著提升,推动了云服务市场的迅猛发展。
在各个细分市场中,计算机视觉公有云服务市场表现尤为突出,2024年市场规模预计达到81.0亿元,同比增长33.7%。在这一领域,腾讯云和百度智能云分别占据市场第一和第二的位置,充分展现了它们在技术和应用方面的优势。
与此同时,对话式AI公有云服务市场也呈现出强劲的增长态势,2024年市场规模预计为20.9亿元,较2023年增长39.5%。在这一市场中,阿里云和百度智能云同样位列前两名,彰显了它们在智能交互领域的强大竞争力。
《黑神话:钟馗》即将来袭:国产3A巨制如何再次挑战算力极限?
2025年8月20日,游戏科学(Game Science)创始人冯骥与美术总监杨奇通过社交媒体宣布,团队将暂时延缓《黑神话:悟空》的DLC开发,转而将精力投入到一款名为《黑神话:钟馗》的新作中 。这一消息迅速引爆了游戏圈。
《黑神话:钟馗》的曝光预示着国产3A游戏将再次挑战计算机算力的极限。基于前作《黑神话:悟空》所树立的高技术壁垒,新作有望在图形渲染、物理模拟和世界构建等多个维度实现技术飞跃。这不仅意味着更精细的光线追踪、更复杂的物理算法(如物质点法MPM)和更庞大的无缝开放世界,也预示着对玩家PC硬件,特别是GPU的并行计算能力、CPU的逻辑处理能力和高速存储设备,将提出前所未有的严苛要求。这场由软件创新驱动的硬件“军备竞赛”,将推动游戏产业与硬件厂商进行更深度的协同,共同定义下一代游戏的技术标准。
拿Money“铺出一条AI路”:软银豪赌AI全产业链,孙正义的“人工超级智能”野心
2025年,软银集团以资本为杠杆,在全球AI算力产业链掀起了一场前所未有的投资风暴。其创始人孙正义以“人工超级智能(ASI)”为终极目标,通过一系列横跨芯片设计、制造、数据中心和AI应用的垂直整合投资,构建一个由软银主导的AI全产业链生态。这场豪赌的核心在于,软银不再满足于作为财务投资者,而是要成为AI时代的“行业组织者”,通过控制从底层硬件到顶层应用的全链条,在未来的技术竞争中占据绝对主导地位。
智元机器人以全链条布局加速具身智能商用落地
2025年8月21日,智元机器人首届合作伙伴大会在上海举行,主题为“与智同行 共启新元”。大会通过战略发布、场景化解决方案展示和机器人体验,展现了智元在“产品、技术、商业、生态、资本、团队”的全链条布局。依托“一体三智”架构与全系列产品矩阵,智元与合作伙伴携手,加快具身智能商业化进程,推动产业从“技术探索”迈向“规模商用”。
“先进存力AI推理工作组”成立,共同推进AI普惠千行百业
2025中国算力大会上,由中国信息通信研究院联合华为数据存储、科大讯飞、浪潮、曙光、沐曦、清微智能、中国移动、中国电信、中国联通等企业共同成立的“先进存力AI推理工作组”。该工作组旨在推动AI推理领域的“存算协同、生态共建”,标志着我国AI推理产业进入新阶段。华为数据存储产品线战略与业务发展部总裁王旭东参与了成立仪式。
在代理AI和物理AI推动下,全球芯片市场预计将突破1万亿美元大关
根据分析公司Counterpoint Research发布的一份新报告,人工智能的迅速发展正推动全球半导体市场迎来前所未有的增长。该报告预测,随着代理AI和物理AI的兴起,全球芯片市场的收入预计将在未来数年内突破1万亿美元。这一数字几乎是当前市场规模的两倍,预计到2024年,市场收入将达到6560亿美元。
连续亏损近十年!营收今年增长43倍,“中国小英伟达” 寒武纪的逆袭之路
一家连续亏损八年、累计亏损近50亿元的企业,却在2025年夏季创下股价千元、市值5500亿的神话,寒武纪的狂飙突进堪称中国AI芯片领域最具争议性的现象。
2025年8月26日,寒武纪交出了一份令人瞠目的半年报:营收28.81亿元,同比增长4347.82%;净利润10.38亿元,成功扭亏为盈。这份财报背后,是这家被誉为“中国英伟达”的AI芯片公司从濒临绝境到绝地重生的疯狂逆转。
IBM与AMD“联姻”冲刺量子计算,重新定义计算的未来,打造AI新生态
全球科技产业正面临一道日益扩大的“算力鸿沟”,一边是暴涨的人工智能与数字化转型需求,另一边是传统计算架构性能增长的放缓。在这场算力竞赛中,IBM与AMD的强强联合试图开辟一条全新路径。
老牌美国科技巨头IBM与AI算力芯片全球排名第二的AMD发布公告,宣布将共同开发被称为“量子中心超级计算”(quantum-centric supercomputing)的下一代计算架构,并豪言此举或将“重新定义计算的未来”。
这一被称为“量子中心化超级计算”的新型架构,旨在突破传统计算的性能极限,为复杂AI工作负载提供前所未有的处理能力。
马斯克从不缺席AI趋势!xAI入局AI编程,主打“快速且经济”,还限时7天免费薅羊毛!
埃隆·马斯克旗下人工智能公司xAI正式进军AI编程领域,推出全新智能代码生成模型Grok Code Fast 1。这款主打“快速且经济”的编程模型,正在掀起AI辅助编程的效率革命。
据悉,Grok Code Fast 1将在包括Cursor、GitHub Copilot、Cline、opencode、Windsurf、Roo Code和Kilo Code在内的主流智能编程平台上限时免费开放。
另据xAI方面表示,该模型的“核心优势在于以经济实惠的精简架构实现强劲性能,使其成为快速、低成本处理常见编码任务的灵活之选”。
百度未来五年计划培养1000万AI人才
近日,国务院常务会议审议通过了《关于深入实施 “人工智能 +” 行动的意见》,为中国人工智能技术与产业的深度融合以及规模化商业应用指明了方向。百度副总裁石清华表示,《意见》的出台标志着中国在人工智能领域迈入全面融合、深化应用的新阶段。
作为国内领先的人工智能公司,百度在过去十年中已累计投入超过1800亿元人民币用于研发。此前,百度已经提前完成了培养500万AI人才的目标,并在此基础上,宣布未来五年将再培养1000万AI人才。这个计划不仅体现了百度对人工智能人才培养的重视,也显示出其推动行业发展的决心。
02
产品动态
Qwen3卷王名正实归,又又又开源新模型了!Qwen3-Coder-Flash,33GB内存跑出GPT-4级生产力
2025年8月1日,阿里巴巴通义千问团队正式开源Qwen3-Coder-Flash(全称Qwen3-Coder-30B-A3B-Instruct),这款被开发者社区称为“甜品级”的编程模型在性能与效率的平衡木上完成了一次漂亮的后空翻。
它采用30.5亿参数MoE架构,却只需激活其中3.3亿参数,如同一个精密的神经网络开关系统,在保证强大智能的同时实现了惊人的运行效率。
阶跃星辰最新一代基础大模型Step3正式开源
阶跃星辰团队推出新一代开源基础大模型Step3,专为企业和开发者平衡性能与成本设计,适配推理时代应用场景,可在Github等平台下载。
该模型采用MoE架构,参数规模庞大,具备出色的视觉感知与复杂推理能力,能处理跨领域知识理解等任务。经MFA和AFD优化,推理效率显著提升,同时开源的StepMesh通信库提供跨硬件部署支持。
核心结构上,Step3运用自研MFA注意力机制,降低资源消耗,实现高效推理,可在特定显卡配置下完成大吞吐量任务。多模态处理通过优化视觉编码器减少计算量,提升效率。训练过程分阶段进行,结合多样语料与清洗策略,增强模型性能。
系统架构方面,Step3重构解码流程,采用高性能AFD方案与多级流水线调度,提升吞吐效率。StepMesh通信库保障跨卡高效传输,适配多种硬件。实测性能优于同类模型,特定场景下增益显著。
中文乱码成历史!阿里通义千问开源Qwen-Image,AI生图迎来文本精准时代
8月5日凌晨,阿里巴巴通义千问团队宣布开源其首个图像生成基础模型Qwen-Image,这一基于20亿参数的多模态扩散变换器(MMDiT)模型在复杂文本渲染和精确图像编辑领域实现重大突破。
重磅升级!Claude Opus4.1横空出世,编程能力直冲74.5%新高
人工智能公司Anthropic正式发布其旗舰模型Claude Opus4的升级版——Claude Opus4.1。此次更新旨在全面提升模型的agentic任务、真实世界编程和推理能力,尤其是在编程和数据分析方面的表现引人注目。
根据官方信息,Claude Opus4.1的最大亮点在于其惊人的编程性能提升。在SWE-bench Verified编程评测中,其表现高达74.5%,这一成绩显示了其在处理复杂代码问题上的强大实力。GitHub的反馈也印证了这一点,开发者们普遍认为Opus4.1在多文件代码重构等任务上表现优于其前身。此外,日本电商巨头Rakuten Group也指出,新模型能够更精准地定位大型代码库中的错误,有效减少不必要的更改和潜在bug。
小红书发布开源多模态大模型dots.vlm1,以NaViT视觉编码器领跑行业
小红书Hi Lab近日发布并开源首个自研多模态大模型dots.vlm1。该模型以12亿参数的NaViT视觉编码器和DeepSeek V3大语言模型为基础,从零开始完整训练,在多模态视觉理解与推理能力上表现卓越,性能已接近当前领先的闭源模型Gemini2.5Pro和Seed-VL1.5,标志着开源多模态模型性能迈上新台阶。
dots.vlm1的核心优势在于其原生自研的NaViT视觉编码器。不同于传统基于成熟模型微调的方式,NaViT从零训练且支持动态分辨率,能更好地适应多样化的真实图像场景。该模型结合纯视觉与文本视觉双重监督,极大提升了泛化能力,处理表格、图表、公式、文档等非典型结构化图片时表现尤为出色。
阿里新发布Qwen3-4B模型:小巧强劲,手机也能跑AI!
阿里巴巴通义千问团队推出全新Qwen3-4B系列模型,包括Qwen3-4B-Instruct-2507和Qwen3-4B-Thinking-2507两个版本。这一发布标志着小型语言模型(SLM)技术的重要突破,为移动端AI应用开辟了新的发展路径。
新发布的模型最大特色在于实现了性能与体积的平衡优化。尽管参数规模相对较小,但这些模型能够高效运行在智能手机等移动设备上,有效解决了传统大模型对硬件资源的高依赖问题。
在技术规格方面,Qwen3-4B-Instruct-2507在通用能力上取得显著进展。该模型具备更强的指令理解和执行能力,响应速度明显提升,特别适用于内容创作和工具调用等实际应用场景。值得注意的是,模型的上下文处理能力已扩展至256K,使其能够处理长文本任务,这在同规模模型中表现突出。
MiniMax Speech 2.5语音生成模型上线:多语种表现力更强
MiniMax宣布推出新一代语音生成模型Speech2.5,这一升级版模型在全球语音技术领域再次树立了新的标杆,进一步巩固了其作为全球最强语音模型的地位。Speech2.5在多语种表现力、音色复刻以及语种覆盖范围等方面均实现了显著提升。
与今年5月发布的Speech02相比,Speech2.5在多语种表现力上取得了飞跃性进步,尤其在中文方面继续保持全球最强水平,同时英文及其他多语种的表现也得到了全面提升。该模型在字错率、相似度和自然韵律度等方面均超越了前代产品,用户可以在40种语言之间轻松切换,无论是商务会议、日常对话还是英文播客,都能提供更加自然流畅的语音体验,彻底摆脱了以往语音合成中常见的“机械感”。
一文带您了解GPT-5,OpenAI数据狂飙背后,却揭露了AI脚步放缓的残酷现实
今年,OpenAI备受大众瞩目的重磅产品终于登场。北京时间8月8日凌晨一点,OpenAI正式对外宣布,推出新一代旗舰级人工智能(AI)模型——GPT-5。这款模型堪称OpenAI首个“一体化”的AI系统,它创新性地将o系列模型的强大推理能力与GPT系列模型的快速响应特性完美融合。
但万众瞩目下GPT-5的升级远远没达到大众的预期,尽管奥特曼宣称GPT-5是“迈向AGI的关键一步”,实际却没有什么颠覆性的改变。其改进幅度无法媲美GPT-3到GPT-4的飞跃。而这恰恰折射出数据狂飙背后,本质问题渐渐浮现。
马斯克旗下xAI宣布Grok 4 AI模型永久免费开放
xAI公司宣布了一个震惊全球的消息:Grok4人工智能模型将对全球所有用户永久免费开放。这一决定标志着xAI在人工智能领域迈出了重要一步,为全球用户提供了一个无需支付费用即可使用的先进AI工具。
Grok4的免费开放不是试用,也不是限时优惠,而是真正的永久免费。xAI为用户提供了两种使用模式:Auto模式和Expert模式。在Auto模式下,系统会根据用户问题的复杂度自动判断是否需要使用Grok4进行高级推理。如果用户想要更多的控制权,可以随时切换到Expert模式,让每个查询都通过Grok4处理。
智元机器人发布机器人世界模型开源平台——Genie Envisioner
智元机器人在上海宣布推出面向真实世界机器人操控的统一世界模型平台——Genie Envisioner(GE)。这一创新平台突破了传统机器人学习系统分阶段开发的模式,将未来帧预测、策略学习与仿真评估整合进以视频生成为核心的闭环架构,实现了机器人从“看”到“想”再到“动”的端到端推理与执行。基于约3000小时的真实机器人操控视频数据,GE在跨平台泛化和长时序任务执行上展现出显著优势,为具身智能发展开辟了从视觉理解到动作执行的全新技术路径。
GE的核心突破在于构建了基于世界模型的视觉中心建模范式。与主流的视觉-语言-行动(VLA)方法不同,GE直接在视觉空间中建模机器人与环境的交互动态,完整保留了操控过程中的空间结构和时序演化信息。这种建模范式不仅赋予了GE高效的跨本体泛化能力,使其能够在极少量数据下实现跨平台迁移,还在长时序任务的精确执行能力上展现出巨大优势。例如,在折叠纸盒等超长步骤任务中,GE-Act的成功率远超现有顶尖方法。
PS技术哪家强?阿里通义来帮忙,Qwen-Image-Edit,AI图像编辑神器!
中文海报中的细小文字精准替换、书法作品逐字修正、品牌IP角色多风格转换,这些曾让专业设计师耗费数小时的操作,如今通过一句指令即可完成。
8月19日凌晨,阿里通义千问团队开源了其最新图像编辑模型Qwen-Image-Edit,这是继月初发布Qwen-Image后,在多模态AI领域的又一重磅突破。该模型基于200亿参数的Qwen-Image进一步训练,首次实现了语义控制与外观编辑的双重能力。
在数字内容爆发式增长的时代,Qwen-Image-Edit的诞生标志着AI图像处理从生成向精准编辑演进的关键转折。它不仅继承了Qwen-Image在中文文本渲染上的优势,更将这一能力扩展至编辑领域。
DeepSeek V3.1正式发布:长文档分析、代码理解能力大幅增强
8月19日晚间DeepSeek官方宣布线上模型版本已升级至V3.1,其最显著的改进是上下文长度拓展至128K,相当于可处理10万至13万汉字的超长文本,这一特性使其适用于长文档分析、代码库理解及多轮对话场景。
智谱AutoGLM上线:给每个手机都装上通用Agent
8月20日,智谱宣布发布全球首个手机Agent——AutoGLM 2.0,由国产模型GLM-4.5与GLM-4.5V驱动,具备推理、代码和多模态处理能力,能够在多种设备和场景中运行,帮助用户执行操作。
DeepSeek安利的“UE8M0 FP8”:下一代国产算力标准?
“UE8M0 FP8是针对即将发布的下一代国产芯片设计。”在DeepSeek-V3.1发布文章的置顶评论中,这句简短的技术说明迅速在AI圈引发热议。
这不仅仅是一次模型升级,更是中国AI算力自主化道路上的重要里程碑。DeepSeek此次的技术选择,首次从软件层面反向定义国产芯片标准,为摆脱对外部算力的依赖提供了关键支撑。
如果把AI产业比作一条高速公路,过去三十年我们擅长把路修宽(扩大算力规模),却一直在用别国设计的“车道宽度”(FP32/FP16/BF16 等国际标准)。DeepSeek这一次把车道缩到8bit,却通过UE8M0把动态范围放大32倍,等于在原有路基上凭空多修了两条应急车道——不增加制造成本,却让国产芯片第一次能把大模型“开”得又快又稳。
马斯克xAI开源Grok 2.5:Grok 3将于半年后开源
近日,埃隆·马斯克在社交平台X上宣布,其人工智能公司xAI已正式开源Grok2.5模型,向公众开放了该模型的源代码。这一举措是马斯克推动技术开放理念的又一具体实践,也为人工智能领域的发展开辟了新的路径。
黄仁勋给机器人送“礼物”了!英伟达Jetson Thor掀起物理AI的浪潮
英伟达为机器人打造的“新大脑”Jetson Thor正式发售,性能飙升7.5倍,能耗却仅为130瓦,宇树、优必选等中国厂商已抢先采用,2万多元的售价背后是中国市场对高性能AI芯片的迫切需求。
北京时间8月25日晚,英伟达宣布其专为机器人及自动驾驶计算平台设计的系统级芯片Thor正式量产上市。
这款基于Blackwell架构的芯片,被誉为“机器人的新大脑”,单颗AI算力在FP8标准下达到1035TFLOPS,在FP4标准下更是高达2070TFLOPS,性能是上一代Orin的7.5倍,能效比提升3.5倍。
03
政策发布
宇树科技王兴兴获聘首席科学家,杭州布局具身智能新高地
8月4日,杭州高新区(滨江)举办人工智能产业创新高地建设推进大会,正式启动了杭州具身智能应用中试基地。在此次大会上,备受瞩目的机器人公司宇树科技的CEO王兴兴被授予首席科学家聘书,将主导该基地的技术与科研方向。
该中试基地旨在打通科研成果与产业化之间的“最后一公里”,它将建设包括能力供给中心、模型训练中心、场景验证中心和测试认证中心在内的四大核心功能区。通过这一系列布局,杭州高新区希望形成“算力+数据+模型+场景应用”的完整链条,培育新质生产力,最终打造一个具有全国示范效应的具身智能全体系高地。
为确保具身智能产业的快速发展,杭州高新区推出了多项强有力的支持政策。
在数据要素方面,政府将提供每年高达5000万元的“语料券”,并为企业年度基础设施使用费用提供最高50% 的补助,以鼓励企业在人工智能大模型研发和应用中利用数据资源。
在算力要素方面,高新区每年将安排最高1亿元的“算力券”,为企业的算力使用费用提供最高60% 的补助,旨在缓解企业在AI研发中对高算力的需求压力。
此外,大会还发布了涵盖生产制造、金融贸易、医疗健康等五大领域的人工智能典型场景需求,并启动了杭州数谷数据创新中心和浙江省人形机器人未来产业先导区的建设,进一步完善了杭州在人工智能领域的产业布局。
04
会议活动
2025世界机器人大会,千款机器人“打工”火出圈,其幕后英雄算力功不可没
北京亦庄,立秋后的雨水未能浇灭科技热情。2025世界机器人大会在雨中开幕。200余家企业、1500件展品、100多款全球首发新品汇聚于此,规模创历届之最。
与往届不同,今年展馆内少了些“花拳绣腿”,多了真实工作场景的轰鸣:优必选Walker S2在流水线上自主完成3分钟换电后立即重返工位;宇树R1机器人流畅完成咖啡拉花全套动作;星海图机器人正为观众现场铺床叠被。
随着2025年世界机器人大会正如火如荼地开展。其中,人形机器人的场景化应用落地进程显著加快——它们不再局限于“站桩”式的静态展示,而是积极投身于探索能够替代人类执行任务的实际场景与解决方案,其核心竞争力集中体现在“能否迅速胜任工作”上,目前工厂搬运等模拟应用场景已大量涌现。在探寻合适落地场景的过程中,“先上岗实践、再进入家庭服务”已成为推动机器人广泛普及的现实路径。
当钢铁之躯踏上运动赛道,具身智能“元年”还会带给我们哪些惊喜?
8月14日夜晚,全球范围内首个以人形机器人作为参赛核心的综合性体育盛事——“2025世界人形机器人运动会”,在北京的国家速滑馆“冰丝带”盛大启幕。此次盛会吸引了来自16个国家的280支精英参赛队伍汇聚京城。
在8月15日至17日这短短三天内,他们将围绕竞技赛、表演赛、场景赛及外围赛四大类共计26个精彩赛项,展开多达487场的激烈角逐,全方位展示了人形机器人在智能决策、运动协作等尖端科技领域的最新突破与成就。
此番盛会,是北京在成功举办“世界机器人大会”“人形机器人半程马拉松”等科技盛宴之后,再次以科技之名,向世界发出的璀璨邀请,让全球的目光再次聚焦于这座古老而又现代的城市,共同见证人形机器人时代的辉煌启航。
2025开放计算技术大会落幕 百度与浪潮信息荣膺开放计算最佳实践标杆
8月7日,2025开放计算技术大会在北京圆满落幕。这场由开放计算社区OCP及开放标准组织OCTC联合主办,以“开放变革:筑基、扩展、进化”为主题的行业盛会,汇聚了中国移动、字节跳动、阿里云、三星、浪潮信息、清华大学、百度等超千位知名学者、技术专家及企业代表,围绕计算、存储、网络、液冷等基础设施底层架构的技术创新,算法与算力系统、硬件和软件的协同创新,以及开放计算技术赋能人工智能热门应用等议题开放分享,成为全球AI数据中心领域的重要风向标。
大会期间,OCP Foundation特别公布了2025开放计算最佳创新代表、最佳实践标杆、最佳生态贡献企业名单,以激励在开放计算领域做出杰出贡献的企业。其中,浪潮信息与百度荣膺最佳实践标杆,凭借其在技术创新、标准构建及实践落地等方面的卓越表现,成为开放计算创新实践的典范。
鄂尔多斯聚“算”成势:WEC2025世界算力博览会成功举行
8月13日—16日,WEC2025世界算力博览会在鄂尔多斯国际会展中心成功举行,本届博览会由中国计算机学会、全国信标委算力标准工作组、北京并行科技股份有限公司、鄂尔多斯市高新技术产业投资有限责任公司联合发起,汇集71家厂商参展,创历年新高。
今年展会落地“东数西算” 工程关键节点城市——鄂尔多斯,首次实现 “算力技术” 与 “绿色能源” 的深度融合,吸引来自产学研用等业界人士及各行各业的技术爱好者的积极参与,集中展示算力产业前沿技术和创新成果,涵盖人工智能、算力、网络等重点领域。
看2025中国算力大会如何为算力产业链注入“新鲜血液”!这些关键信息,不要错过
8月23日,山西大同召开的2025中国算力大会主论坛上,工信部副部长熊继军宣布了一系列令人瞩目的数据:截至2025年6月底,我国在用算力中心标准机架达1085万架,智能算力规模达788 EFLOPS(每秒百亿亿次浮点运算),存力总规模超过1680EB。
这些数字背后是中国算力产业每年约30%的快速增长,尤其是智能算力需求呈现爆发式增长。2025中国算力大会的召开,明确了算力作为数字经济时代核心生产力的战略地位,并从政策、技术、生态等多方面深刻影响了算力产业链的各个环节。