导读
2025年4月9日,阿里云AI势能大会在北京召开,这场聚焦“AI加速企业生产力变革”的盛会,不仅展示了阿里云在AI技术、算力基础设施及行业应用的全面突破,更释放出中国AI生态从技术自研迈向规模化落地的关键信号。
此次大会的爆点不仅在于技术参数的升级,更在于阿里云通过“开源开放+生态共建”的双轮驱动,为企业级AI的普惠化铺平道路。“大模型的社会价值正在企业市场释放,阿里云将坚定投入,打造全栈领先的技术,持续开源开放,为AI应用提速。”阿里云智能集团资深副总裁、公共云事业部总裁刘伟光表示。
文字编辑| 宋雨涵
1
北京市政府助力AI行业发展
北京“人工智能+”新方案亮相
北京市政府副秘书长杨烁在大会上分享了北京市在人工智能领域的显著成就。目前,北京市人工智能企业数量已突破2400家,核心产业营收超过3000亿元,备案大模型产品达123款,数量位居全国首位。同时,数据基础制度先行区已发布100个高质量大模型数据集,数据总量达到150PB;智能算力规模超过2.2万P,京津冀蒙环京算力供给廊道已初步形成。
面对DeepSeek等新兴大模型崛起带来的行业竞争新态势,如何加速大模型在行业中的深度应用成为关键议题。针对这一议题,杨烁提出了三大明确方向:
一是支持MaaS平台在京集聚发展,通过“算力券”政策培育一批具有代表性的示范工程和标杆产品,同时通过“数据券”政策支持一批“首开放”数据集的开放与应用;
二是推动行业软件企业全面融入模型能力,优先在基础软件、工业软件、事务处理软件、新型安全软件等领域策划实施重点项目;
三是支持软件企业加快智能化技术改造,通过算力构建、模型部署、数据治理等方式提升研发效率,同样在基础软件、工业软件等领域策划实施重点项目;
四是健全人工智能应用服务生态,推进人工智能国际开源社区建设、开源平台落地及共享生态构建,并将人工智能赋能新产品、新服务纳入中小企业服务券支持范围。
二、模型、推理、开发
三大要素正处于全速演进阶段
01
基础模型:没有最强只有更强
基础模型作为AI应用生态的核心驱动力,凭借其深度推理能力、多模态理解与交互能力,为多样化、高质量服务提供了坚实支撑,并通过不同类型、尺寸的模型组合,精准满足复杂、轻量级及探索性需求。
阿里云始终是开源模型领域的先锋力量。其通义大模型作为中国最早的基础大模型体系,已在全球范围内积累了庞大用户群体。自2023年发布以来,通义大模型迭代速度持续加快,尤其在近5个月内呈现密集升级态势。同时,阿里云加速开源步伐,推出更多元化的模型类型。
目前,阿里云已成为全球唯一实现基础大模型自主研发、全维度开源与深度贡献的云计算企业,开源模型总数突破200款。通过开放优质、多尺寸模型,阿里云获得了开发者与企业用户的广泛支持与反馈,进一步验证了开源模型的实用性与可靠性。

阿里云智能集团资深副总裁、公共云事业部总裁刘伟光
刘伟光指出,大模型未来发展需聚焦两大方向:一是强化推理能力,二是推动全模态融合。2025年3月,阿里云开源的通义千问QwQ-32B推理模型在数字代码与通用能力上实现重大突破,尤其在小参数模型中展现了大参数模型的Sora级性能,并显著提升了对Agent智能体的兼容性。
未来,大模型将向更强推理能力演进。随着任务规划与工具使用能力的增强,模型将具备更高智慧水平,能够解决更复杂的问题。这一方向与阿里云的战略布局高度契合。
02
推理服务基础设施不断优化
在AI推理训练应用爆发的背景下,AI基础设施不断优化。针对模型参数量扩大导致的冷启动和规模化扩容瓶颈,阿里云推出全新模型权重服务,使大模型0 – 100节点冷启动速度提升21倍,50 – 100节点扩容速度提升12倍;
针对MOE架构调度复杂问题,阿里云推出分布式推理调度引擎Llumnix,让首Token延迟下降92%,每个Token生成时间降低15%;
今年阿里云实现流量感知的PD分离,提升端到端服务吞吐近91%,千万级活跃用户场景KV Cache命中率提升10倍。这些底层技术优化最终为企业级客户提供更稳定高效的API服务,满足多元化服务等级目标。
03
开发工具:降低AI门槛
在开发工具领域,阿里云百炼平台通过持续迭代升级,现已构建起一套覆盖全链路的应用开发工具体系,为企业级AI应用开发者提供从开发到落地的全流程保障。具体功能包括:
记忆增强型工具:通过智能上下文管理机制,显著提升模型推理效率,实现高效记忆与快速响应;
跨模态检索增强生成(RAG)工具:支持文本、图像、音频等多模态数据融合搜索,大幅提高检索结果的精准度与相关性;
动态模型路由工具:根据复杂业务场景下的任务需求,智能调度最优模型资源,确保系统高效运行;
可视化工作流编排工具:通过拖拽式界面实现多智能体协同调度,支持企业级SLA(服务等级协议)保障,简化复杂流程开发;
低代码智能体构建工具:提供业务逻辑快速注入能力,企业可在5-10分钟内完成智能体搭建,并集成丰富的插件生态;
全链路监控分析工具:支持AI Agent及应用全生命周期的实时观测,涵盖性能、使用效果等多维度数据分析,助力企业持续优化。
3
行业落地
从“技术演示”到“价值创造”的临界点
阿里云智能集团资深副总裁、公共云事业部总裁刘伟光在主题演讲中强调,大模型的社会价值正加速渗透至企业市场。阿里云将持续深化技术投入,构建覆盖AI全生命周期的技术体系,通过开源开放策略推动AI应用创新,助力企业实现智能化升级。
技术突破驱动场景革新
近一年多来,通义大模型技术实现跨越式发展:
- 消费端:用户体验显著优化,智能交互能力大幅提升;
- 产业端:生产力变革加速,已在代码开发、硬件制造、智能座舱、金融服务、药物研发、太空探索等20余个行业实现规模化落地。
截至2025年1月底,阿里云百炼平台累计吸引超29万家企业及开发者接入通义API,AI技术正从实验性应用迈向标准化生产。
标杆案例诠释技术价值
地平线:智驾模型训练效率提升40%
依托阿里云万卡智算集群,地平线实现端到端智驾模型训练效率突破。通过智能调度与故障自愈技术,集群整体故障恢复时间缩短40%以上,为自动驾驶技术规模化商用奠定算力基础。
中华财险:保险业效率标杆重塑
基于云原生架构与通义大模型,中华财险实现从“数字化”到“数智化”的跨越。通义灵码赋能60%研发人员AI编程,代码采纳率达37.5%(累计53万行)。条款解读助手与智能理赔助手覆盖保险全流程,推动行业效率标准升级。
总台春晚:全球直播覆盖创新高
2025年春晚新媒体端直播收视次数突破21.3亿次,创历史新高。作为独家云计算AI合作伙伴,阿里云依托全球分布式云节点与通义大模型,保障春晚直播“零卡顿、零故障”,展现中国云技术的全球领先实力。
叮咚买菜:生鲜电商成本降低70%
叮咚买菜通过百炼平台接入Qwen-plus、Qwen2.5-VL等模型,结合ASR/TTS技术重构售前咨询、供应链管理、售后客服全链路。相比传统本地化部署模式,模型推理成本降低超70%,实现降本增效双突破。
美高域:医疗硬件AI化重构服务体验
美高域将通义大模型深度融入简易体征采集设备,通过Qwen实现血压、血氧等数据的实时分析,并生成个性化健康报告。医患对话语音实时转录与多模态分析,提升诊断精准度与沟通效率。依托阿里云算力,美高域打造从问诊到随访的全流程数字化医疗体系,重塑患者服务体验。
4
百炼上线业界首个
全生命周期MCP服务
推动AI普惠和规模化应用
为了让AI Agent有“更聪明的大脑”、“更丰富的交互”,4月9日,阿里云百炼上线业界首个全生命周期MCP服务,无需用户管理资源、开发部署、工程运维等工作,5分钟即可快速搭建一个专属MCP Agent,大幅降低Agent的开发门槛。百炼平台首批上线了高德、无影、Fetch、Notion等50多款阿里巴巴集团和三方MCP服务,覆盖生活信息、浏览器、信息处理、内容生成等领域,可满足不同场景的Agent应用开发需求。
同日,阿里云还预告了AI Agent Store的愿景,通过Agent Store这种创新模式,把阿里巴巴集团和生态伙伴的Agent向外开放,让各行各业的人都可以拥有自己专属的助理。
未来展望
在AI势能峰会上,阿里云发布AI生态伙伴计划——“繁花计划”,并推出AI应用与服务市场。未来三年,阿里云将在基础设施、模型、数据、工具、应用、交付六大领域与生态伙伴一起服务百万云上客户,拓展百亿商机,共同打造中国繁荣的AI生态。
据介绍,“繁花计划”将根据生态合作伙伴产品成熟度,提供从技术到商业化所需的云上资源及算力支持,帮助伙伴在AI领域探索创新,实现从首客拓展到规模化、商业化的目标,为各行业客户提供AI技术支持和服务,包括产品云上打包、商业化路径规划、AI伙伴全生命周期支撑等。
“长远看,AI最大的价值是推动各行各业的生产力变革。”大模型的社会价值正在向企业市场释放,阿里云将坚定投入,打造全栈领先的技术,持续开源开放,为AI应用提速。