英特尔亮相火山引擎春季原动力大会,共同发布第四代通用型计算实例家族

今日,在火山引擎2025春季原动力大会上,英特尔联合火山引擎共同发布搭载英特尔® 至强® 6性能核处理器的第四代通用计算型(ECS)实例家族,即全新推出的通用计算基础型实例 g4i、算力增强型实例 g4ie,并深入展示了此前发布的I/O增强型实例 g4il的丰富用例。不仅如此,双方还分享了AI时代共同驱动算力成本优化、端云协同与开发范式升级的最新合作进展。

AI的发展推动着云计算的演进,加速行业从云原生时代迈向AI原生时代。在这一进程中,企业对算力的需求日益多样化,同时对高性价比、高稳定性的需求也与日俱增。基于多年的广泛合作,英特尔与火山引擎继续携手共进,一方面充分利用双方的优势,打造涵盖从通用到智能的弹性AI算力底座,为企业提供强大、灵活、兼顾成本效益的AI算力基础设施;另一方面,双方亦通过共建开放生态,支持大模型应用、智能体DevOps中台与高性价比智算平台相结合,构建AI生态新范式,加速企业的智能化进程。

高效算力底座,推动云端算力跃升

本次大会上,英特尔携手火山引擎共同发布了全新第四代 ECS 实例家族,不仅功能上更加丰富,在性能与架构上也得到了进一步提升。与上一代实例相比,通用计算基础型实例 g4i在MySQL 数据库和Web 应用上分别实现了20%和19%的性能提升,算力增强型实例 g4ie在视频解码和图像渲染上带来了15%和26%提升,I/O增强型实例 g4il在Spark大数据和Redis数据库上也实现了13%和30%的提升。值得一提的是,得益于英特尔® 高级矩阵扩展(AMX)的深度优化,基础型实例 g4i在RAG全链路提速、WDL 模型推理优化上均展现了出色的性能。其中,RAG全链路在文档处理、Embedding、向量数据库检索和Reranking加速中,耗时减少了40%-90%。1

高性价比智算平台,助力企业智能体进阶

边缘AI应用的发展,对定制化、便捷化和安全化提出了新的需求,这让具备灵活、高效、高性价比的智算平台成为理想之选。在基于英特尔至强处理器和多张英特尔锐炫显卡的一体机解决方案中,全新英特尔锐炫TM Pro B60,单卡可提供24GB显存,在上下文扩展和并发扩展等场景中,提供更强的处理能力。因此,在边缘和企业AI等应用场景中,该方案能够以出色的成本效益优势,提供高效、可靠的AI算力。此外,英特尔提供了包括vLLM、PyTorch在内的完善的主流生态软件栈和封装成服务化的企业AI平台(EAP),帮助用户将上层应用平滑迁移到英特尔平台上,加速用户私有化部署LLM应用和智能体。

软硬件协同加速,焕新模型开发至应用落地

通过帮助企业打造弹性的AI算力底座,英特尔与火山引擎正携手推动AI技术在云端的普及与应用,护航AI云原生从开发到生产的全流程,本次活动的现场展区也展示了双方合作的丰富成果。

在企业AI应用开发侧,英特尔携手火山引擎基于第四代实例提供了大模型应用的开发环境——“开源大模型应用-知识库问答”应用镜像,支持开发者快速完成大模型的微调和推理环境的搭建。在结合HiAgent大模型能力中台时,能够从Dev到Ops全方位支持智能体规划、开发与应用,帮助降低AI落地的技术门槛和运营成本。在助力企业AI生产领域,英特尔至强处理器和AMX加速引擎、配合火山引擎的深度优化,让企业在大模型落地阶段可以实现全流程性能提升,降低AI应用的部署成本,保障在高并发场景下的系统稳定性的同时,提升产品的整体性能与实际落地效率。

通过共同构建开放的AI生态,英特尔与火山引擎正在推动AI算力普惠,打造高性价比的智算平台。展望未来,双方也将继续探索AI时代云计算的更多创新应用,以高效的算力加速低成本AI应用落地,助力企业的智能化升级之路。

注释

  1. 文档处理对比数据基于 ecs.g4i.8xlarge+MinerU 工具+ OpenVINO 测试,embedding 对比数据基于 ecs.g4i.16xlarge+bge-base-zh-1.5 模型+ IPEX/16 并发请求测试;reranking 对比数据基于 ecs.g4i.16xlarge+bge-reranker-base 模型+ IPEX/16 并发请求测试;向量数据库检索对比数据基于 ecs.g4i.4xlarge+hnswlib 算法库 +P99 检索召回率测试