一颗CPU支撑1000多个智能体，英特尔至强6+重塑CPU度量衡

6月5日，英特尔隆重发布新一代数据中心处理器——至强6+，发布会现场关于产品说了很多，阿里云、腾讯云、火山引擎、金山云以及云尖信息等站台的合作伙伴也说了很多。

而我觉得最有意思的是英特尔说的一个数字：一颗288核的至强6+处理器，现在居然能跑超过1000个智能体。

智能体的数量成了CPU的全新度量衡

我觉得，这个数字有意思的点不在数字大小，而在它的单位。

我们过去衡量一颗服务器CPU，我们只看核数、主频、缓存、内存带宽这些参数，现在英特尔这么一说，感觉像是拿出了一把新尺子，用智能体的数量来衡量CPU的能力。

现在一个大的背景是，CPU在数据中心里的角色正在变化，因为如今的CPU对智能体越来越重要了。

传统的AI聊天助手，你问一句，模型答一句就结束了，用户只在意GPU的算力，CPU在这里是个打杂的。

智能体则不一样，它要做步骤规划、调工具、写代码，还要跟别的智能体协同，需要循环进行很多复杂操作，涉及到的资源调度、编排等都是CPU的活儿。

所以，智能体越多，CPU就越忙。

英特尔在现场给了组数据，数据中心里CPU和GPU的配比，前年还是1比8，去年1比4，今年已经到了1比2。过去一个月，媒体都在重复这句话，这是CPU重回数据中心关键地位的叙事主线。

CPU的用量上涨已经反映在供应链上了。

英特尔数据中心集团副总裁兼中国区总经理陈葆立表示，去年年底开始看到了非常强劲的需求，而英特尔是一个自己就有芯片生产能力的芯片公司，在保障供应方面有明显优势。

英特尔市场营销集团副总裁、中国区总经理郭威说，今年全球CPU市场约500亿美金，未来四五年可能翻两番到2000亿。中国在整个服务器CPU市场总量大概占1/4到1/3，这是一个非常大的市场。

如何满足这样一个市场呢？英特尔所说的，一颗至强6+ CPU能跑1000个智能体，就是最好的回答。在CPU也开始供应紧张的背景下，这对用户很重要。

一块至强6+处理器能支持1000个智能体

至强6+的代号是Clearwater Forest，是英特尔能效核产品线的第二代，接的是上一代Sierra Forest，它是英特尔第一款用上18A先进制程的数据中心CPU。

它最大的特点是核多。单块处理器可以塞进去最多288个Darkmont能效核，配576MB三级缓存，支持DDR5-8000内存和96条PCIe 5.0通道。

陈葆立介绍说，英特尔至强6+每个核心能稳定跑3到4个智能体。用288个核乘以4，是1152个，所以，单颗超过1000个这个说法，应该就是这么来的。

当然，这个1000是测试环境下的理想值。真实业务里智能体有轻有重，一个只查天气的，跟一个要跑多步代码的消耗的资源完全不是一个量级。

陈葆立坦承，如果要在单个CPU核心上同时运行3到4个智能体，其实就是把单核的算力资源切分成3到4份，切分后单个智能体所用的算力性能是会有所递减的。所以，这更适合去处理一些相对初级、简单的日常工作。

从商业上分析，现阶段还是智能体发展的早期阶段，很多人还在尝试，很多用户都在免费用，这种方式可以支撑到更多用户。如果后期最终用户愿意付费，那意味着用户得到了更大的价值，单个智能体可以搭配上更多算力资源。

云尖信息副总裁张欢军在大会现场提到了CPU集群柜，它可以负责数据处理和智能体调度一系列工作。整柜全液冷盲插设计，带CDU和交换机，单柜20万瓦，最高支持6万个智能体。

智能体需要核更多，还是核更强？

按照英特尔的划分，至强6+能效核适用于高密度智能体CPU集群，强调更高的并发和更优的成本。而此前的至强6性能核处理器适用于高性能的智能体CPU集群，同时也能当做GPU服务器的机头CPU。

虽然，所有处理器都能用于智能体的场景，但我觉得现阶段更需要多核心的处理器。因为智能体即将迎来爆发，郭威在演讲中提到，到2031年活跃智能体数量将达到3.5亿个，这需要大量CPU。

阿里云智能集团块存储研发总监谷跃胜分析了智能体的特点。智能体应用中的任务会被分解成无数个智能体，它不仅数量多，而且生命周期极短。同时，智能体负载自由度高，无法做规律性的预测的。

我觉得，在这种场景下，用户需要的不是一个能扛重活的大力士，而更需要一大群能同时干活、随叫随到、还省电的小工。这正好是能效核的设计方向，不追求单核极致性能，但追求密度高、能效高，一颗芯片里能塞下足够多的核。

金山云计算研发负责人杨峰演讲中提到了基于英特尔至强6+推出的SE10实例，它能将AI应用部署密度达到80%以上。同时，它凭借更低的响应时延优化模型加载，提高KV Cache的内存访问效率，还可以加速首token的输出。

英特尔至强碰巧对智能体有很多存货

陈葆立在采访中说了句实在话，芯片从设计到出货至少要2到4年，所以市场上突然冒出一堆号称“为智能体设计”的芯片，很大程度上只是宣传。智能体火起来满打满算也就半年，没人能在三四年前就照着智能体的样子去画芯片。

英特尔至强6+虽然不是专门为智能体打造的，但英特尔的弹药库里堆放的一堆武器，这些东西当年是为别的场景而设计的，现在却离奇地在智能体时代发光发热。

英特尔中国区技术部总经理高宇在采访中提到，智能体时代有两个最关键的痛点，一个是闪存SSD贵，一个是内存Memory贵。但凑巧的是，针对这俩痛点英特尔都有现成的解药。

先说QAT，这是英特尔用了很多年的数据压缩引擎，本来是干解压缩、加解密这种杂活的，现在用来压缩KV Cache。

KV Cache存储的是模型的上下文数据，现在很多模型动不动就支持百万Token上下文，一个用户的KV Cache轻轻松松就10GB左右，显存扛不住就只能往SSD上搬。但是问题是，SSD现在的价格一直在上涨。

如果能在搬到SSD之前先用QAT压缩一下，那会发生什么呢？高宇给的数字是压缩比至少能达到50%，也就是10GB的KV Cache直接砍成5GB。省下来的全是高端SSD的容量，也是一笔不菲的成本。

这里有个特别有意思的细节。陈葆立说，由于QAT压缩的太厉害了，怕砸了SSD厂商的生意，结果SSD厂商反过来求他多讲讲QAT，因为现在SSD厂商天天交不出货，巴不得至强帮忙把需求摁一摁，这画面太出乎所料了。

英特尔至强另一个有意思的技术是IAA（内存分析加速器），它对内存里的数据做实时压缩，压缩后写进去更省内存，而且重新加载时又不会慢。智能体越多，越是费内存，IAA能节省企业在内存上的支出。

除了这两个，还有做矩阵运算的AMX、做数据搬运的DSA，以及做机密计算的TDX。其中，火山引擎利用TDX帮助企业做云上AI的安全屋——AICC。这些全是英特尔的存货，没一个是为智能体专门做的，现在都派上了用场。

腾讯云计算产品运营总监周驰也说，英特尔CPU上面有很多小的功能模块，它非常有意义且有场景，但以前真正用起来的人很少。着眼未来，当AI不断发展变得更强的时候，英特尔这些功能模块上的积累就会爆发出来。

本文来源于DOIT传媒，文章内容仅供参考，不构成投资建议。

一颗CPU支撑1000多个智能体，英特尔至强6+重塑CPU度量衡

发表回复

评论列表

联系我们

一颗CPU支撑1000多个智能体，英特尔至强6+重塑CPU度量衡

相关推荐

发表回复

评论列表

联系我们

百易服务隐私条款

【个人信息的收集和使用】

1、收集和使用的目的

2、收集和使用的信息

【个人信息共享、转让与公开披露】

1、个人信息的共享

2、个人信息的转让

3、个人信息的公开披露

在以下情形中，共享、转让、公开披露您的个人信息无需事先征得您的授权同意：

【我们如何保存及保护您的个人信息】

1、保存期限

2、保存地域

3、安全措施

4、安全事件通知

【您的权利】

【本隐私政策如何更新】

【如何联系我们】

请登录

登录

注册