6月5日,英特尔隆重发布新一代数据中心处理器——至强6+,发布会现场关于产品说了很多,阿里云、腾讯云、火山引擎、金山云以及云尖信息等站台的合作伙伴也说了很多。

而我觉得最有意思的是英特尔说的一个数字:一颗288核的至强6+处理器,现在居然能跑超过1000个智能体。
智能体的数量成了CPU的全新度量衡
我觉得,这个数字有意思的点不在数字大小,而在它的单位。
我们过去衡量一颗服务器CPU,我们只看核数、主频、缓存、内存带宽这些参数,现在英特尔这么一说,感觉像是拿出了一把新尺子,用智能体的数量来衡量CPU的能力。
现在一个大的背景是,CPU在数据中心里的角色正在变化,因为如今的CPU对智能体越来越重要了。
传统的AI聊天助手,你问一句,模型答一句就结束了,用户只在意GPU的算力,CPU在这里是个打杂的。
智能体则不一样,它要做步骤规划、调工具、写代码,还要跟别的智能体协同,需要循环进行很多复杂操作,涉及到的资源调度、编排等都是CPU的活儿。
所以,智能体越多,CPU就越忙。
英特尔在现场给了组数据,数据中心里CPU和GPU的配比,前年还是1比8,去年1比4,今年已经到了1比2。过去一个月,媒体都在重复这句话,这是CPU重回数据中心关键地位的叙事主线。
CPU的用量上涨已经反映在供应链上了。

英特尔数据中心集团副总裁兼中国区总经理陈葆立表示,去年年底开始看到了非常强劲的需求,而英特尔是一个自己就有芯片生产能力的芯片公司,在保障供应方面有明显优势。
英特尔市场营销集团副总裁、中国区总经理郭威说,今年全球CPU市场约500亿美金,未来四五年可能翻两番到2000亿。中国在整个服务器CPU市场总量大概占1/4到1/3,这是一个非常大的市场。

如何满足这样一个市场呢?英特尔所说的,一颗至强6+ CPU能跑1000个智能体,就是最好的回答。在CPU也开始供应紧张的背景下,这对用户很重要。
一块至强6+处理器能支持1000个智能体
至强6+的代号是Clearwater Forest,是英特尔能效核产品线的第二代,接的是上一代Sierra Forest,它是英特尔第一款用上18A先进制程的数据中心CPU。
它最大的特点是核多。单块处理器可以塞进去最多288个Darkmont能效核,配576MB三级缓存,支持DDR5-8000内存和96条PCIe 5.0通道。
陈葆立介绍说,英特尔至强6+每个核心能稳定跑3到4个智能体。用288个核乘以4,是1152个,所以,单颗超过1000个这个说法,应该就是这么来的。
当然,这个1000是测试环境下的理想值。真实业务里智能体有轻有重,一个只查天气的,跟一个要跑多步代码的消耗的资源完全不是一个量级。
陈葆立坦承,如果要在单个CPU核心上同时运行3到4个智能体,其实就是把单核的算力资源切分成3到4份,切分后单个智能体所用的算力性能是会有所递减的。所以,这更适合去处理一些相对初级、简单的日常工作。
从商业上分析,现阶段还是智能体发展的早期阶段,很多人还在尝试,很多用户都在免费用,这种方式可以支撑到更多用户。如果后期最终用户愿意付费,那意味着用户得到了更大的价值,单个智能体可以搭配上更多算力资源。
云尖信息副总裁张欢军在大会现场提到了CPU集群柜,它可以负责数据处理和智能体调度一系列工作。整柜全液冷盲插设计,带CDU和交换机,单柜20万瓦,最高支持6万个智能体。
智能体需要核更多,还是核更强?

按照英特尔的划分,至强6+能效核适用于高密度智能体CPU集群,强调更高的并发和更优的成本。而此前的至强6性能核处理器适用于高性能的智能体CPU集群,同时也能当做GPU服务器的机头CPU。
虽然,所有处理器都能用于智能体的场景,但我觉得现阶段更需要多核心的处理器。因为智能体即将迎来爆发,郭威在演讲中提到,到2031年活跃智能体数量将达到3.5亿个,这需要大量CPU。
阿里云智能集团块存储研发总监谷跃胜分析了智能体的特点。智能体应用中的任务会被分解成无数个智能体,它不仅数量多,而且生命周期极短。同时,智能体负载自由度高,无法做规律性的预测的。
我觉得,在这种场景下,用户需要的不是一个能扛重活的大力士,而更需要一大群能同时干活、随叫随到、还省电的小工。这正好是能效核的设计方向,不追求单核极致性能,但追求密度高、能效高,一颗芯片里能塞下足够多的核。
金山云计算研发负责人杨峰演讲中提到了基于英特尔至强6+推出的SE10实例,它能将AI应用部署密度达到80%以上。同时,它凭借更低的响应时延优化模型加载,提高KV Cache的内存访问效率,还可以加速首token的输出。
英特尔至强碰巧对智能体有很多存货
陈葆立在采访中说了句实在话,芯片从设计到出货至少要2到4年,所以市场上突然冒出一堆号称“为智能体设计”的芯片,很大程度上只是宣传。智能体火起来满打满算也就半年,没人能在三四年前就照着智能体的样子去画芯片。
英特尔至强6+虽然不是专门为智能体打造的,但英特尔的弹药库里堆放的一堆武器,这些东西当年是为别的场景而设计的,现在却离奇地在智能体时代发光发热。
英特尔中国区技术部总经理高宇在采访中提到,智能体时代有两个最关键的痛点,一个是闪存SSD贵,一个是内存Memory贵。但凑巧的是,针对这俩痛点英特尔都有现成的解药。
先说QAT,这是英特尔用了很多年的数据压缩引擎,本来是干解压缩、加解密这种杂活的,现在用来压缩KV Cache。
KV Cache存储的是模型的上下文数据,现在很多模型动不动就支持百万Token上下文,一个用户的KV Cache轻轻松松就10GB左右,显存扛不住就只能往SSD上搬。但是问题是,SSD现在的价格一直在上涨。
如果能在搬到SSD之前先用QAT压缩一下,那会发生什么呢?高宇给的数字是压缩比至少能达到50%,也就是10GB的KV Cache直接砍成5GB。省下来的全是高端SSD的容量,也是一笔不菲的成本。
这里有个特别有意思的细节。陈葆立说,由于QAT压缩的太厉害了,怕砸了SSD厂商的生意,结果SSD厂商反过来求他多讲讲QAT,因为现在SSD厂商天天交不出货,巴不得至强帮忙把需求摁一摁,这画面太出乎所料了。
英特尔至强另一个有意思的技术是IAA(内存分析加速器),它对内存里的数据做实时压缩,压缩后写进去更省内存,而且重新加载时又不会慢。智能体越多,越是费内存,IAA能节省企业在内存上的支出。
除了这两个,还有做矩阵运算的AMX、做数据搬运的DSA,以及做机密计算的TDX。其中,火山引擎利用TDX帮助企业做云上AI的安全屋——AICC。这些全是英特尔的存货,没一个是为智能体专门做的,现在都派上了用场。
腾讯云计算产品运营总监周驰也说,英特尔CPU上面有很多小的功能模块,它非常有意义且有场景,但以前真正用起来的人很少。着眼未来,当AI不断发展变得更强的时候,英特尔这些功能模块上的积累就会爆发出来。
本文来源于DOIT传媒,文章内容仅供参考,不构成投资建议。
评论列表