
Aladdin大模型开发利器:解锁千亿参数模型的“效率密钥”——九章云极总监智能算力前沿技术论坛演讲预告
导读 当千亿参数模型从实验室走向产业主战场,一场关乎效率与成本的“开发马拉松”正在上演。在2025年这个AI大模型爆发元年,千亿参数模型已从实验室走向产业落地。然而,开发者正面临训练周期长、算力成本高、调试复杂的“三重困境” 在这样的背景下...
导读 当千亿参数模型从实验室走向产业主战场,一场关乎效率与成本的“开发马拉松”正在上演。在2025年这个AI大模型爆发元年,千亿参数模型已从实验室走向产业落地。然而,开发者正面临训练周期长、算力成本高、调试复杂的“三重困境” 在这样的背景下...
导读 深夜突袭!DeepSeek-V3携6850亿参数“偷袭”代码界,Claude 3.7瑟瑟发抖?——AI基建再掀技术革命。 2025年3月25日,当全球AI巨头还在为发布会排期时,中国团队DeepSeek已悄然在Hugging Face...
近日,浪潮信息宣布推出元脑CPU推理服务器,可高效运行DeepSeek和千问QwQ等新一代大推理模型。元脑CPU推理服务器NF8260G7和NF8480G7设计采用4颗高性能通用CPU和多通道内存系统,通过先进的张量并行策略和AMX加速技术...
在近日举行的主题为“有云处皆智能”的2025浪潮云战略发布会上,浪潮云率先发布分布式智能云战略,计划半年内完成现有分布式云节点的升级,今年内落地分布式智能云节点超过1000个,成为“智慧系统的全场景运营商”,实现“有云处皆智能”的战略愿景。...
导读 在人工智能狂飙突进的今天,神经网络模型的规模已突破千亿参数门槛,训练过程中所需的内存消耗呈指数级增长。以GPT-4为代表的多模态大模型,其训练内存需求甚至超过1000GB。然而,GPU显存容量受制于物理芯片规格,传统训练方法面临“内存...
导读 当Mamba遇上Transformer,计算效率与推理速度的革命性跃迁 3月21日,中国科技巨头腾讯与全球芯片霸主英伟达几乎同步发布基于Mamba-Transformer混合架构的新一代大模型,分别推出混元T1与Nemotron-H系...
近年来,AI Agent领域迎来了重大突破,Monica.im中国团队研发的通用型AI Agent产品“Manus”正式全球发布。这款产品在GAIA基准测试中表现卓越,性能超越OpenAI同层次大模型“Deep Research”。它不仅仅...
在数字化浪潮之中,人工智能正以超乎想象的速度全方位地融入各行各业,触发了一场波澜壮阔的深刻变革。 3月27日,由上海市计算机学会指导,DOIT传媒主办,算力豹、百易存储研究院、CXL技术应用俱乐部、上海市计算机学会存储技术专委会、上海交通大...
导读 在AI技术狂飙突进的今天,算力已从幕后技术支撑跃升为重塑全球产业格局的核心力量。从千亿参数大模型的训练到自动驾驶的实时决策,从医疗影像的精准分析到金融风险的毫秒级预测,算力正以前所未有的速度渗透到社会经济的每个角落。 正如《2022-...
【中国,北京,2025年3月21日】今日,第九届华为ICT大赛中国挑战赛决赛在北京市门头沟区京西智谷隆重开幕,来自北京航空航天大学、电子科技大学、哈尔滨工业大学(深圳)、华中科技大学、兰州大学、南方科技大学、清华大学、上海交通大学、山西大学...