
昇腾大规模跨节点专家并行(大EP)集群推理方案之低时延通信解密
昇腾联合科大讯飞推出业界首个自研算力的推理集群解决方案,使用大规模跨节点专家并行(大EP)策略,将庞大的专家模型拆解为多个子专家,并分配到不同计算节点上独立执行,有效降低了单节点内存要求,实现了更低时延下的更大吞吐量。 然而,这种大EP并行...

昇腾联合科大讯飞推出业界首个自研算力的推理集群解决方案,使用大规模跨节点专家并行(大EP)策略,将庞大的专家模型拆解为多个子专家,并分配到不同计算节点上独立执行,有效降低了单节点内存要求,实现了更低时延下的更大吞吐量。 然而,这种大EP并行...

北京时间2025年3月11日凌晨,亚马逊CEO Andy Jassy激动地宣布,亚马逊云科技成为了第一家支持DeepSeek-R1全托管的公有云服务商,让用户可以以更方便快捷的方式用上DeepSeek-R1。 从现在开始,用户可以通过Ama...

最近国产大模型DeepSeek的爆火,不少开发者通过Ollama工具将其部署在本地服务器上。但你知道吗?近九成Ollama服务器因配置疏忽,直接暴露在公网“裸奔”!通过网络空间测绘平台发现,截止2025年3月1日,共有14,359台裸奔在互...

2025年3月12日,Sandisk闪迪于今日亮相CFMS | MemoryS 2025,展示了其覆盖数据中心、汽车、移动端及消费端的全方位创新闪存解决方案,助力用户应对人工智能(AI)发展浪潮下日益复杂的工作负载。 在此次峰会上,闪迪详细...

2025年3月12日,深圳——在今日开幕的MemoryS 2025中国闪存市场峰会上,Solidigm亚太区销售副总裁倪锦峰发表题为《加速存储创新,拥抱AI时代》的演讲,深入阐述了Solidigm的AI存储哲学——通过包括大容量QLC在内的...
北京——2025年3月12日 亚马逊云科技与培生集团宣布扩展长期合作关系,旨在加快为全球数百万人提供AI赋能的个性化学习,并提升学习者对培生集团产品及服务的体验。 随着AI改变教育和工作领域,提升个人的学习能力显得尤为关键,它不仅...

以全新可编程解决方案,助力嵌入式系统实现定制化AI推理、实时计算和低延迟 在2025国际嵌入式展(Embedded World 2025)上,全球FPGA创新技术领导者Altera发布了专为嵌入式开发者打造的最新可编程解决方案,以进一步突破...
3 月 11 日消息,科大讯飞研究院今日官宣,科大讯飞携手华为在国产算力领域取得重大进展,双方联合团队率先突破国产算力集群上 MoE 模型的大规模跨节点专家并行集群推理,这是继 DeepSeek 公布其 MoE 模型训练推理方案后,业界首个...

2025年3月11日消息:Commvault近日宣布任命Ha Hoang为首席信息官(CIO)。Hoang在领导《财富》500强企业进行企业技术转型方面拥有超过25年的经验,并在云战略、SaaS优化和全球基础设施运营领域积累了丰富的专业知识...
亚马逊云科技是首个将DeepSeek-R1作为完全托管服务推出的云服务提供商 进一步扩展了客户在Amazon Bedrock上使用DeepSeek-R1及其蒸馏版本的方式 北京——2025年3月11日 亚马逊云科技宣布,DeepSeek-R...