
昇腾大规模跨节点专家并行(大EP)集群推理方案之动态均衡技术
DeepSeek开源周里发布的大规模跨节点专家并行(简称“大EP”),揭开了推理服务如何提高吞吐、降低时延的技术秘诀。大EP能实现接近545%的成本降低,但落地过程中仍面临诸如“专家动态均衡”和“通信时延”等问题。如何优化负载均衡、降低通信...

DeepSeek开源周里发布的大规模跨节点专家并行(简称“大EP”),揭开了推理服务如何提高吞吐、降低时延的技术秘诀。大EP能实现接近545%的成本降低,但落地过程中仍面临诸如“专家动态均衡”和“通信时延”等问题。如何优化负载均衡、降低通信...
每年3月至5月,财税工作者们不可避免地要经历一场“年度大考”——汇算清缴。面对堆积如山的票据、频繁更新的政策以及对数据核对的小心翼翼……这一传统流程显然耗费了大量时间和精力。但是,今年,这一切将经历颠覆性的变革! 传统汇缴的三大痛点困扰代账...

AI安全助手XGPT全新升级了! 微步在线宣布已完成与DeepSeek的深度接入,正式上线XGPT DeepSeek版,实现AI安全工具在威胁研判、攻击分析、漏洞解读、代码审计等多个场景下模型性能和准确度的全面提升。这也标志着微步在坚持“T...

2月底,英特尔一口气发布多款至强6处理器,其中包括备受瞩目的6700/6500性能核处理器。在数据中心领域需求持续攀升的当下,英特尔的这一系列举措显得尤为关键。一方面,公司积极扩充至强 6 处理器的产品矩阵,很好地满足市场的多样化需求;另一...

面对数据中心领域日益激烈的竞争,英特尔紧抓核心产品,继去年推出128核的至强6900P之后,近期又添“新兵”——至强6700P和至强6500P,进一步丰富了至强6产品线。英特尔至强6性能核处理器专为计算密集型工作负载而设计,新发布的至强67...

近期,DeepSeek开源的3FS系统向全球科技圈力证,通过存储来优化AI推理工作负载,可有效提升大模型性能,同时大幅降低成本。 作为AI原生存储,3FS的链式复制机制、FFRecord格式优化等创新设计,不仅重新定义了AI存储的技术标准,...

2025年初,国产DeepSeek-R1横空出世,通过精心设计训练流程和应用新算法,一举打破依靠芯片算力投资的固有概念,直接把GPT-4o拉下神坛。 并且伴随DeepSeek-R1的发力,除了重构全球AI竞争格局,同时也拉动像云计算、端侧推...

2025年3月4日,MWC25巴塞罗那期间,华为联合中国武汉市城市运行管理中心(以下简称“武汉城运中心”)及合作伙伴发布武汉市全域数字化转型全球样板点。 活动期间,武汉市城市运行管理中心专职副主任耿峰、武汉市信息中心政务网络部部长董波涛、武...

春天的脚步悄然而至,温暖的阳光洒在大地上,迎来踏青、出游、探索自然的好时节。无论是约上三五好友前往山野郊外,还是在城市公园里感受春日气息,一部轻便、智能且功能强大的手机,能够让旅程更加轻松惬意。三星Galaxy S25 Ultra凭借升级的...

3月4日,在2025世界移动通信大会(MWC 2025)期间,中国电信AI生态·共创未来峰会成功举办。本次大会以“AI汇聚连接,创领智慧未来”为主题,吸引了来自全球各地的通信业领袖、国际运营商及生态合作伙伴,共同探讨AI如何赋能产业升级,推...