
助力国产芯片突破FP8模型部署及DeepSeek部署成本及效率难题,清华团队及清华创企清程极智开源大模型推理引擎“赤兔Chitu”
【开源链接】 https://github.com/thu-pacman/chitu 14日,清华大学高性能计算研究所翟季冬教授团队与清华系科创企业清程极智联合宣布,开源大模型推理引擎“赤兔Chitu”,该引擎首次实现在非英伟达Hoppe...

【开源链接】 https://github.com/thu-pacman/chitu 14日,清华大学高性能计算研究所翟季冬教授团队与清华系科创企业清程极智联合宣布,开源大模型推理引擎“赤兔Chitu”,该引擎首次实现在非英伟达Hoppe...

3月13日,由中关村科金与上海市人工智能行业协会联合主办的”DeepSeek企业应用之道——2025大模型技术与应用创新城市论坛”在上海圆满落幕。论坛汇聚金融、央国企、制造、零售等领域的400余位行业领袖,现场,中关...

作者:杉岩数据 花瑞 在算力需求爆炸的AI时代,DeepSeek开源推出的高性能分布式文件系统3FS(Fire-Flyer File System),以单机SSD性能极限挖掘与RDMA网络零拷贝传输为核心,重新定义了AI训练场景的...

大模型技术的发展日新月异,DeepSeek 一体机的出现更是成为众多企业布局 AI 领域的热门选择。然而,当大家都在积极部署 DeepSeek 一体机时,一个关键问题值得深入思考:DeepSeek 作为通用大模型,固然有着强大的基础能力,但...

近来,DeepSeek系列模型在政务领域展现出强大的赋能潜力。天翼云选择曙光AI解决方案,凭借内置的DeepAI深算智能引擎,完成软硬件适配与深度调优,联合打造出“翼政通”大模型一体机。该一体机提供公文纠错、智能问答、公文生成、公文优化和公...
3 月 11 日消息,科大讯飞研究院今日官宣,科大讯飞携手华为在国产算力领域取得重大进展,双方联合团队率先突破国产算力集群上 MoE 模型的大规模跨节点专家并行集群推理,这是继 DeepSeek 公布其 MoE 模型训练推理方案后,业界首个...
亚马逊云科技是首个将DeepSeek-R1作为完全托管服务推出的云服务提供商 进一步扩展了客户在Amazon Bedrock上使用DeepSeek-R1及其蒸馏版本的方式 北京——2025年3月11日 亚马逊云科技宣布,DeepSeek-R...

导读 2025年3月6日,中国团队推出的全球首款通用AI Agent「Manus」以“思考+执行”的双重能力引爆科技圈。其官网访问量4小时突破千万量级,邀请码在二手平台被炒至10万元天价,A股AI智能体板块单日涨幅超10%。然而,在这场狂欢...

导读 在大模型技术蓬勃发展的当下,DeepSeek的出现宛如一阵春风,吹散了企业应用大模型的诸多障碍。它凭借创新的算法架构,如在Transformer架构的MoE和注意力机制方面的创新,以及改进的强化学习算法GRPO,大幅提升了模型性能,拉...

DeepSeek+数字人来了!近日,腾讯云智能数智人全面接入DeepSeek大模型。借助DeepSeek大模型优秀的语义理解和意图识别能力,进一步提升数智人在交互、播报等场景中的用户体验,让数智人落地到更多生产生活场景中去。通过数智人平台内...