DeepSeek-OCR开源炸场!3B参数实现10倍Token压缩,97%准确率颠覆长文本处理
当大模型处理长文本时还在为“Token不够用、算力扛不住”发愁,DeepSeek直接抛出了颠覆性方案——开源3B参数OCR模型,用“光学压缩”思路让文本处理效率飙升,既保持97%以上的超高准确率,又能把Token消耗砍到原来的十分之一,堪称...
当大模型处理长文本时还在为“Token不够用、算力扛不住”发愁,DeepSeek直接抛出了颠覆性方案——开源3B参数OCR模型,用“光学压缩”思路让文本处理效率飙升,既保持97%以上的超高准确率,又能把Token消耗砍到原来的十分之一,堪称...

导读 在2025年国庆节前夕,当人们的注意力逐渐转向假期时,中国的人工智能领域却迎来了一场“秋收”的喜悦。AI独角兽企业深度求索DeepSeek正式推出了其最新的实验性大模型——DeepSeek-V3.2-Exp。 此外更爆炸的是两大国产A...

2025年9月19日,亚马逊云科技宣布在其模型服务平台Amazon Bedrock上,正式上线通义千问Qwen3系列和DeepSeek V3.1模型。这是两个来自中国团队开发的开放权重模型,一定程度表达了对中国AI技术实力的认可。 Amaz...
北京——2025年9月19日 亚马逊云科技宣布,在Amazon Bedrock上新增Qwen3和DeepSeek-V3.1开放权重模型,进一步扩展Amazon Bedrock上完全托管的行业领先模型阵容,这些模型现已在全球范围内正式可用。 ...

导读 “UE8M0 FP8是针对即将发布的下一代国产芯片设计。”在DeepSeek-V3.1发布文章的置顶评论中,这句简短的技术说明迅速在AI圈引发热议。 这不仅仅是一次模型升级,更是中国AI算力自主化道路上的重要里程碑。DeepSeek此...

6月25日,2025爱分析第三届AI大模型高峰论坛在京圆满落幕。本届论坛以“AI从技术惊艳走向商业爆发”为核心议题,汇聚了央国企、金融、零售、工业制造等领域的顶尖AI专家,共同探索AI驱动企业效率与价值跃迁的实践路径。在备受瞩目的颁奖环节,...

原创 :芯风威 在AI 大模型和数据洪流时代,存储系统成为突破性能瓶颈的关键环节。Solidigm 推出的面向数据中心,高TCO 的 QLC NVMe SSD —— D5 系列产品,以惊人的容量和高顺序读取性能,为大规模AI 存储集群带来...

2025年,DeepSeek掀起了本地部署大模型的热潮,某电视总局基于DeepSeek构建了RAG(检索增强生成)系统,面向用户提供了一个AI助手。在融科联创和Solidigm的帮助下,将系统准确率从50-60%提升到了95%左右,存储在其...

5月29日,腾讯旗下腾讯元宝、ima、搜狗输入法、QQ浏览器、腾讯文档、腾讯地图、腾讯乐享等多款AI应用宣布接入DeepSeek R1-0528,用户在不同产品中,选择DeepSeek模型R1深度思考,都可以体验到DeepSeek R1-0...

导读 深夜时分,DeepSeek-R1-0528的模型权重悄然现身于HuggingFace平台,瞬间在全球开发者社区中掀起了一阵热潮。此次版本号标注为“5月28日”的更新,虽被官方定义为“小版本试升级”,却在性能上取得了令人瞩目的进展,几乎...