8 月21日,沉寂多时的DeepSeek 发布了新版-- V3.1,DeepSeek的Agent 时代来了。
新版本在架构和效率方面,提出了突破性方案:混合推理架构 + 思维链压缩。
DeepSeek V3.1有哪些新突破?
混合推理架构:支持“思考模式”与“非思考模式”,在需要长链路推理时,保持高精度,而在简单问答时,快速响应。
思维链压缩:相比前代 R1 模型,V3.1 的 token 消耗减少 20%–50%,降低了调用成本,减少了响应延迟。
128K 上下文处理:在大规模文档、代码处理时,更具优势。
FP8 精度:采用 UE8M0 FP8 Scale 标准,首次为国产新一代 AI 芯片适配。
代码修复:在多轮调试中,表现稳定,避免了“越改越乱”的现象。
复杂搜索与整合:能够自动规划步骤、筛选证据,在多学科题目测试中,明显优于前代。
通过 腾讯元宝、本地部署 Janus 模型、以及 API,DeepSeek 已具备多模态能力:
OCR + 场景理解(如识别台球桌数字组合);
跨模态融合(如医疗影像 + 病历文本分析,准确率达 93%);
工业质检(缺陷识别准确率 98%);
视频解析(时空注意力机制,用于安防/医疗);
国产适配:UE8M0 FP8 精度
DeepSeek-V3.1 首次引入了 UE8M0 FP8 Scale 参数精度,这是专为下一代国产 AI 芯片量身设计的浮点格式,在硬件适配上,为国产生态预留了接口,优化了在国产硬件上的运行效率,在保持模型精度的前提下,将能耗降低了约30%—40%,吞吐效率提升近一倍。
优势:自然语言表达力最强,多模态交互流畅,支持实时语音+图像+文本对话;在创意写作和个性化助手方面领先。
不足:成本高、闭源依赖,企业无法本地部署。
优势:超长上下文(百万级 tokens),强大的视频理解能力;与 Google Docs、Gmail 等深度融合,科研和企业办公场景表现突出。
不足:中文处理和本地化适配较弱,过度依赖 Google 生态。
优势:
成本更低,思维链压缩减少调用费用;
本地化部署适合中国市场,合规性更强;
工业、医疗、教育等垂直领域精准优化;
不足:
多模态生成不够一体化(需借助外部工具);
普通用户使用门槛较高(需特定平台/本地部署);
在自然语言流畅度、创意表达上仍落后于 GPT-5;
DeepSeek 将采取 双轨战略:
API 商业化:9月6日后,调整价格,取消夜间优惠,聚焦企业级用户。
开源生态:V3.1 基础模型已同步开放 Hugging Face 与魔搭平台。
这兼顾了 开源共享与商业闭环,形成可持续发展。