IT之家 8 月 21 日音书,深度求索官方当天发达对外发布 DeepSeek-V3.1。本次升级包含以下主要变化:
夹杂推理架构:一个模子同期支持念念考形态与非念念考形态;更高的念念考效果:比拟 DeepSeek-R1-0528,DeepSeek-V3.1-Think 能在更短时间内给出谜底;更强的 Agent 才调:通过 Post-Training 优化,新模子在用具使用与智能体任务中的施展存较大莳植。官方 App 与网页端模子已同步升级为 DeepSeek-V3.1。用户不错通过“深度念念考”按钮,结束念念考形态与非念念考形态的目田切换。
DeepSeek API 也已同步升级,deepseek-chat 对应非念念考形态,deepseek-reasoner 对应念念考形态,且险峻文均已膨胀为 128K。同期,API Beta 接口支持了 strict 形态的 Function Calling,以确保输出的 Function 炫夸 schema 界说。
另外,深度求索增多了对 Anthropic API 才能的支持,让用户不错将 DeepSeek-V3.1 的才调接入 Claude Code 框架。
用具调用 / 智能体支持增强编程智能体在代码确立测评 SWE 与高歌行结尾环境下的复杂任务(Terminal-Bench)测试中,DeepSeek-V3.1 比拟之前的 DeepSeek 系列模子有显然提高。
搜索智能体DeepSeek-V3.1 在多项搜索评测打算上获取了较大莳植。在需要多步推理的复杂搜索测试(browsecomp)与多学科大家级困难测试(HLE)上,DeepSeek-V3.1 性能已大幅进步 R1-0528。
念念考效果莳植深度求索官方的测试收尾露馅,过程念念维链压缩覆按后,V3.1-Think 在输出 token 数减少 20%-50% 的情况下,各项任务的平均施展与 R1-0528 握平。
同期,V3.1 在非念念考形态下的输出长度也得到了灵验截止,比拟于 DeepSeek-V3-0324 ,大约在输出长度显然减少的情况下保握疏通的模子性能。
API & 模子开源模子开源V3.1 的 Base 模子在 V3 的基础上再行作念了外扩覆按,一共增多覆按了 840B tokens。Base 模子与后覆按模子均已在 Huggingface 与魔搭开源。IT之家附开源地址:
Base 模子:
Hugging Face:魔搭:后覆按模子:
Hugging Face:魔搭:需要瞩主义是,DeepSeek-V3.1 使用了 UE8M0 FP8 Scale 的参数精度。另外,V3.1 对分词器及 chat template 进行了较大调换,与 DeepSeek-V3 存在显然各别。提议有部署需求的用户仔细阅读新版讲解文档。
价钱调换深度求索将于北京时间 2025 年 9 月 6 日凌晨起,对 DeepSeek 盛开平台 API 接口调用价钱进行如下调换:
实践新版价钱表(如下图所示,详见订价页面);取消夜间时段优惠。在 9 月 6 日前开云(中国)Kaiyun·官方网站 - 登录入口,统共 API 就业仍按原价钱计策计费,用户可继续享受面前优惠。同期,为更好地炫夸用户的调用需求,深度求索已进一步扩容 API 就业资源。