你的位置:开云(中国)Kaiyun·官方网站 - 登录入口 > 资讯 > 开云(中国)Kaiyun·官方网站 - 登录入口结束念念考形态与非念念考形态的目田切换-开云(中国)Kaiyun·官方网站 - 登录入口
开云(中国)Kaiyun·官方网站 - 登录入口结束念念考形态与非念念考形态的目田切换-开云(中国)Kaiyun·官方网站 - 登录入口
发布日期:2025-08-23 06:43    点击次数:118

开云(中国)Kaiyun·官方网站 - 登录入口结束念念考形态与非念念考形态的目田切换-开云(中国)Kaiyun·官方网站 - 登录入口

IT之家 8 月 21 日音书,深度求索官方当天发达对外发布 DeepSeek-V3.1。本次升级包含以下主要变化:

夹杂推理架构:一个模子同期支持念念考形态与非念念考形态;更高的念念考效果:比拟 DeepSeek-R1-0528,DeepSeek-V3.1-Think 能在更短时间内给出谜底;更强的 Agent 才调:通过 Post-Training 优化,新模子在用具使用与智能体任务中的施展存较大莳植。

官方 App 与网页端模子已同步升级为 DeepSeek-V3.1。用户不错通过“深度念念考”按钮,结束念念考形态与非念念考形态的目田切换。

DeepSeek API 也已同步升级,deepseek-chat 对应非念念考形态,deepseek-reasoner 对应念念考形态,且险峻文均已膨胀为 128K。同期,API Beta 接口支持了 strict 形态的 Function Calling,以确保输出的 Function 炫夸 schema 界说。

另外,深度求索增多了对 Anthropic API 才能的支持,让用户不错将 DeepSeek-V3.1 的才调接入 Claude Code 框架。

用具调用 / 智能体支持增强编程智能体

▲ 编程智能体测评(SWE 使用里面框架测评,比拟开源框架 OpenHands 所需轮数更少;Terminal Bench 使用官方 Terminus 1 framework)

在代码确立测评 SWE 与高歌行结尾环境下的复杂任务(Terminal-Bench)测试中,DeepSeek-V3.1 比拟之前的 DeepSeek 系列模子有显然提高。

搜索智能体

▲ 搜索智能体测评(测试收尾调用商用搜索引擎 API + 网页过滤 + 128K context window;R1-0528 使用里面 workflow 形态测试;HLE 测试同期使用 python 与 search 用具)

DeepSeek-V3.1 在多项搜索评测打算上获取了较大莳植。在需要多步推理的复杂搜索测试(browsecomp)与多学科大家级困难测试(HLE)上,DeepSeek-V3.1 性能已大幅进步 R1-0528。

念念考效果莳植

深度求索官方的测试收尾露馅,过程念念维链压缩覆按后,V3.1-Think 在输出 token 数减少 20%-50% 的情况下,各项任务的平均施展与 R1-0528 握平。

▲ 在各项评测打算得分基本握平的情况下(AIME 2015: 87.5/88.4,GPQA: 81/80.1,liveCodeBench: 73.3/74.8),R1-0528 与 V3.1-Think 的 token 耗尽量对比图

同期,V3.1 在非念念考形态下的输出长度也得到了灵验截止,比拟于 DeepSeek-V3-0324 ,大约在输出长度显然减少的情况下保握疏通的模子性能。

API & 模子开源模子开源

V3.1 的 Base 模子在 V3 的基础上再行作念了外扩覆按,一共增多覆按了 840B tokens。Base 模子与后覆按模子均已在 Huggingface 与魔搭开源。IT之家附开源地址:

Base 模子:

Hugging Face:魔搭:

后覆按模子:

Hugging Face:魔搭:

需要瞩主义是,DeepSeek-V3.1 使用了 UE8M0 FP8 Scale 的参数精度。另外,V3.1 对分词器及 chat template 进行了较大调换,与 DeepSeek-V3 存在显然各别。提议有部署需求的用户仔细阅读新版讲解文档。

价钱调换

深度求索将于北京时间 2025 年 9 月 6 日凌晨起,对 DeepSeek 盛开平台 API 接口调用价钱进行如下调换:

实践新版价钱表(如下图所示,详见订价页面);取消夜间时段优惠。

在 9 月 6 日前开云(中国)Kaiyun·官方网站 - 登录入口,统共 API 就业仍按原价钱计策计费,用户可继续享受面前优惠。同期,为更好地炫夸用户的调用需求,深度求索已进一步扩容 API 就业资源。