DeepSeek-V3.1正式发布迈向Agent时代第一步

false 发表于 2025-8-21 17:35

原文地址：https://www.expreview.com/101322.html
DeepSeek-V3.1今天正式发布，本次升级包含以下主要变化：

混合推理架构 - 一个模型同时支持思考模式与非思考模式；

更高的思考效率 - 相比DeepSeek-R1-0528，DeepSeek-V3.1-Think能在更短时间内给出答案；

更强的Agent能力 - 通过Post-Training优化，新模型在工具使用与智能体任务中的表现有较大提升。

官方App与网页端模型已同步升级。用户可以通过“深度思考”按钮，实现思考模式与非思考模式的自由切换。

DeepSeek API也已同步升级，deepseek-chat对应非思考模式，deepseek-reasoner对应思考模式，且上下文均已扩展为128K。同时API Beta接口支持了strict模式的Function Calling，以确保输出的Function满足schema定义。

这次还增加了对Anthropic API格式的支持，让大家可以轻松将DeepSeek-V3.1的能力接入Claude Code框架。

官方称，在代码修复测评SWE与命令行终端环境下的复杂任务（Terminal-Bench）测试中，DeepSeek-V3.1相比之前的 DeepSeek 系列模型有明显提高。

另外DeepSeek-V3.1在多项搜索评测指标上取得了较大提升，在需要多步推理的复杂搜索测试（browsecomp）与多学科专家级难题测试（HLE）上，DeepSeek-V3.1性能已大幅领先R1-0528。

测试结果显示，经过思维链压缩训练后，V3.1-Think在输出token数减少20%-50%的情况下，各项任务的平均表现与R1-0528持平。同时V3.1在非思考模式下的输出长度也得到了有效控制，相比于DeepSeek-V3-0324 ，能够在输出长度明显减少的情况下保持相同的模型性能。

邪恶的光B 发表于 2025-8-21 17:41

去看了一下，价格也要变了

fn109 发表于 2025-8-21 21:49

邪恶的光B 发表于 2025-8-21 17:41
去看了一下，价格也要变了

这不蛮正常的么，刚开始电视机顶盒里面的视频都是免费的，现在大都不是收费了么。

邪恶的光B 发表于 2025-8-21 21:54

fn109 发表于 2025-8-21 21:49
这不蛮正常的么，刚开始电视机顶盒里面的视频都是免费的，现在大都不是收费了么。 ...

是正常啊，该赚钱还是要赚钱的，不能大家都去当慈善家。[偷笑][偷笑][偷笑]

jilang 发表于 2025-8-21 23:05

DeepSeek确实是我国大模型中相当有水平的一个，不过这有点故意吹了。看评测这一版的改进不算太大。应该把主要精力都集中在适配华为的NPU上了。目前我国大模型最领先的应该还是Qwen

bigmanlei 发表于 2025-8-22 08:30

这个版本据说进步不大，甚至有退步

hawie 发表于 2025-8-22 08:50

api变了吗？改API又得去改连接设置

82瓦力 发表于 2025-8-22 08:58

好久没有G P T消息啊

MolaMola 发表于 2025-8-22 09:26

bigmanlei 发表于 2025-8-22 08:30
这个版本据说进步不大，甚至有退步

然而重点是DS官方在评论区的一条回复，适配下一代国产计算芯片

fmk989 发表于 2025-8-22 10:36

看股市就知道了，纯炒作

apt04 发表于 2025-8-22 10:53

82瓦力发表于 2025-8-22 08:58
好久没有G P T消息啊

我经常做对比。deepseek差人家太多了。。。。太多了。。。。。

fairness 发表于 2025-8-22 12:29

apt04 发表于 2025-8-22 10:53
我经常做对比。deepseek差人家太多了。。。。太多了。。。。。

果真如此吗？但现实的新闻看上去，感觉chat**也没多好，旗鼓相当。

windyboy 发表于 2025-8-22 12:30

DS 的核心问题是敏感词太多

apt04 发表于 2025-8-22 13:13

fairness 发表于 2025-8-22 12:29
果真如此吗？但现实的新闻看上去，感觉chat**也没多好，旗鼓相当。

可以经常对同一个问题，多比对。

momo77989724 发表于 2025-8-22 14:52

bigmanlei 发表于 2025-8-22 08:30
这个版本据说进步不大，甚至有退步

有退步很正常。。。很多问题都被人为干涉了。还不如刚开始的版本
没戏了已经

sunchen 发表于 2025-8-22 14:54

deepseek我3月份用的时候还挺好用，现在有点不够看了

tangex 发表于 2025-8-23 12:25

繼續用Qwen[睡觉]

qwxfh 发表于 2025-8-31 19:49

apt04 发表于 2025-8-22 10:53
我经常做对比。deepseek差人家太多了。。。。太多了。。。。。

最早用Kimi，现在主用豆包，deepseek几乎没怎么用，回答不稳定，还慢。

digitalgk111 发表于 2025-9-2 18:35

apt04 发表于 2025-8-22 10:53
我经常做对比。deepseek差人家太多了。。。。太多了。。。。。

用来学习语言比如：英文法文，是不是差不多？

apt04 发表于 2025-9-2 19:38

digitalgk111 发表于 2025-9-2 18:35
用来学习语言比如：英文法文，是不是差不多？

这个我就没基础比对语言类的。我只对比了编程方面的。

页: [1]

Chiphell - 分享与交流用户体验's Archiver

DeepSeek-V3.1正式发布 迈向Agent时代第一步

DeepSeek-V3.1正式发布迈向Agent时代第一步