false 发表于 2025-8-21 17:35

DeepSeek-V3.1正式发布 迈向Agent时代第一步

原文地址:https://www.expreview.com/101322.html
DeepSeek-V3.1今天正式发布,本次升级包含以下主要变化:

混合推理架构 - 一个模型同时支持思考模式与非思考模式;

更高的思考效率 - 相比DeepSeek-R1-0528,DeepSeek-V3.1-Think能在更短时间内给出答案;

更强的Agent能力 - 通过Post-Training优化,新模型在工具使用与智能体任务中的表现有较大提升。

官方App与网页端模型已同步升级。用户可以通过“深度思考”按钮,实现思考模式与非思考模式的自由切换。

DeepSeek API也已同步升级,deepseek-chat对应非思考模式,deepseek-reasoner对应思考模式,且上下文均已扩展为128K。同时API Beta接口支持了strict模式的Function Calling,以确保输出的Function满足schema定义。

这次还增加了对Anthropic API格式的支持,让大家可以轻松将DeepSeek-V3.1的能力接入Claude Code框架。

官方称,在代码修复测评SWE与命令行终端环境下的复杂任务(Terminal-Bench)测试中,DeepSeek-V3.1相比之前的 DeepSeek 系列模型有明显提高。

另外DeepSeek-V3.1在多项搜索评测指标上取得了较大提升,在需要多步推理的复杂搜索测试(browsecomp)与多学科专家级难题测试(HLE)上,DeepSeek-V3.1性能已大幅领先R1-0528。

测试结果显示,经过思维链压缩训练后,V3.1-Think在输出token数减少20%-50%的情况下,各项任务的平均表现与R1-0528持平。同时V3.1在非思考模式下的输出长度也得到了有效控制,相比于DeepSeek-V3-0324 ,能够在输出长度明显减少的情况下保持相同的模型性能。

邪恶的光B 发表于 2025-8-21 17:41

去看了一下,价格也要变了

fn109 发表于 2025-8-21 21:49

邪恶的光B 发表于 2025-8-21 17:41
去看了一下,价格也要变了

这不蛮正常的么,刚开始电视机顶盒里面的视频都是免费的,现在大都不是收费了么。

邪恶的光B 发表于 2025-8-21 21:54

fn109 发表于 2025-8-21 21:49
这不蛮正常的么,刚开始电视机顶盒里面的视频都是免费的,现在大都不是收费了么。 ...

是正常啊,该赚钱还是要赚钱的,不能大家都去当慈善家。[偷笑][偷笑][偷笑]

jilang 发表于 2025-8-21 23:05

DeepSeek确实是我国大模型中相当有水平的一个,不过这有点故意吹了。看评测这一版的改进不算太大。应该把主要精力都集中在适配华为的NPU上了。目前我国大模型最领先的应该还是Qwen

bigmanlei 发表于 2025-8-22 08:30

这个版本据说进步不大,甚至有退步

hawie 发表于 2025-8-22 08:50

api变了吗?改API又得去改连接设置

82瓦力 发表于 2025-8-22 08:58

好久没有G P T消息啊

MolaMola 发表于 2025-8-22 09:26

bigmanlei 发表于 2025-8-22 08:30
这个版本据说进步不大,甚至有退步

然而重点是DS官方在评论区的一条回复,适配下一代国产计算芯片

fmk989 发表于 2025-8-22 10:36

看股市就知道了,纯炒作

apt04 发表于 2025-8-22 10:53

82瓦力 发表于 2025-8-22 08:58
好久没有G P T消息啊

我经常做对比。deepseek差人家太多了。。。。太多了。。。。。

fairness 发表于 2025-8-22 12:29

apt04 发表于 2025-8-22 10:53
我经常做对比。deepseek差人家太多了。。。。太多了。。。。。

果真如此吗? 但现实的新闻看上去,感觉chat**也没多好,旗鼓相当。

windyboy 发表于 2025-8-22 12:30

DS 的核心问题是敏感词太多

apt04 发表于 2025-8-22 13:13

fairness 发表于 2025-8-22 12:29
果真如此吗? 但现实的新闻看上去,感觉chat**也没多好,旗鼓相当。

可以经常对同一个问题,多比对。

momo77989724 发表于 2025-8-22 14:52

bigmanlei 发表于 2025-8-22 08:30
这个版本据说进步不大,甚至有退步

有退步很正常。。。很多问题都被人为干涉了。还不如刚开始的版本
没戏了已经

sunchen 发表于 2025-8-22 14:54

deepseek我3月份用的时候还挺好用,现在有点不够看了

tangex 发表于 2025-8-23 12:25

繼續用Qwen[睡觉]

qwxfh 发表于 2025-8-31 19:49

apt04 发表于 2025-8-22 10:53
我经常做对比。deepseek差人家太多了。。。。太多了。。。。。

最早用Kimi,现在主用豆包,deepseek几乎没怎么用,回答不稳定,还慢。

digitalgk111 发表于 2025-9-2 18:35

apt04 发表于 2025-8-22 10:53
我经常做对比。deepseek差人家太多了。。。。太多了。。。。。

用来学习语言 比如:英文法文,是不是差不多?

apt04 发表于 2025-9-2 19:38

digitalgk111 发表于 2025-9-2 18:35
用来学习语言 比如:英文法文,是不是差不多?

这个我就没基础比对语言类的。我只对比了编程方面的。
页: [1]
查看完整版本: DeepSeek-V3.1正式发布 迈向Agent时代第一步