DeepSeek-V3.1正式发布 迈向Agent时代第一步
原文地址:https://www.expreview.com/101322.htmlDeepSeek-V3.1今天正式发布,本次升级包含以下主要变化:
混合推理架构 - 一个模型同时支持思考模式与非思考模式;
更高的思考效率 - 相比DeepSeek-R1-0528,DeepSeek-V3.1-Think能在更短时间内给出答案;
更强的Agent能力 - 通过Post-Training优化,新模型在工具使用与智能体任务中的表现有较大提升。
官方App与网页端模型已同步升级。用户可以通过“深度思考”按钮,实现思考模式与非思考模式的自由切换。
DeepSeek API也已同步升级,deepseek-chat对应非思考模式,deepseek-reasoner对应思考模式,且上下文均已扩展为128K。同时API Beta接口支持了strict模式的Function Calling,以确保输出的Function满足schema定义。
这次还增加了对Anthropic API格式的支持,让大家可以轻松将DeepSeek-V3.1的能力接入Claude Code框架。
官方称,在代码修复测评SWE与命令行终端环境下的复杂任务(Terminal-Bench)测试中,DeepSeek-V3.1相比之前的 DeepSeek 系列模型有明显提高。
另外DeepSeek-V3.1在多项搜索评测指标上取得了较大提升,在需要多步推理的复杂搜索测试(browsecomp)与多学科专家级难题测试(HLE)上,DeepSeek-V3.1性能已大幅领先R1-0528。
测试结果显示,经过思维链压缩训练后,V3.1-Think在输出token数减少20%-50%的情况下,各项任务的平均表现与R1-0528持平。同时V3.1在非思考模式下的输出长度也得到了有效控制,相比于DeepSeek-V3-0324 ,能够在输出长度明显减少的情况下保持相同的模型性能。
去看了一下,价格也要变了 邪恶的光B 发表于 2025-8-21 17:41
去看了一下,价格也要变了
这不蛮正常的么,刚开始电视机顶盒里面的视频都是免费的,现在大都不是收费了么。 fn109 发表于 2025-8-21 21:49
这不蛮正常的么,刚开始电视机顶盒里面的视频都是免费的,现在大都不是收费了么。 ...
是正常啊,该赚钱还是要赚钱的,不能大家都去当慈善家。[偷笑][偷笑][偷笑] DeepSeek确实是我国大模型中相当有水平的一个,不过这有点故意吹了。看评测这一版的改进不算太大。应该把主要精力都集中在适配华为的NPU上了。目前我国大模型最领先的应该还是Qwen 这个版本据说进步不大,甚至有退步 api变了吗?改API又得去改连接设置 好久没有G P T消息啊 bigmanlei 发表于 2025-8-22 08:30
这个版本据说进步不大,甚至有退步
然而重点是DS官方在评论区的一条回复,适配下一代国产计算芯片 看股市就知道了,纯炒作 82瓦力 发表于 2025-8-22 08:58
好久没有G P T消息啊
我经常做对比。deepseek差人家太多了。。。。太多了。。。。。 apt04 发表于 2025-8-22 10:53
我经常做对比。deepseek差人家太多了。。。。太多了。。。。。
果真如此吗? 但现实的新闻看上去,感觉chat**也没多好,旗鼓相当。 DS 的核心问题是敏感词太多 fairness 发表于 2025-8-22 12:29
果真如此吗? 但现实的新闻看上去,感觉chat**也没多好,旗鼓相当。
可以经常对同一个问题,多比对。 bigmanlei 发表于 2025-8-22 08:30
这个版本据说进步不大,甚至有退步
有退步很正常。。。很多问题都被人为干涉了。还不如刚开始的版本
没戏了已经 deepseek我3月份用的时候还挺好用,现在有点不够看了 繼續用Qwen[睡觉] apt04 发表于 2025-8-22 10:53
我经常做对比。deepseek差人家太多了。。。。太多了。。。。。
最早用Kimi,现在主用豆包,deepseek几乎没怎么用,回答不稳定,还慢。 apt04 发表于 2025-8-22 10:53
我经常做对比。deepseek差人家太多了。。。。太多了。。。。。
用来学习语言 比如:英文法文,是不是差不多? digitalgk111 发表于 2025-9-2 18:35
用来学习语言 比如:英文法文,是不是差不多?
这个我就没基础比对语言类的。我只对比了编程方面的。
页:
[1]