找回密码
 加入我们
搜索
      
查看: 3495|回复: 15

[其他] DeepSeek-V3.1正式发布 迈向Agent时代第一步

[复制链接]
发表于 2025-8-21 17:35 | 显示全部楼层 |阅读模式
原文地址:https://www.expreview.com/101322.html
DeepSeek-V3.1今天正式发布,本次升级包含以下主要变化:

混合推理架构 - 一个模型同时支持思考模式与非思考模式;

更高的思考效率 - 相比DeepSeek-R1-0528,DeepSeek-V3.1-Think能在更短时间内给出答案;

更强的Agent能力 - 通过Post-Training优化,新模型在工具使用与智能体任务中的表现有较大提升。

官方App与网页端模型已同步升级。用户可以通过“深度思考”按钮,实现思考模式与非思考模式的自由切换。
1.jpg
DeepSeek API也已同步升级,deepseek-chat对应非思考模式,deepseek-reasoner对应思考模式,且上下文均已扩展为128K。同时API Beta接口支持了strict模式的Function Calling,以确保输出的Function满足schema定义。

这次还增加了对Anthropic API格式的支持,让大家可以轻松将DeepSeek-V3.1的能力接入Claude Code框架。
2.jpg
官方称,在代码修复测评SWE与命令行终端环境下的复杂任务(Terminal-Bench)测试中,DeepSeek-V3.1相比之前的 DeepSeek 系列模型有明显提高。
3.jpg
另外DeepSeek-V3.1在多项搜索评测指标上取得了较大提升,在需要多步推理的复杂搜索测试(browsecomp)与多学科专家级难题测试(HLE)上,DeepSeek-V3.1性能已大幅领先R1-0528。
4.jpg
测试结果显示,经过思维链压缩训练后,V3.1-Think在输出token数减少20%-50%的情况下,各项任务的平均表现与R1-0528持平。同时V3.1在非思考模式下的输出长度也得到了有效控制,相比于DeepSeek-V3-0324 ,能够在输出长度明显减少的情况下保持相同的模型性能。

评分

参与人数 1邪恶指数 +20 收起 理由
灯下狐 + 20

查看全部评分

发表于 2025-8-21 17:41 | 显示全部楼层
去看了一下,价格也要变了
发表于 2025-8-21 21:49 | 显示全部楼层
邪恶的光B 发表于 2025-8-21 17:41
去看了一下,价格也要变了

这不蛮正常的么,刚开始电视机顶盒里面的视频都是免费的,现在大都不是收费了么。
发表于 2025-8-21 21:54 | 显示全部楼层
fn109 发表于 2025-8-21 21:49
这不蛮正常的么,刚开始电视机顶盒里面的视频都是免费的,现在大都不是收费了么。 ...

是正常啊,该赚钱还是要赚钱的,不能大家都去当慈善家。
发表于 2025-8-21 23:05 | 显示全部楼层
DeepSeek确实是我国大模型中相当有水平的一个,不过这有点故意吹了。看评测这一版的改进不算太大。应该把主要精力都集中在适配华为的NPU上了。目前我国大模型最领先的应该还是Qwen
发表于 2025-8-22 08:30 | 显示全部楼层
这个版本据说进步不大,甚至有退步
发表于 2025-8-22 08:50 | 显示全部楼层
api变了吗?改API又得去改连接设置
发表于 2025-8-22 08:58 | 显示全部楼层
好久没有G P T消息啊
发表于 2025-8-22 09:26 | 显示全部楼层
bigmanlei 发表于 2025-8-22 08:30
这个版本据说进步不大,甚至有退步

然而重点是DS官方在评论区的一条回复,适配下一代国产计算芯片
发表于 2025-8-22 10:36 | 显示全部楼层
看股市就知道了,纯炒作
发表于 2025-8-22 10:53 | 显示全部楼层
82瓦力 发表于 2025-8-22 08:58
好久没有G P T消息啊

我经常做对比。deepseek差人家太多了。。。。太多了。。。。。
发表于 2025-8-22 12:29 | 显示全部楼层
apt04 发表于 2025-8-22 10:53
我经常做对比。deepseek差人家太多了。。。。太多了。。。。。

果真如此吗? 但现实的新闻看上去,感觉chat**也没多好,旗鼓相当。
发表于 2025-8-22 12:30 | 显示全部楼层
DS 的核心问题是敏感词太多
发表于 2025-8-22 13:13 | 显示全部楼层
fairness 发表于 2025-8-22 12:29
果真如此吗? 但现实的新闻看上去,感觉chat**也没多好,旗鼓相当。


可以经常对同一个问题,多比对。
发表于 2025-8-22 14:52 | 显示全部楼层
bigmanlei 发表于 2025-8-22 08:30
这个版本据说进步不大,甚至有退步

有退步很正常。。。很多问题都被人为干涉了。还不如刚开始的版本
没戏了已经
发表于 2025-8-22 14:54 | 显示全部楼层
deepseek我3月份用的时候还挺好用,现在有点不够看了
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2025-8-23 06:10 , Processed in 0.050207 second(s), 6 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表