找回密码
 加入我们
搜索
      
查看: 1560|回复: 4

[其他] DeepSeek-V3.1正式发布 迈向Agent时代第一步

[复制链接]
发表于 2025-8-21 17:35 | 显示全部楼层 |阅读模式
原文地址:https://www.expreview.com/101322.html
DeepSeek-V3.1今天正式发布,本次升级包含以下主要变化:

混合推理架构 - 一个模型同时支持思考模式与非思考模式;

更高的思考效率 - 相比DeepSeek-R1-0528,DeepSeek-V3.1-Think能在更短时间内给出答案;

更强的Agent能力 - 通过Post-Training优化,新模型在工具使用与智能体任务中的表现有较大提升。

官方App与网页端模型已同步升级。用户可以通过“深度思考”按钮,实现思考模式与非思考模式的自由切换。
1.jpg
DeepSeek API也已同步升级,deepseek-chat对应非思考模式,deepseek-reasoner对应思考模式,且上下文均已扩展为128K。同时API Beta接口支持了strict模式的Function Calling,以确保输出的Function满足schema定义。

这次还增加了对Anthropic API格式的支持,让大家可以轻松将DeepSeek-V3.1的能力接入Claude Code框架。
2.jpg
官方称,在代码修复测评SWE与命令行终端环境下的复杂任务(Terminal-Bench)测试中,DeepSeek-V3.1相比之前的 DeepSeek 系列模型有明显提高。
3.jpg
另外DeepSeek-V3.1在多项搜索评测指标上取得了较大提升,在需要多步推理的复杂搜索测试(browsecomp)与多学科专家级难题测试(HLE)上,DeepSeek-V3.1性能已大幅领先R1-0528。
4.jpg
测试结果显示,经过思维链压缩训练后,V3.1-Think在输出token数减少20%-50%的情况下,各项任务的平均表现与R1-0528持平。同时V3.1在非思考模式下的输出长度也得到了有效控制,相比于DeepSeek-V3-0324 ,能够在输出长度明显减少的情况下保持相同的模型性能。

评分

参与人数 1邪恶指数 +20 收起 理由
灯下狐 + 20

查看全部评分

发表于 2025-8-21 17:41 | 显示全部楼层
去看了一下,价格也要变了
发表于 2025-8-21 21:49 | 显示全部楼层
邪恶的光B 发表于 2025-8-21 17:41
去看了一下,价格也要变了

这不蛮正常的么,刚开始电视机顶盒里面的视频都是免费的,现在大都不是收费了么。
发表于 2025-8-21 21:54 | 显示全部楼层
fn109 发表于 2025-8-21 21:49
这不蛮正常的么,刚开始电视机顶盒里面的视频都是免费的,现在大都不是收费了么。 ...

是正常啊,该赚钱还是要赚钱的,不能大家都去当慈善家。
发表于 2025-8-21 23:05 | 显示全部楼层
DeepSeek确实是我国大模型中相当有水平的一个,不过这有点故意吹了。看评测这一版的改进不算太大。应该把主要精力都集中在适配华为的NPU上了。目前我国大模型最领先的应该还是Qwen
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2025-8-22 04:42 , Processed in 0.009060 second(s), 7 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表