找回密码
 加入我们
搜索
      
查看: 1681|回复: 21

[软件] 请教一下怎么区分DeepSeek的版本问题?

[复制链接]
发表于 2025-2-27 11:26 | 显示全部楼层 |阅读模式
本帖最后由 MDC 于 2025-2-27 14:29 编辑

请教下大佬们,有什么验证机制,能验证API给的哪个模型,是满血671B还是用的是量化或者蒸馏版本?就是公司找了第三方提供Api,但是说的是671B,如果偷偷换了什么70b或者1.58 1.72量化版本。我怎么知道呢?
________________________________________________________________________________
一轮测试,官网版,英伟达版本,还有钉钉内置671B基本上都回答正确。
硅基流动 对了一半,可能用的量化版本?
阿里云百练直接答错/不知道怎么搞的。
32 70b这种蒸馏的也是翻车。
 楼主| 发表于 2025-2-27 11:27 | 显示全部楼层
顺便请教下大佬们,你们用的什么联网搜索的API啊?还是说duckgogo这种免费的?
发表于 2025-2-27 11:46 | 显示全部楼层
最近的研究,蒸馏版喜欢overthinking。
发表于 2025-2-27 11:48 | 显示全部楼层
我一般问两个问题,strawberry有几个r,以及左边木右边乞是什么字,只有671b回答是又快又准
 楼主| 发表于 2025-2-27 12:14 | 显示全部楼层
ziehie107 发表于 2025-2-27 11:48
我一般问两个问题,strawberry有几个r,以及左边木右边乞是什么字,只有671b回答是又快又准 ...

是不是还有古诗的?其次是1.58这种R1量化的不是蒸馏的,是不是也会准确?
发表于 2025-2-27 12:35 | 显示全部楼层
MDC 发表于 2025-2-27 12:14
是不是还有古诗的?其次是1.58这种R1量化的不是蒸馏的,是不是也会准确? ...

1.58bit的三元值量化相比fp8损失非常大,至少用2.22或者2.5
 楼主| 发表于 2025-2-27 14:07 | 显示全部楼层
平安是福 发表于 2025-2-27 12:35
1.58bit的三元值量化相比fp8损失非常大,至少用2.22或者2.5

对,我知道这个,但是比较好奇,怎么只通过api知道用的是哪版?
发表于 2025-2-27 14:49 | 显示全部楼层
MDC 发表于 2025-2-27 14:07
对,我知道这个,但是比较好奇,怎么只通过api知道用的是哪版?

不是DS官方重新放开了API的充值了吗,直接用原版的啊
发表于 2025-2-27 14:51 | 显示全部楼层
ziehie107 发表于 2025-2-27 11:48
我一般问两个问题,strawberry有几个r,以及左边木右边乞是什么字,只有671b回答是又快又准 ...

"strawberry有几个r" 这个问题厉害啊

我用deepseek官网问这个问题, 开启深度思考(r1)
捕获.PNG

居然用了250秒, 并且打开思考过程好像是陷入无限循环中.

蒸馏模型32B会答错, 70B就能够正确回答了

发表于 2025-2-27 14:53 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
发表于 2025-2-27 14:57 | 显示全部楼层
atlantis414 发表于 2025-2-27 14:51
"strawberry有几个r" 这个问题厉害啊

我用deepseek官网问这个问题, 开启深度思考(r1)

我本地部署的70b有时候会答错,但671b一直是很准的
发表于 2025-2-27 15:43 | 显示全部楼层
直接看模型文件大小或者占用的空间
就算是671B,还有不同精度的版本,回答问题是有区别的。
发表于 2025-2-27 18:27 | 显示全部楼层
atlantis414 发表于 2025-2-27 14:51
"strawberry有几个r" 这个问题厉害啊

我用deepseek官网问这个问题, 开启深度思考(r1)

因为中文互联网上有一些错误答案,ds自己思考然后对比网上的答案发现不一样就会再验证再思考
发表于 2025-2-27 19:24 | 显示全部楼层
c2h6o 发表于 2025-2-27 07:43
直接看模型文件大小或者占用的空间
就算是671B,还有不同精度的版本,回答问题是有区别的。 ...

api不会给你返回文件大小的
发表于 2025-2-27 19:25 | 显示全部楼层
MDC 发表于 2025-2-27 03:27
顺便请教下大佬们,你们用的什么联网搜索的API啊?还是说duckgogo这种免费的?
...

google pse 就论坛右上角那个
发表于 2025-2-27 19:45 | 显示全部楼层
硅基流动的671b回答几个r的问题陷入了死循环了快,难道不是满血版?

点评

最后答对了,但是花了8399个tokens  发表于 2025-2-27 19:55
发表于 2025-2-27 19:59 | 显示全部楼层
这个问题在我mac上跑的的32b的回答是对的
发表于 2025-2-27 20:12 | 显示全部楼层
YsHaNg 发表于 2025-2-27 19:24
api不会给你返回文件大小的

光靠问题只能大概判断,同一个问题多问几次可能结果每次都不完全一样。
 楼主| 发表于 2025-2-27 20:30 | 显示全部楼层
c2h6o 发表于 2025-2-27 20:12
光靠问题只能大概判断,同一个问题多问几次可能结果每次都不完全一样。 ...

那你有好办法么
发表于 2025-2-27 21:41 | 显示全部楼层
就用官网API就行,最近能冲值了,费用也正在优惠期间
发表于 2025-2-28 08:33 | 显示全部楼层
问他微信的微是几笔 答对了就是 70B 以上
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2025-4-26 19:36 , Processed in 0.012198 second(s), 7 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表