找回密码
 加入我们
搜索
      
楼主: hawie

[显卡] 远离本地部署,API访问性能天花板

[复制链接]
发表于 2025-3-8 15:00 | 显示全部楼层
本帖最后由 powerduke 于 2025-3-8 15:04 编辑
hawie 发表于 2025-3-8 14:46
这是大模型的普遍状态,多问几遍,甚至可能告诉你它是OpenAI。这些大模型相互用别家的数据蒸馏,什么都可 ...


讨论一下。

这个是有比较清晰地解释,不是蒸馏的原因,因为满血版是通过互联网文本数据训练语言相关内容,而22年最早的llm chat**上市后大量的询问类似"你是谁"的问题,而基于llm这类大模型的技术框架,概率高的答案必然最容易出现。

deepseek采用的grpo,也不过是回答16个方案下,选取出现最多的那个答案作为reward的正确答案参考,本质还是概率。归根到底,还是数据中的概率问题。

补充一下,reward采用啥,是这几年llm发展,google、openai、deepmind的一些论文讨论的很多,因为这个是RL中的难点,
发表于 2025-3-8 15:00 | 显示全部楼层
hawie 发表于 2025-3-8 14:46
这是大模型的普遍状态,多问几遍,甚至可能告诉你它是OpenAI。这些大模型相互用别家的数据蒸馏,什么都可 ...

学习了,谢谢
发表于 2025-3-8 15:07 | 显示全部楼层
powerduke 发表于 2025-3-8 15:00
讨论一下。

这个是有比较清晰地解释,不是蒸馏的原因,因为满血版是通过互联网文本数据训练语言相关内容 ...

谢谢分享
发表于 2025-3-8 15:31 | 显示全部楼层
本地部署更为是为了不shemi
发表于 2025-3-8 20:43 | 显示全部楼层
loughlion 发表于 2025-3-8 11:37
要注册,好像有期限,超过期限收费。
腾讯的元宝不是已经接入R1满血版了吗?目前免费。
阿里云刚发布没两天 ...

问qwq第一个问题直接答错了,干掉我2w tokens
发表于 2025-3-8 21:02 | 显示全部楼层
pdww269hit 发表于 2025-3-8 20:43
问qwq第一个问题直接答错了,干掉我2w tokens

我和你体验相反
发表于 2025-3-9 08:56 | 显示全部楼层
试试下边这道题,很多号称满血的跑几分钟就没下文了或者得出错误答案,原版没问题,大概跑7、8分钟能得出正确答案:三分之根号三。
-----------------------------------------------------------------------------------------------------------------------------
在平面四边形ABCD中,AB = AC = CD = 1,\angle ADC = 30^{\circ},\angle DAB = 120^{\circ}。将\triangle ACD沿AC翻折至\triangle ACP,其中P为动点。 求二面角A - CP - B的余弦值的最小值。

评分

参与人数 1邪恶指数 +10 收起 理由
hawie + 10

查看全部评分

 楼主| 发表于 2025-3-9 09:56 | 显示全部楼层
robles 发表于 2025-3-9 08:56
试试下边这道题,很多号称满血的跑几分钟就没下文了或者得出错误答案,原版没问题,大概跑7、8分钟能得出正 ...

截屏2025-03-09 09.38.36.png

答案正确,
看到最后一行,没把格式显示出来,这应该算是客户端的问题。于是重新算了一遍,也是一样,结果也对,看来客户端要更新了。
截屏2025-03-09 09.52.53.png

很高兴又收集到一道这样的题。谢谢了。
发表于 2025-3-9 11:30 | 显示全部楼层
按照网上的部署方式,不知为何都是“DeepSeek-R1 的无服务器 API 部署”。找不到其他方式。

点评

28#楼,有提示。  发表于 2025-3-9 18:47
发表于 2025-3-11 01:02 | 显示全部楼层
taichow 发表于 2025-3-9 11:30
按照网上的部署方式,不知为何都是“DeepSeek-R1 的无服务器 API 部署”。找不到其他方式。 ...

谢谢!发现开始收费了。
DeepSeek R1 定价

通过这些优化,DeepSeek R1 现在提供了良好的性价比。无论您是构建聊天机器人、文档摘要工具还是 AI 驱动的搜索体验,您都可以以具有竞争力的成本获得高质量的模型,从而更轻松地扩展 AI 工作负载,而不会花费大量资金。

型号 SKU        以美元(1K 代币)为单位的输入定价        以美元为单位的输出定价(1K 代币)
DeepSeek-R1 全球版        0.00135 美元        0.0054 美元
DeepSeek-R1 区域        0.001485 美元        0.00594 美元
发表于 2025-3-11 05:35 来自手机 | 显示全部楼层
好麻烦 azure ai foundry openai api和普通的openai api还不一样 得用LiteLLM转译才能在open webui里用 算了我还是去薅Google羊毛吧 反正Gemini2.0pro也是免费用
发表于 2025-3-11 06:51 | 显示全部楼层
taichow 发表于 2025-3-11 01:02
谢谢!发现开始收费了。
DeepSeek R1 定价

楼主还没吹完呢就收费了
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2025-4-26 22:07 , Processed in 0.010804 second(s), 7 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表