hawie 发表于 2025-3-8 14:46
这是大模型的普遍状态,多问几遍,甚至可能告诉你它是OpenAI。这些大模型相互用别家的数据蒸馏,什么都可 ...
讨论一下。
这个是有比较清晰地解释,不是蒸馏的原因,因为满血版是通过互联网文本数据训练语言相关内容,而22年最早的llm chat**上市后大量的询问类似"你是谁"的问题,而基于llm这类大模型的技术框架,概率高的答案必然最容易出现。
deepseek采用的grpo,也不过是回答16个方案下,选取出现最多的那个答案作为reward的正确答案参考,本质还是概率。归根到底,还是数据中的概率问题。
补充一下,reward采用啥,是这几年llm发展,google、openai、deepmind的一些论文讨论的很多,因为这个是RL中的难点, hawie 发表于 2025-3-8 14:46
这是大模型的普遍状态,多问几遍,甚至可能告诉你它是OpenAI。这些大模型相互用别家的数据蒸馏,什么都可 ...
学习了,谢谢[可爱] powerduke 发表于 2025-3-8 15:00
讨论一下。
这个是有比较清晰地解释,不是蒸馏的原因,因为满血版是通过互联网文本数据训练语言相关内容 ...
谢谢分享[可爱] 本地部署更为是为了不shemi loughlion 发表于 2025-3-8 11:37
要注册,好像有期限,超过期限收费。
腾讯的元宝不是已经接入R1满血版了吗?目前免费。
阿里云刚发布没两天 ...
问qwq第一个问题直接答错了,干掉我2w tokens pdww269hit 发表于 2025-3-8 20:43
问qwq第一个问题直接答错了,干掉我2w tokens
我和你体验相反 试试下边这道题,很多号称满血的跑几分钟就没下文了或者得出错误答案,原版没问题,大概跑7、8分钟能得出正确答案:三分之根号三。
-----------------------------------------------------------------------------------------------------------------------------
在平面四边形ABCD中,AB = AC = CD = 1,\angle ADC = 30^{\circ},\angle DAB = 120^{\circ}。将\triangle ACD沿AC翻折至\triangle ACP,其中P为动点。 求二面角A - CP - B的余弦值的最小值。 robles 发表于 2025-3-9 08:56
试试下边这道题,很多号称满血的跑几分钟就没下文了或者得出错误答案,原版没问题,大概跑7、8分钟能得出正 ...
答案正确,
看到最后一行,没把格式显示出来,这应该算是客户端的问题。于是重新算了一遍,也是一样,结果也对,看来客户端要更新了。
很高兴又收集到一道这样的题。谢谢了。 按照网上的部署方式,不知为何都是“DeepSeek-R1 的无服务器 API 部署”。找不到其他方式。 taichow 发表于 2025-3-9 11:30
按照网上的部署方式,不知为何都是“DeepSeek-R1 的无服务器 API 部署”。找不到其他方式。 ...
谢谢!发现开始收费了。
DeepSeek R1 定价
通过这些优化,DeepSeek R1 现在提供了良好的性价比。无论您是构建聊天机器人、文档摘要工具还是 AI 驱动的搜索体验,您都可以以具有竞争力的成本获得高质量的模型,从而更轻松地扩展 AI 工作负载,而不会花费大量资金。
型号 SKU 以美元(1K 代币)为单位的输入定价 以美元为单位的输出定价(1K 代币)
DeepSeek-R1 全球版 0.00135 美元 0.0054 美元
DeepSeek-R1 区域 0.001485 美元 0.00594 美元 好麻烦 azure ai foundry openai api和普通的openai api还不一样 得用LiteLLM转译才能在open webui里用 算了我还是去薅Google羊毛吧 反正Gemini2.0pro也是免费用 taichow 发表于 2025-3-11 01:02
谢谢!发现开始收费了。
DeepSeek R1 定价
楼主还没吹完呢就收费了[偷笑]
页:
1
[2]