一些人开始默不作声了
xcdry 发表于 2025-3-1 14:25
算法再高也得硬件支持,AI爆发以后算力根本不够,之前国内那些AI都是什么辣鸡玩意 ...
xcdry 发表于 2025-3-1 22:25
算法再高也得硬件支持,AI爆发以后算力根本不够,之前国内那些AI都是什么辣鸡玩意 ...


a010301208 发表于 2025-3-1 22:11
算力需求无上限,别只看眼前,不过英伟达垄断很快就无了。
未来人人都要有机器人,工厂,军队更是大量需要 ...
zlcrxp 发表于 2025-3-1 22:29
最大的利空是 老黄和openai的AI逻辑出现了瑕疵,他们之前经常说的就是2套理论,(1)力大出奇迹(奥特曼: ...
yangzi123aaa20 发表于 2025-3-2 01:07
算力无上限这点已经被G/PT4.5官宣打破了,成本提高了100倍,成绩只提高了4.5%,唯一亮点是“情商变高了” ...


a010301208 发表于 2025-3-2 01:36
黄世仁黄了不代表算力就够了,只不过别人也有机会了
算力不是只有训练才需要,你的这个前提是未来所有人 ...

yangzi123aaa20 发表于 2025-3-2 01:49
个人用的话需要的是大显存,API现在平均每用户也就20TK/s,这个速度用AMD那个新集显就能达成 ...

ykdo 发表于 2025-3-2 02:25
2500张H800的谣传你也信?
线上系统的实际统计数据
DeepSeek V3 和 R1 的所有服务均使用 H800 GPU,使用和训练一致的精度,即矩阵计算和 dispatch 传输采用和训练一致的 FP8 格式,core-attention 计算和 combine 传输采用和训练一致的 BF16,最大程度保证了服务效果。
另外,由于白天的服务负荷高,晚上的服务负荷低,因此我们实现了一套机制,在白天负荷高的时候,用所有节点部署推理服务。晚上负荷低的时候,减少推理节点,以用来做研究和训练。在最近的 24 小时里(北京时间 2025/02/27 12:00 至 2025/02/28 12:00),DeepSeek V3 和 R1 推理服务占用节点总和,峰值占用为 278 个节点,平均占用 226.75 个节点(每个节点为 8 个 H800 GPU)。
https://zhuanlan.zhihu.com/p/27181462601
3. Infrastructures
3.1. Compute Clusters
DeepSeek-V3 is trained on a cluster equipped with 2048 NVIDIA H800 GPUs. Each node in
the H800 cluster contains 8 GPUs connected by NVLink and NVSwitch within nodes.
gartour 发表于 2025-3-1 22:22
这不是1个月前就讨论烂了的话题吗。
怎么可能够用。现在的ai行业还在探索阶段,对算力需求如果不考虑预算 ...
ykdo 发表于 2025-3-2 02:25
2500张H800的谣传你也信?
碳水化合物 发表于 2025-3-2 03:18
DeepSeek官号在知乎上发的新专栏文章《DeepSeek-V3 / R1 推理系统概览》中提及的部分
278*8=2224
darkness66201 发表于 2025-3-1 22:15
没有人需要超过640KB内存
理智的边缘 发表于 2025-3-2 09:43
……下面人家都发了论文了,不懂英文可以去知乎上看中文版。上来就质疑就显得你很蠢。 ...
a010301208 发表于 2025-3-1 22:11
算力需求无上限,别只看眼前,不过英伟达垄断很快就无了。
未来人人都要有机器人,工厂,军队更是大量需要 ...
yangzi123aaa20 发表于 2025-3-2 01:10
长远来看我们都死了
现在美股七巨头的股价基本都靠“AGI五年内到来”支撑,算力越强越有可能抢到AGI门票 ...
理智的边缘 发表于 2025-3-2 09:48
NV在8卡H200节点上优化版本的性能(5899t/s)只有DS在8卡H800节点性能的~84%
a010301208 发表于 2025-3-1 22:11
算力需求无上限,别只看眼前,不过英伟达垄断很快就无了。
未来人人都要有机器人,工厂,军队更是大量需要 ...
理智的边缘 发表于 2025-3-2 09:48
我也不知道这帖子里,喷我的人是什么个心态。哪怕它去看一下deepseek的论文。
部署推理,用H800直接比B2 ...

wuxi001 发表于 2025-3-1 22:27
deepseek 自己曾经回答自己源自 CHAT**, 所以他们根本不用什么AI算力卡。有CHAT** 在,DEEPSEEK 就可以吸 ...
manwomans 发表于 2025-3-1 22:13
所以我就一直说少看点国内打鸡血的蠢货自媒体
看多了降智
推理一直就不依赖cuda
我都感觉有点保守,正儿八经训练 真没看过其他卡westbobo 发表于 2025-3-3 09:33
那chat**回答的内容说自己是文心一言是不是chat**也不用算力卡,直接买的百度服务? ...

wuxi001 发表于 2025-3-3 09:58
人家说的就是蒸馏,不是原创,他是站在巨人的肩膀上。所以已一发布就震惊四座。 ...

我輩樹である 发表于 2025-3-3 10:04
deepseek是quant们展现出的超强工程实力的体现。
ruo101 发表于 2025-3-2 09:57
那些玩外股的· ·早一个多星期已经开始骂娘了··
不明白 国内有好东西 不是值得高兴么·· ...
声色茶马 发表于 2025-3-2 14:09
喷子当然是喷子心态,管你说了什么先喷了再说,出服务器钱的反正是轮子对吧。
现在看起来,对于小规模应 ...
卢奇亚诺 发表于 2025-3-2 00:53
小丑的是蜥蜴人的meta吧,虽然我觉得他现在更像是一直炒股价
| 欢迎光临 Chiphell - 分享与交流用户体验 (https://www.chiphell.com/) | Powered by Discuz! X3.5 |