找回密码
 加入我们
搜索
      
查看: 15370|回复: 50

[内存] 第一代傲腾持久内存在DeepSeek上的可用度很低

[复制链接]
发表于 2025-2-9 15:50 来自手机 | 显示全部楼层
文字生成部分瓶颈在带宽,300G的模型就要300G x k token/s 的带宽。要k=10就要3TB带宽。所以光堆容量也没有用,还要靠压缩。

大容量对训练部分有帮助,生成暴慢但训练很快,是不是很奇怪。
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2025-7-17 15:55 , Processed in 0.007681 second(s), 5 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表