找回密码
 加入我们
搜索
      
楼主: 平安是福

[内存] 求推荐点大容量D5,然后上B850还是Z890

[复制链接]
发表于 2025-10-23 18:44 | 显示全部楼层
平安是福 发表于 2025-10-23 17:43
千问3 30B-A3B默认就只推荐8个专家

它是有128个但只能开8个,你知道80BA3B是几个吗?
发表于 2025-10-23 18:45 | 显示全部楼层
平安是福 发表于 2025-10-23 17:44
主要我是穷哥们,有钱能全部在gpu里面跑那肯定是最快的,但问题是一张H20可以买几套这种192g+4090/5090的 ...

没推荐买H20,只是因为这个事改变了我之前认为H20价格不符合性能的认识,之前是觉得它性能太低空有大显存没用。
 楼主| 发表于 2025-10-23 18:48 | 显示全部楼层
盐湖 发表于 2025-10-23 18:44
它是有128个但只能开8个,你知道80BA3B是几个吗?

数据来自huggingface页面

QWEN3 NEXT 80B A3B 专家混合:

    专家人数:512
    活跃专家人数:10人
    共享专家数量:1
    专家中级尺寸:512
 楼主| 发表于 2025-10-23 18:50 | 显示全部楼层
盐湖 发表于 2025-10-23 18:45
没推荐买H20,只是因为这个事改变了我之前认为H20价格不符合性能的认识,之前是觉得它性能太低空有大显存 ...

所以第二代禁卡令加上了显存速度限制。老黄H20是没有砍显存的,因为大语言模型的推理本身是个内存密集型任务,H20大部分情况核心性能不构成瓶颈。他这个核心算力可能会在预填充阶段受限(很小)
发表于 2025-10-23 19:40 | 显示全部楼层
平安是福 发表于 2025-10-23 18:50
所以第二代禁卡令加上了显存速度限制。老黄H20是没有砍显存的,因为大语言模型的推理本身是个内存密集型 ...

原来如此,显存速度限制一加,hbm卡大概是没机会放出来了
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2025-10-23 22:30 , Processed in 0.008293 second(s), 4 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表