找回密码
 加入我们
搜索
      
查看: 3575|回复: 4

[显卡] [求助]为啥我的GPU-Z不显示Bus Interface Load了? 我怎么知道瓶颈在哪?

[复制链接]
发表于 2024-2-23 14:52 | 显示全部楼层 |阅读模式
[求助]为啥我的GPU-Z不显示Bus Interface Load了?  我怎么知道瓶颈在哪?

屏幕截图 2024-02-23 144346.png


按道理两张卡不应该频繁的传数据吗?
发表于 2024-2-23 15:01 | 显示全部楼层
本帖最后由 zhuifeng88 于 2024-2-23 15:02 编辑

看你用法啊, 要是ddp/zero2以下的话本来就不会频繁传数据, tensor parallel/zero3才会

而且又不是没显示 AC}~8H~8ZJ~9Y)UKVOG`OTQ.png
 楼主| 发表于 2024-2-23 15:16 | 显示全部楼层
zhuifeng88 发表于 2024-2-23 15:01
看你用法啊, 要是ddp/zero2以下的话本来就不会频繁传数据, tensor parallel/zero3才会

而且又不是没显示 ...

就是Qwen1.5-72B-Chat-**Q-Int4的推理,transformers                  4.37.2,不是在微调
发表于 2024-2-23 15:27 | 显示全部楼层
本帖最后由 zhuifeng88 于 2024-2-23 15:33 编辑
godspeed66 发表于 2024-2-23 15:16
就是Qwen1.5-72B-Chat-**Q-Int4的推理,transformers                  4.37.2,不是在微调


transformers sequential map bs=1 generation的话正常, 每token两张卡之间只要传不到1MB的数据, bus load当然不带动的

稍微动那3次应该能和prompt prefill的时间点对上
 楼主| 发表于 2024-2-23 15:41 | 显示全部楼层
zhuifeng88 发表于 2024-2-23 15:27
transformers sequential map bs=1 generation的话正常, 每token两张卡之间只要传不到1MB的数据, bus loa ...

收到 谢谢
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2025-5-6 19:00 , Processed in 0.009806 second(s), 6 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表