找回密码
 加入我们
搜索
      
查看: 578|回复: 3

[显卡] 现在衡量显卡的负载是否要分成和cuda core和tensor core两部分来看待更加合理?

[复制链接]
发表于 2025-2-26 10:00 | 显示全部楼层 |阅读模式
随着老黄越来越推各种ai功能,tensor core的压力越来越大。现在衡量显卡的负载是否要分成和cuda core和tensor core两部分来看待更加合理?对于常规的基准测试tensor core几乎闲置的,显卡并没有真的完全吃满,导致出现了超频后压力测试能过,实际游戏却崩了的情况。不过我还没发现观察tensor core负载情况的工具。
发表于 2025-2-26 10:01 | 显示全部楼层
Tensor core 一般要专门编译,比如在AI绘画模型Stablediffusion或者Flux模型的优化上需要主动编译Tensor RT来加速,否则Tensor基本不会动
发表于 2025-2-26 10:04 | 显示全部楼层
喜欢整天研究GPU哪里瓶颈的去下个nsight看看负载占用
比吹水更能了解GPU,实际跟你想的都不一样
https://developer.nvidia.com/nsight-graphics
发表于 2025-2-26 10:07 来自手机 | 显示全部楼层
最简单的tensor稳定性测试,跑RIFE的TRT版,4K补帧
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2025-4-27 04:12 , Processed in 0.008379 second(s), 5 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表