manyhn 发表于 2024-2-17 16:49

AMD ROCM有没有明显的坑?

主要为了学习AI和做一些小的项目,春节期间把Windows平台迁到了Ubuntu。

手上的显卡目前就一张7900xtx、Telsa P40、Intel A770。之前的方案是P40强开WDDM,使用WSL做一些项目。毕竟很多AI开源项目对linux兼容更好,特别是文件路径处理和字符编码编码处理这块。

考虑到性能最优,再加上我现在游戏只是附加项,所以能够达到和SD差不多的游戏兼容性也可以了,综上所以Ubuntu就是我重点考察的系统。

目前尝试了下Ubuntu,配合ROCM似乎在代码层面上和使用n卡并没有什么不同。测试了下bert以及各种变体配合pytorch进行句子嵌入,再进行向量数据库处理,至少这个场景下除了环境搭建不同外,其他并没有太大区别。而计算速度体感是比P40快不少了。而linux下的游戏表现,目前还算满意,2077这些都能跑,性能差距与windows还好,除了不能开光追。(是直接不能开,不是开了慢。不知道是不是proton有什么设置)


所以想请教下有经验的,linux下rocm是否还有什么大坑?

psps3 发表于 2024-2-17 16:52

本帖最后由 psps3 于 2024-2-17 16:57 编辑

MI300X上市后,rocm更新了6.0,其他的我也不懂[困惑]

xy. 发表于 2024-2-17 16:54

是直接不能开,不是开了慢。不知道是不是proton有什么设置
因为 dxvk 跑不了 dx12 啊..



你只用 torch 提供的东西理论上来说就没啥坑

manyhn 发表于 2024-2-17 16:55

哦。对了。。。我是学习AI和作一些基本的AI项目,比如NLP相关的。

不是专门跑应用,比如文生图之类的。

manyhn 发表于 2024-2-17 17:12

xy. 发表于 2024-2-17 16:54
因为 dxvk 跑不了 dx12 啊..




哦,原来是这个原因,不过也还好了

a6057c 发表于 2024-2-17 17:21

pytorch是目前支持最好的一批应用,也是amd的重点关照对象

没有关照到的地方到处都是坑[偷笑]

manyhn 发表于 2024-2-17 17:22

xy. 发表于 2024-2-17 16:54
因为 dxvk 跑不了 dx12 啊..




那感觉还可以了,毕竟现在大多数pytorch。这样感觉如果只是做小型项目加学习,就没必要换4090了

wohu4 发表于 2024-2-17 20:39

我之前也是A卡用Ubuntu+ROCM6.0跑SD,还是换N卡吧,基本上不用折腾,直接附加驱动选装就好。
A卡配置环境那些折腾命令都不用敲。
换了张2080ti 22g跑SD比A卡强太多了,跑Topaz也比A卡快。
P40相当于1080Ti吧,性能还是有点不够的。

proc 发表于 2024-2-18 00:08

坑挺多了,之前玩AI绘图时用过,社区很多优化都是NVIDIA only的。

当玩具尝鲜可以,专门用就算了。

QQQ哒哒哒 发表于 2024-2-18 03:00

我用的a卡跑的故障检测,没遇到啥坑

nlnjnj 发表于 2024-2-18 05:27

安心cuda吧,时间成本也是钱,romc 本来也只是专业卡适配好些

Neo_Granzon 发表于 2024-2-18 06:14

79xtx跟p40这都差了多少年,感觉rocm不适合个人学习,反而适合跑比较热门且成熟的项目。

jiaxu1006 发表于 2024-2-18 06:58

九天御风 发表于 2024-2-18 10:41

不是有个开源项目能让amd的显卡无需更改代码就能运行CUDA吗

limon 发表于 2024-2-18 11:46

个人学习应该还ok,基本就用pytorch

hcym 发表于 2024-2-18 11:57

已经不用win了,偶尔给老妈股票机升级更新。
Ubuntu就是编译性能好,上网也不错,虚拟机的编译太离谱

manyhn 发表于 2024-2-18 12:29

目前看起来在PyTorch 下,ROCM和CUDA的使用方式完全一致,换言之基于torch的项目应该在AMD上可以不用修改直接运行。其实这样也就差不多了。

我的场景更多在于使用预训练模型做功能demo,特别是基于hugging face ,公司确定技术方案后再投入生产环境。所以我至少目前并不需要特别强的性能,大概率也不需要训练/微调模型。因此有一个能算得快点,对主流技术兼容还行的GPU就行了。至于真正的生产环境,那是公司该投入的东西。

同样,例如SD,我并不需要太考虑图生成的速度(当然也不要太离谱,CPU这种肯定还是不行)。而更多的是使用SD验证某种功能能否实现,如何实现。和很多专业作图或者做视频的需求还是不一样。

另外这个毕竟是个人设备,成本投入也是要考虑的。当然我很认同时间成本也是成本,也正因为如此我才直接换Linux 平台,毕竟很多开源项目在win下面直接运行并不好,很多都需要小改下。

用这几天至少跑torch还没遇到什么和cuda 不一样的地方。如果后面有需求到A卡不好满足,或者满足起来需要投入额外时间的需求,肯定我还是直接换CUDA了。

21mm 发表于 2024-2-18 14:27

rocm 大部分被标记实验,说明成熟度不高,折腾可以,生产环境还是老老实实的用cuda 吧。

anishieh` 发表于 2024-2-18 14:51

个人学习重点是学习,为什么要浪费时间精力去给AMD当测试员完善生态呢。

heliumhgy 发表于 2024-2-19 21:41

日常工作开发维护onnxruntime rocm,这里忠心建议你们不要用rocm,小问题太多(去年年初是大问题一堆,动不动segfault),哪怕是炼图,你都需要和整个开原生态做斗争。除非拿钱办事,否则不建议任何普通用户用a卡做这些事。加钱上n卡,你的时间更值钱,能用钱解决的都不是事,尤其还是小钱。

李博翰 发表于 2024-3-9 23:14

玩可以,真正要用,尤其是用到HIP本身的地方不建议。pytorch没啥问题。

aasa0001 发表于 2024-3-11 12:23

xy. 发表于 2024-2-17 16:54
因为 dxvk 跑不了 dx12 啊..




vkd3d,虽然不知道光追支持得有多好
页: [1]
查看完整版本: AMD ROCM有没有明显的坑?