Chiphell - 分享与交流用户体验

标题: 农企这次终于赶上来了? [打印本页]

作者: fpd92axv    时间: 2023-6-2 13:40
标题: 农企这次终于赶上来了?
本帖最后由 fpd92axv 于 2023-6-2 13:45 编辑

农吧看到的,顶针?
作者: yoloh    时间: 2023-6-2 13:47
好像是真的
作者: momoka    时间: 2023-6-2 13:50
能像n卡那样,随便找个网上流行的SD的整合包,就能用了么?
作者: hsshhssh    时间: 2023-6-2 13:56
DirectML问题是显存占用异常吧,有多少吃多少,8G显存的卡只能512*512,Linux下用ROCm就能正常出大图
作者: L470594464    时间: 2023-6-2 14:03
6000系有用吗?
作者: itisfine    时间: 2023-6-2 14:06
momoka 发表于 2023-6-2 13:50
能像n卡那样,随便找个网上流行的SD的整合包,就能用了么?

现在就有A卡整合包啊,,只不过速度比较慢
作者: xudi8092    时间: 2023-6-2 14:17
可以训练模型吗?
作者: xudi8092    时间: 2023-6-2 14:18
itisfine 发表于 2023-6-2 14:06
现在就有A卡整合包啊,,只不过速度比较慢

我下载的sd整合包,根本就识别不了a卡。
作者: 毛茸茸    时间: 2023-6-2 14:25
23.5.1是个很稳定的版本,没用两天就5.2了
作者: lyf362345    时间: 2023-6-2 14:37
5700XT,我之前只能画384以下的图,而且画出来都是畸形儿,不知道是不是也是这bug导致的。
作者: Misaka_9993    时间: 2023-6-2 14:53
本帖最后由 Misaka_9993 于 2023-6-2 15:00 编辑

只优化了RDNA3架构,也就是RX7000系列。跟老卡没啥关系了。

https://gpuopen.com/amd-microsoft-directml-stable-diffusion/

https://devblogs.microsoft.com/directx/dml-stable-diffusion/

These optimizations have been validated on AMD RDNA™ 3 devices that feature compute units with AI accelerators, including AMD Radeon™ RX 7900 Series graphics cards.

作者: geenii    时间: 2023-6-2 14:54
玩这个别给自己整hard难度,搭环境debug以及遇到问题搜不到解决方法非常恼人
sdwebui这种可以无脑搭建的都能劝退不少人,以至于他们宁愿去用在线的
作者: itisfine    时间: 2023-6-2 15:32
xudi8092 发表于 2023-6-2 14:18
我下载的sd整合包,根本就识别不了a卡。

你要下载AMD专用的。

我7900xt用下面这个能正常使用:

https://www.bilibili.com/video/B ... f768f1509078bc8ec0b
作者: xudi8092    时间: 2023-6-2 15:39
itisfine 发表于 2023-6-2 15:32
你要下载AMD专用的。

我7900xt用下面这个能正常使用:

大佬,这个可以训练模型吗
作者: itisfine    时间: 2023-6-2 16:01
xudi8092 发表于 2023-6-2 15:39
大佬,这个可以训练模型吗

Windows下不可以。
Linux下我不**楚。
作者: 秦南瓜    时间: 2023-6-2 16:14
卧槽,刚买7900xtx就来这种好事???
作者: YsHaNg    时间: 2023-6-2 16:32
为啥要用coreml 扔wsl里不好吗
作者: Victor.dou    时间: 2023-6-2 16:37
几个月之前拿RX6700XT测试过,Windows directml 速度只有 Linux rocm 的一半。
一直传言 rocm 5.6 会支持Windows,再等几个月看看 pytorch rocm版 有没有更新。。
作者: csqaclp    时间: 2023-6-2 22:21
6000系列显卡SD跑图效率有提升吗
作者: 灵乌路空    时间: 2023-6-2 22:39
修复了那双倍FP单元没用上的问题?

还是单纯的Direct ML效率的问题?
作者: 幻瓅月    时间: 2023-6-2 22:49
我超  阿尔卑斯
作者: 幻瓅月    时间: 2023-6-2 22:50
灵乌路空 发表于 2023-6-2 22:39
修复了那双倍FP单元没用上的问题?

还是单纯的Direct ML效率的问题? ...

双倍FP别想用上了
作者: atiufo    时间: 2023-6-2 23:53
lyf362345 发表于 2023-6-2 14:37
5700XT,我之前只能画384以下的图,而且画出来都是畸形儿,不知道是不是也是这bug导致的。 ...

你多虑了,这个提升仅限于7000系
至于出图畸形多是因为你的反面tag添加得不够
作者: lyf362345    时间: 2023-6-3 00:11
atiufo 发表于 2023-6-2 23:53
你多虑了,这个提升仅限于7000系
至于出图畸形多是因为你的反面tag添加得不够 ...

可能是,之前没深入研究,等7900XTX到了再试一下
作者: louis2005    时间: 2023-6-3 00:49
现在单说AI性能
能跟2060 12G相当的A卡是什么型号?
作者: imluvian    时间: 2023-6-3 02:36
Victor.dou 发表于 2023-6-2 16:37
几个月之前拿RX6700XT测试过,Windows directml 速度只有 Linux rocm 的一半。
一直传言 rocm 5.6 会支持Wi ...

ROCM不是不支持RDNA的游戏卡吗。。
作者: 卡卡鸡    时间: 2023-6-3 08:17
散了吧,就支持7900,6000系列及以下不知道以后会不会支持,我的580 2048sp画色图速度看了下只有4-5s/lt(win系统),出个图要1分多-2分钟,有没有6000系列的说说出个图要多长时间
作者: HaYuanJi    时间: 2023-6-3 08:26
提示: 作者被禁止或删除 内容自动屏蔽
作者: Victor.dou    时间: 2023-6-3 13:20
imluvian 发表于 2023-6-3 02:36
ROCM不是不支持RDNA的游戏卡吗。。

官方不做RDNA游戏卡的 rocm 测试和验证,所以不加进支持列表。
可以加环境变量来支持RDNA 1+2 游戏卡。

  1. # 添加进 webui-user.sh
  2. export HSA_OVERRIDE_GFX_VERSION=10.3.0 # gfx1030 Radeon RX 6800 6800 XT 6900 XT, gfx1031 Radeon RX 6700 XT.
  3. #export HSA_OVERRIDE_GFX_VERSION=8.0.3 # gfx803 Radeon RX580
  4. # RX5000 系列需要在 COMMANDLINE_ARGS 添加 --precision full --no-half,RX500 和 RX6000 系列不需要
  5. # --medvram --lowvram --opt-sub-quad-attention --disable-nan-check https://github.com/AUTOMATIC1111/stable-diffusion-webui/wiki/Command-Line-Arguments-and-Settings
  6. export COMMANDLINE_ARGS="--skip-torch-cuda-test --autolaunch --listen --theme dark"
  7. #export TORCH_COMMAND="pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/rocm5.4.2"
  8. export TORCH_COMMAND="pip install torch torchvision torchaudio -f https://mirror.sjtu.edu.cn/pytorch-wheels/rocm5.4.2/torch_stable.html -i https://mirrors.aliyun.com/pypi/simple"
复制代码

作者: Victor.dou    时间: 2023-6-3 13:21
卡卡鸡 发表于 2023-6-3 08:17
散了吧,就支持7900,6000系列及以下不知道以后会不会支持,我的580 2048sp画色图速度看了下只有4-5s/lt(w ...

RX6700XT 按照 Tom's Hardware文章的测试参数,跑512x512, 100it 约16秒,6.25it/s.
作者: 大头吃小头    时间: 2023-6-3 13:24
卡卡鸡 发表于 2023-6-3 08:17
散了吧,就支持7900,6000系列及以下不知道以后会不会支持,我的580 2048sp画色图速度看了下只有4-5s/lt(w ...

10秒吧 6900xt   512*512几秒出
768*512
作者: dukeyli    时间: 2023-6-3 17:56
A卡硬件还行,就是驱动太拉了。
作者: 卡卡鸡    时间: 2023-6-3 22:06
Victor.dou 发表于 2023-6-3 13:21
RX6700XT 按照 Tom's Hardware文章的测试参数,跑512x512, 100it 约16秒,6.25it/s.

那挺快的
作者: 卡卡鸡    时间: 2023-6-3 22:07
大头吃小头 发表于 2023-6-3 13:24
10秒吧 6900xt   512*512几秒出
768*512

这么速度
作者: imluvian    时间: 2023-6-3 23:05
Victor.dou 发表于 2023-6-3 13:20
官方不做RDNA游戏卡的 rocm 测试和验证,所以不加进支持列表。
可以加环境变量来支持RDNA 1+2 游戏卡。


牛逼。。
作者: raiya    时间: 2023-6-3 23:51
本帖最后由 raiya 于 2023-6-3 23:54 编辑
HaYuanJi 发表于 2023-6-3 08:26
AI绘图可以给个教程么,手持24G英伟达不知从何入手


1,下载安装,这部分自己去看。基本逻辑就是架设一个本地的服务器,然后用浏览器去访问自己这个本地服务器使用。git clone之类的,你就当在dos之类的界面下,去执行一个下载安装命令。


2,基本结构,模型基分为checkpoint ,  LORA,  hypernet,embiding。

checkpoint是大模型,一个2G~。这个东西是包含着生成图片的时候的绝大部分内容和基础,在生成图片的时候只能选一个,相当于选一个模式。当然咯,这个东西也是可以训练的,是可以几个模型合并的。

然后下面那些都是小模型,是可以用词条添加在图片生成内容里面的,没有数量限制。

embiding,基本上就是权重改变,容量很小,无法为大模型引入新内容。

hypernet,这个东西比上面那个大,是可以引入新内容的。但是这个东西的问题在于它的优先级甚至高于大模型checkpoint,相当于直接给画师的脑子动刀了,很难用。

lora,主要用的是这个。和hypernet一样,是可以引入新内容的。它的特点是优先级低于checkpoint,所以它可以引入新内容,但是不影响checkpoint的基本内容。

以上模型,embiding和hypernet可以在SD主页训练。checkpoint和lora需要另外的安装kohya服务器训练。

3,使用方面的基础知识。

首先生成图片,是选择一个checkpoint,然后增加正负词条,和LORA。

初步生成的一般只有512X512左右尺寸的图片,最大不超过1024x1024。然后再去用算法放大到高清。

因为呢,首先AI的原理,就算是512x512的图片,但是生成或者训练的时候,是以维度为单位的,所以占用的资源是指数级。4090也就能生成原生1200左右的图片了。

然后因为上面的原因,大部分的模型就是依照512x512的像素去训练的。而AI画图,实际上它只是模仿。你给他训练的时候是512的,你让他一次性画1024图,他只会画成 4个512的,结果就是画出来4个脑袋之类的。

而高清放大,实际上也是把画面分割成小块,让AI画小块然后拼起来。

而为什么要用正负词条呢。因为训练的时候,要素不会那么干净。训练的时候,一张图片,会标注这张图片上是什么,但是AI实际上是不懂的。所以你比如说,你训练的时候,你把几张【小美】的照片,拿来标注。里面有几张是在家里背景有个电视,有几张在路上背景有辆车,比把电视和车都标注了出来。但是当你在添加词条的时候,只添加了lora:小美,那么很有可能那个电视机,那辆车,也会被一起画出来。怎么办,这时候就必须在负面词条里面,加上车和电视机,那么很大概率就不会跑出来。

之前说过的hypernet和lora的区别。举个例子,你用的checkpoint大模型,是一个汉服动画风格的。而如果你用一样的小美的照片,各训练一个hypernet和一个lora,都叫做小美。你在词条里面添加hypernet 小美,那么生成的图片很有可能就很像你训练的时候的照片,背景有一点点汉服动画风格。如果你添加的是一个lora小美,那么你会得到一个汉服动画人物,脸长得有点像小美。这就是他们的区别。

4,其他的插件,训练,都是日新月异的,时不时可以去看看。但是AI画图基本上不是一次性生成一张成功的高清图片这样玩的,更有可能是随机生成图片,或者用现成的图片,然后在图片生成图片那里,然后修改一部分,有点像PS的用法。




欢迎光临 Chiphell - 分享与交流用户体验 (https://www.chiphell.com/) Powered by Discuz! X3.5