找回密码
 加入我们
搜索
      
楼主: momoka

[显卡] 手上几张显卡的stable diffusion算图速度对比(个人向),仅供参考。

[复制链接]
发表于 2025-6-11 00:43 | 显示全部楼层
a010301208 发表于 2025-6-11 00:34
用diffusion-pipe,效果最好,win下面也可以在wsl中使用,你要用FramePack-eichi加载lora的话,那就训练 ...


非常感谢!

我先去研究,不懂再来请教。
发表于 2025-6-11 01:37 | 显示全部楼层
神性 发表于 2025-6-11 00:43
非常感谢!

我先去研究,不懂再来请教。

发表于 2025-6-11 15:53 | 显示全部楼层
a010301208 发表于 2025-6-11 00:34
用diffusion-pipe,效果最好,win下面也可以在wsl中使用,你要用FramePack-eichi加载lora的话,那就训练 ...


再请教一下,已训练4小时,设置了1000轮,请问多少小时手动停?
发表于 2025-6-11 16:08 | 显示全部楼层
神性 发表于 2025-6-11 15:53
再请教一下,已训练4小时,设置了1000轮,请问多少小时手动停?


训练多久结束和用了多少素材,训练的是动作,人物还是风格等有关系,不是以小时判断的,就按昨天说的那个来说,num repeats默认1没乱改的话,就按步数来初步计算,假设你bs1,gradient accumulation steps开2,那么每有1个5秒的视频就多训练80步,10个就先总共训练800步,然后先把lora导入,试试效果

diffusion pipe训练进度是会按你的设置时间来保存的,如果不满意可以继续训练。
发表于 2025-6-11 16:17 | 显示全部楼层
a010301208 发表于 2025-6-11 16:08
训练多久结束和用了多少素材,训练的是动作,人物还是风格等有关系,不是以小时判断的,就按昨天说的那个 ...

一共60个视频,训练4800步吗
发表于 2025-6-11 16:24 | 显示全部楼层
神性 发表于 2025-6-11 16:17
一共60个视频,训练4800步吗


你训练这种简单动作,其实视频素材不用这么多,不过没事你先训练着

训练人物lora才需要海量素材,一个人物相似度要训练到95%以上,一开始要准备200张左右的图片素材,然后把训练出来的lora,文生视频,生成海量的1秒视频,再把这些视频满意的帧数保存,再用这个合集素材加上你的原素材二次训练
发表于 2025-6-11 16:28 | 显示全部楼层
a010301208 发表于 2025-6-11 16:24
你训练这种简单动作,其实视频素材不用这么多,不过没事你先训练着

训练人物lora才需要海量素材,一个人 ...

好我先试试,不懂再来请教。感谢。
发表于 2025-6-11 17:44 | 显示全部楼层
3090 现在是废了吗?
发表于 2025-6-14 03:05 | 显示全部楼层
本帖最后由 巴特沃斯 于 2025-6-14 03:19 编辑

QQ图片20250614024231.png 技嘉魔鹰4080,降压超频tse1.48w
QQ截图20250614024249.png 七彩虹火神5090D,降压超频tes2.56w
这两张卡应该FP16都是和原本的差不太多,

工作流中:
1.除了底图全部都用了first Block Cache,4080应该没有炸显存(cmfyui关闭共享,实际资源管理也没见到使用共享)
2.Ksample参数一致,全流程画图数量一致(410那个角标),一批8张不过选择器
3.分辨率有小出入(4080那个记录是832*1216,和5090D是896*1152,像素量是后者高其实,经过分块后差距会进一步拉大)
4.5090D的工作流不再使用分块VAE(这个是差异的大头)不再清理显存蛐蛐二次元底模怎么可能会炸
5.5090D的工作流一张底图图只保存两次(4080的工作流每张底图保存了4次,comfyui的保存不知为啥很慢)
QQ截图20250614030229.png 这么简单运行时都要1秒


实际工作流中速度差异远比纸面FP16差异要大(目前只用了FP16)
只看单个Ksampler,eularA的提升幅度似乎比dpmpp_2m低,然后这两者也都确实没有2倍,调度器似乎不太受影响
最后po张自己的图
_30.jpg

发表于 2025-6-14 10:15 | 显示全部楼层
巴特沃斯 发表于 2025-6-14 03:05
技嘉魔鹰4080,降压超频tse1.48w
七彩虹火神5090D,降压超频tes2.56w
这两张卡应该FP16都是和原本的差不太 ...

不用fb cache, 你的5090至少要多费50%的时间吧。

dpmpp_2m是要比eularA慢个10%的。

IL的模型?有没有风格转换?如果用上风格转换(ipAdapter),效率还会大幅降低。

目测你的5090在ipAdapter加持,不用fb cache的情况下,3秒一张。还是要比楼主的9秒要快很多。我估测楼主主要是慢在upscaler上。总体来看你和楼主的5090效率不相上下。

楼主这种用webui的,对内部流程不能说一窍不通,只能说所知甚少。
 楼主| 发表于 2025-6-14 10:26 | 显示全部楼层
Leciel 发表于 2025-6-14 10:15
不用fb cache, 你的5090至少要多费50%的时间吧。

dpmpp_2m是要比eularA慢个10%的。

comfyui其实我也在学。节点这种东西虽然从20多年前就接触了(早期的maya......),但是确实平时不怎么用。目前就是当个娱乐和参考(我主要做3d资产的),弥补下自己不会画的缺憾,现在速度倒也还好。
发表于 2025-6-14 11:25 来自手机 | 显示全部楼层
Leciel 发表于 2025-6-14 10:15
不用fb cache, 你的5090至少要多费50%的时间吧。

dpmpp_2m是要比eularA慢个10%的。

第一步出图1/8张1024*1024范围的图在ksampler的时间大约就是3/22秒(5090d)和5/34秒(4080),模型是各种il+noob的混合,看想要什么画风,30步eularA+normal,不缩放cfg

中间有一步有flux的介入,主要是我想跑anine in real lift风格的2.5次元图,
这一步是在cn控制下,用flux增加少许真实纹理,其实远比IPA要慢,(我自己瞎几把摸索出来的),也是这一步导致之前16g显存在这步都要前后清显存,vae还要分块
不过最近我发现有用framePack单帧出图来实现自动溶图的节点,还没做对比

其他就是常规的TTP分块放大和脸部detail er了
发表于 2025-6-14 11:34 来自手机 | 显示全部楼层
momoka 发表于 2025-6-14 10:26
comfyui其实我也在学。节点这种东西虽然从20多年前就接触了(早期的maya......),但是确实平时不怎么用。 ...

我是ee背景,然后因为玩vrc也会用点blender,感觉comfyui本身的使用还是没啥难度的
不去搞体积光,服饰场景一致性这些,平涂为主的话
我觉得还是比较容易上手的

难的是具体有什么节点都可以实现什么效果
各类功能类似节点的对比
发表于 2025-6-14 11:48 | 显示全部楼层
巴特沃斯 发表于 2025-6-14 11:25
第一步出图1/8张1024*1024范围的图在ksampler的时间大约就是3/22秒(5090d)和5/34秒(4080),模型是各种i ...

嗯,了解为什么4080这么慢了,flux这块4080要清零。
不用flux我估计4080最多1200秒。

个人认为二次元没有必要使用flux controlnet。flux强势在于准确和真实,二次元在这两点上要求不高。要用也优先考虑flux redux,flux controlnet和flux redux效率上差不多也是。
 楼主| 发表于 2025-6-14 11:54 | 显示全部楼层
本帖最后由 momoka 于 2025-6-14 11:55 编辑
巴特沃斯 发表于 2025-6-14 11:34
我是ee背景,然后因为玩vrc也会用点blender,感觉comfyui本身的使用还是没啥难度的
不去搞体积光,服饰场景 ...


ai没有出来的时候我还兴趣用blender或max自己建模上材质做些二次元3d同人的cg的,现在。。。。。

有些放在A站上,不过也停留在3年前了。ai让自己做二次元向3dcg静帧没啥意义了。。。。。
https://www.artstation.com/mmcute
 楼主| 发表于 2025-6-14 12:03 | 显示全部楼层
Leciel 发表于 2025-6-14 11:48
嗯,了解为什么4080这么慢了,flux这块4080要清零。
不用flux我估计4080最多1200秒。

你说的Illustrious那种配合一些lora和画师串已经很满足我的需求了,可以开心的和儿子一起娱乐。二次元有时候混合点不精确的的东西挺好的,
发表于 2025-6-14 12:38 | 显示全部楼层
momoka 发表于 2025-6-14 12:03
你说的Illustrious那种配合一些lora和画师串已经很满足我的需求了,可以开心的和儿子一起娱乐。二次元有 ...

开心就好。5090这种硬通货将来玩法更多。

发几张草间弥生风格的香港女星图娱乐一下: 200709_ComfyUI2_00001_.jpg 201533_ComfyUI2_00001_.jpg 200907_ComfyUI2_00001_.jpg 201316_ComfyUI2_00001_.jpg
发表于 2025-6-14 15:11 | 显示全部楼层
Leciel 发表于 2025-6-14 12:38
开心就好。5090这种硬通货将来玩法更多。

发几张草间弥生风格的香港女星图娱乐一下: ...

24慧敏祖贤?13看不出
 楼主| 发表于 2025-6-14 15:15 | 显示全部楼层
本帖最后由 momoka 于 2025-6-14 15:17 编辑
Barton2500+ 发表于 2025-6-14 15:11
24慧敏祖贤?13看不出


3是林青霞啊。1一下认不出,特征不那么明显,看下眼睑或许关之琳之类的,。
发表于 2025-6-14 15:21 | 显示全部楼层
momoka 发表于 2025-6-14 10:26
comfyui其实我也在学。节点这种东西虽然从20多年前就接触了(早期的maya......),但是确实平时不怎么用。 ...


直接从视频开始,这几天玩嗨了,4090每天24小时在跑,comfyui工作流也可以,我还没试。
发表于 2025-6-14 15:38 | 显示全部楼层
Leciel 发表于 2025-6-14 12:38
开心就好。5090这种硬通货将来玩法更多。

发几张草间弥生风格的香港女星图娱乐一下: ...

以前不觉得,现在再看这个,一眼就知道是flux,特定的ai味太浓了。
发表于 2025-6-14 21:11 | 显示全部楼层
神性 发表于 2025-6-14 15:38
以前不觉得,现在再看这个,一眼就知道是flux,特定的ai味太浓了。

你怎么看出来是flux呢,哈哈。
还是搞搞视频吧,sdxl你玩不明白的。
发表于 2025-6-14 21:18 | 显示全部楼层
momoka 发表于 2025-6-14 15:15
3是林青霞啊。1一下认不出,特征不那么明显,看下眼睑或许关之琳之类的,。 ...

Bingo! 加一个鸡腿~ 200446_ComfyUI2_00001_.jpg
发表于 2025-6-14 21:21 | 显示全部楼层
再加一列显存带宽,就看出来关系了。
发表于 2025-6-14 21:50 | 显示全部楼层
Leciel 发表于 2025-6-14 21:11
你怎么看出来是flux呢,哈哈。
还是搞搞视频吧,sdxl你玩不明白的。


这种油画一样的质地一看就是flux,之前我还以为是正常的,现在发现只有flux这么奇怪,至于画图你连nunchaku都不用,还觉得自己玩明白了,也是奇事,我在前几天玩视频前都玩了快2年了画图了。
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2025-6-15 03:05 , Processed in 0.013576 second(s), 6 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表