手上几张显卡的stable diffusion算图速度对比（个人向），仅供参考。

神性 · 发表于 2025-6-11 00:43

a010301208 发表于 2025-6-11 00:34
用diffusion-pipe，效果最好，win下面也可以在wsl中使用，你要用FramePack-eichi加载lora的话，那就训练 ...

非常感谢!

我先去研究，不懂再来请教。

a010301208 · 发表于 2025-6-11 01:37

神性发表于 2025-6-11 00:43
非常感谢!

我先去研究，不懂再来请教。

神性 · 发表于 2025-6-11 15:53

a010301208 发表于 2025-6-11 00:34
用diffusion-pipe，效果最好，win下面也可以在wsl中使用，你要用FramePack-eichi加载lora的话，那就训练 ...

再请教一下，已训练4小时，设置了1000轮，请问多少小时手动停?

a010301208 · 发表于 2025-6-11 16:08

神性发表于 2025-6-11 15:53
再请教一下，已训练4小时，设置了1000轮，请问多少小时手动停?

训练多久结束和用了多少素材，训练的是动作，人物还是风格等有关系，不是以小时判断的，就按昨天说的那个来说，num repeats默认1没乱改的话，就按步数来初步计算，假设你bs1，gradient accumulation steps开2，那么每有1个5秒的视频就多训练80步，10个就先总共训练800步，然后先把lora导入，试试效果

diffusion pipe训练进度是会按你的设置时间来保存的，如果不满意可以继续训练。

神性 · 发表于 2025-6-11 16:17

a010301208 发表于 2025-6-11 16:08
训练多久结束和用了多少素材，训练的是动作，人物还是风格等有关系，不是以小时判断的，就按昨天说的那个 ...

一共60个视频，训练4800步吗

a010301208 · 发表于 2025-6-11 16:24

神性发表于 2025-6-11 16:17
一共60个视频，训练4800步吗

你训练这种简单动作，其实视频素材不用这么多

，不过没事你先训练着

训练人物lora才需要海量素材，一个人物相似度要训练到95%以上，一开始要准备200张左右的图片素材

，然后把训练出来的lora，文生视频，生成海量的1秒视频，再把这些视频满意的帧数保存，再用这个合集素材加上你的原素材二次训练

神性 · 发表于 2025-6-11 16:28

a010301208 发表于 2025-6-11 16:24
你训练这种简单动作，其实视频素材不用这么多，不过没事你先训练着

训练人物lora才需要海量素材，一个人 ...

好我先试试，不懂再来请教。感谢。

gdanmac · 发表于 2025-6-11 17:44

3090 现在是废了吗？

巴特沃斯 · 发表于 2025-6-14 03:05

本帖最后由巴特沃斯于 2025-6-14 03:19 编辑

QQ图片20250614024231.png

技嘉魔鹰4080，降压超频tse1.48w
QQ截图20250614024249.png

七彩虹火神5090D，降压超频tes2.56w
这两张卡应该FP16都是和原本的差不太多,

工作流中：
1.除了底图全部都用了first Block Cache，4080应该没有炸显存（cmfyui关闭共享，实际资源管理也没见到使用共享）
2.Ksample参数一致，全流程画图数量一致（410那个角标），一批8张不过选择器
3.分辨率有小出入（4080那个记录是832*1216，和5090D是896*1152，像素量是后者高其实，经过分块后差距会进一步拉大）
4.5090D的工作流不再使用分块VAE（这个是差异的大头）不再清理显存~~蛐蛐二次元底模怎么可能会炸~~
5.5090D的工作流一张底图图只保存两次（4080的工作流每张底图保存了4次，comfyui的保存不知为啥很慢）
QQ截图20250614030229.png

这么简单运行时都要1秒

实际工作流中速度差异远比纸面FP16差异要大

(目前只用了FP16)
只看单个Ksampler，eularA的提升幅度似乎比dpmpp_2m低，然后这两者也都确实没有2倍，调度器似乎不太受影响
最后po张自己的图

Leciel · 发表于 2025-6-14 10:15

巴特沃斯发表于 2025-6-14 03:05
技嘉魔鹰4080，降压超频tse1.48w
七彩虹火神5090D，降压超频tes2.56w
这两张卡应该FP16都是和原本的差不太 ...

不用fb cache, 你的5090至少要多费50%的时间吧。

dpmpp_2m是要比eularA慢个10%的。

IL的模型？有没有风格转换？如果用上风格转换（ipAdapter），效率还会大幅降低。

目测你的5090在ipAdapter加持，不用fb cache的情况下，3秒一张。还是要比楼主的9秒要快很多。我估测楼主主要是慢在upscaler上。总体来看你和楼主的5090效率不相上下。

楼主这种用webui的，对内部流程不能说一窍不通，只能说所知甚少。

momoka · 发表于 2025-6-14 10:26

Leciel 发表于 2025-6-14 10:15
不用fb cache, 你的5090至少要多费50%的时间吧。

dpmpp_2m是要比eularA慢个10%的。

comfyui其实我也在学。节点这种东西虽然从20多年前就接触了（早期的maya......)，但是确实平时不怎么用。目前就是当个娱乐和参考（我主要做3d资产的），弥补下自己不会画的缺憾，现在速度倒也还好。

巴特沃斯 · 发表于 2025-6-14 11:25

Leciel 发表于 2025-6-14 10:15
不用fb cache, 你的5090至少要多费50%的时间吧。

dpmpp_2m是要比eularA慢个10%的。

第一步出图1/8张1024*1024范围的图在ksampler的时间大约就是3/22秒(5090d）和5/34秒（4080）,模型是各种il+noob的混合,看想要什么画风,30步eularA+normal,不缩放cfg

中间有一步有flux的介入,主要是我想跑anine in real lift风格的2.5次元图,
这一步是在cn控制下,用flux增加少许真实纹理,其实远比IPA要慢,（我自己瞎几把摸索出来的）,也是这一步导致之前16g显存在这步都要前后清显存,vae还要分块
不过最近我发现有用framePack单帧出图来实现自动溶图的节点,还没做对比

其他就是常规的TTP分块放大和脸部detail er了

巴特沃斯 · 发表于 2025-6-14 11:34

momoka 发表于 2025-6-14 10:26
comfyui其实我也在学。节点这种东西虽然从20多年前就接触了（早期的maya......)，但是确实平时不怎么用。 ...

我是ee背景,然后因为玩vrc也会用点blender,感觉comfyui本身的使用还是没啥难度的
不去搞体积光,服饰场景一致性这些,平涂为主的话
我觉得还是比较容易上手的

难的是具体有什么节点都可以实现什么效果
各类功能类似节点的对比

Leciel · 发表于 2025-6-14 11:48

巴特沃斯发表于 2025-6-14 11:25
第一步出图1/8张1024*1024范围的图在ksampler的时间大约就是3/22秒(5090d）和5/34秒（4080）,模型是各种i ...

嗯，了解为什么4080这么慢了，flux这块4080要清零。
不用flux我估计4080最多1200秒。

个人认为二次元没有必要使用flux controlnet。flux强势在于准确和真实，二次元在这两点上要求不高。要用也优先考虑flux redux，flux controlnet和flux redux效率上差不多也是。

momoka · 发表于 2025-6-14 11:54

本帖最后由 momoka 于 2025-6-14 11:55 编辑

巴特沃斯发表于 2025-6-14 11:34
我是ee背景,然后因为玩vrc也会用点blender,感觉comfyui本身的使用还是没啥难度的
不去搞体积光,服饰场景 ...

ai没有出来的时候我还兴趣用blender或max自己建模上材质做些二次元3d同人的cg的，现在。。。。。

有些放在A站上，不过也停留在3年前了。ai让自己做二次元向3dcg静帧没啥意义了。。。。。
https://www.artstation.com/mmcute

momoka · 发表于 2025-6-14 12:03

Leciel 发表于 2025-6-14 11:48
嗯，了解为什么4080这么慢了，flux这块4080要清零。
不用flux我估计4080最多1200秒。

你说的Illustrious那种配合一些lora和画师串已经很满足我的需求了，可以开心的和儿子一起娱乐。二次元有时候混合点不精确的的东西挺好的，

Leciel · 发表于 2025-6-14 12:38

momoka 发表于 2025-6-14 12:03
你说的Illustrious那种配合一些lora和画师串已经很满足我的需求了，可以开心的和儿子一起娱乐。二次元有 ...

开心就好。5090这种硬通货将来玩法更多。

发几张草间弥生风格的香港女星图娱乐一下：

Barton2500+ · 发表于 2025-6-14 15:11

Leciel 发表于 2025-6-14 12:38
开心就好。5090这种硬通货将来玩法更多。

发几张草间弥生风格的香港女星图娱乐一下： ...

24慧敏祖贤？13看不出

momoka · 发表于 2025-6-14 15:15

本帖最后由 momoka 于 2025-6-14 15:17 编辑

Barton2500+ 发表于 2025-6-14 15:11
24慧敏祖贤？13看不出

3是林青霞啊。1一下认不出，特征不那么明显，看下眼睑或许关之琳之类的，。

神性 · 发表于 2025-6-14 15:21

momoka 发表于 2025-6-14 10:26
comfyui其实我也在学。节点这种东西虽然从20多年前就接触了（早期的maya......)，但是确实平时不怎么用。 ...

直接从视频开始，这几天玩嗨了，4090每天24小时在跑，comfyui工作流也可以，我还没试。

神性 · 发表于 2025-6-14 15:38

Leciel 发表于 2025-6-14 12:38
开心就好。5090这种硬通货将来玩法更多。

发几张草间弥生风格的香港女星图娱乐一下： ...

以前不觉得，现在再看这个，一眼就知道是flux，特定的ai味太浓了。

Leciel · 发表于 2025-6-14 21:11

神性发表于 2025-6-14 15:38
以前不觉得，现在再看这个，一眼就知道是flux，特定的ai味太浓了。

你怎么看出来是flux呢，哈哈。
还是搞搞视频吧，sdxl你玩不明白的。

Leciel · 发表于 2025-6-14 21:18

momoka 发表于 2025-6-14 15:15
3是林青霞啊。1一下认不出，特征不那么明显，看下眼睑或许关之琳之类的，。 ...

Bingo! 加一个鸡腿~

BetaHT · 发表于 2025-6-14 21:21

再加一列显存带宽，就看出来关系了。

神性 · 发表于 2025-6-14 21:50

Leciel 发表于 2025-6-14 21:11
你怎么看出来是flux呢，哈哈。
还是搞搞视频吧，sdxl你玩不明白的。

这种油画一样的质地一看就是flux，之前我还以为是正常的，现在发现只有flux这么奇怪，至于画图你连nunchaku都不用，还觉得自己玩明白了，也是奇事，我在前几天玩视频前都玩了快2年了画图了。

账号		自动登录	找回密码
密码			加入我们

[显卡] 手上几张显卡的stable diffusion算图速度对比（个人向），仅供参考。

浏览过的版块