神性 发表于 2025-6-11 00:43

a010301208 发表于 2025-6-11 00:34
用diffusion-pipe,效果最好,win下面也可以在wsl中使用,你要用FramePack-eichi加载lora的话,那就训练 ...

非常感谢!

我先去研究,不懂再来请教。

a010301208 发表于 2025-6-11 01:37

神性 发表于 2025-6-11 00:43
非常感谢!

我先去研究,不懂再来请教。

[偷笑]

神性 发表于 2025-6-11 15:53

a010301208 发表于 2025-6-11 00:34
用diffusion-pipe,效果最好,win下面也可以在wsl中使用,你要用FramePack-eichi加载lora的话,那就训练 ...

再请教一下,已训练4小时,设置了1000轮,请问多少小时手动停?

a010301208 发表于 2025-6-11 16:08

神性 发表于 2025-6-11 15:53
再请教一下,已训练4小时,设置了1000轮,请问多少小时手动停?

训练多久结束和用了多少素材,训练的是动作,人物还是风格等有关系,不是以小时判断的,就按昨天说的那个来说,num repeats默认1没乱改的话,就按步数来初步计算,假设你bs1,gradient accumulation steps开2,那么每有1个5秒的视频就多训练80步,10个就先总共训练800步,然后先把lora导入,试试效果[偷笑]

diffusion pipe训练进度是会按你的设置时间来保存的,如果不满意可以继续训练。[偷笑]

神性 发表于 2025-6-11 16:17

a010301208 发表于 2025-6-11 16:08
训练多久结束和用了多少素材,训练的是动作,人物还是风格等有关系,不是以小时判断的,就按昨天说的那个 ...

一共60个视频,训练4800步吗

a010301208 发表于 2025-6-11 16:24

神性 发表于 2025-6-11 16:17
一共60个视频,训练4800步吗

你训练这种简单动作,其实视频素材不用这么多[偷笑],不过没事你先训练着

训练人物lora才需要海量素材,一个人物相似度要训练到95%以上,一开始要准备200张左右的图片素材[偷笑],然后把训练出来的lora,文生视频,生成海量的1秒视频,再把这些视频满意的帧数保存,再用这个合集素材加上你的原素材二次训练[偷笑]

神性 发表于 2025-6-11 16:28

a010301208 发表于 2025-6-11 16:24
你训练这种简单动作,其实视频素材不用这么多,不过没事你先训练着

训练人物lora才需要海量素材,一个人 ...

好我先试试,不懂再来请教。感谢。

gdanmac 发表于 2025-6-11 17:44

3090 现在是废了吗?

巴特沃斯 发表于 2025-6-14 03:05

本帖最后由 巴特沃斯 于 2025-6-14 03:19 编辑

技嘉魔鹰4080,降压超频tse1.48w
七彩虹火神5090D,降压超频tes2.56w
这两张卡应该FP16都是和原本的差不太多,

工作流中:
1.除了底图全部都用了first Block Cache,4080应该没有炸显存(cmfyui关闭共享,实际资源管理也没见到使用共享)
2.Ksample参数一致,全流程画图数量一致(410那个角标),一批8张不过选择器
3.分辨率有小出入(4080那个记录是832*1216,和5090D是896*1152,像素量是后者高其实,经过分块后差距会进一步拉大)
4.5090D的工作流不再使用分块VAE(这个是差异的大头)不再清理显存蛐蛐二次元底模怎么可能会炸
5.5090D的工作流一张底图图只保存两次(4080的工作流每张底图保存了4次,comfyui的保存不知为啥很慢)
这么简单运行时都要1秒


实际工作流中速度差异远比纸面FP16差异要大[流泪](目前只用了FP16)
只看单个Ksampler,eularA的提升幅度似乎比dpmpp_2m低,然后这两者也都确实没有2倍,调度器似乎不太受影响
最后po张自己的图


Leciel 发表于 2025-6-14 10:15

巴特沃斯 发表于 2025-6-14 03:05
技嘉魔鹰4080,降压超频tse1.48w
七彩虹火神5090D,降压超频tes2.56w
这两张卡应该FP16都是和原本的差不太 ...

不用fb cache, 你的5090至少要多费50%的时间吧。

dpmpp_2m是要比eularA慢个10%的。

IL的模型?有没有风格转换?如果用上风格转换(ipAdapter),效率还会大幅降低。

目测你的5090在ipAdapter加持,不用fb cache的情况下,3秒一张。还是要比楼主的9秒要快很多。我估测楼主主要是慢在upscaler上。总体来看你和楼主的5090效率不相上下。

楼主这种用webui的,对内部流程不能说一窍不通,只能说所知甚少。

momoka 发表于 2025-6-14 10:26

Leciel 发表于 2025-6-14 10:15
不用fb cache, 你的5090至少要多费50%的时间吧。

dpmpp_2m是要比eularA慢个10%的。


comfyui其实我也在学。节点这种东西虽然从20多年前就接触了(早期的maya......),但是确实平时不怎么用。目前就是当个娱乐和参考(我主要做3d资产的),弥补下自己不会画的缺憾,现在速度倒也还好。

巴特沃斯 发表于 2025-6-14 11:25

Leciel 发表于 2025-6-14 10:15
不用fb cache, 你的5090至少要多费50%的时间吧。

dpmpp_2m是要比eularA慢个10%的。


第一步出图1/8张1024*1024范围的图在ksampler的时间大约就是3/22秒(5090d)和5/34秒(4080),模型是各种il+noob的混合,看想要什么画风,30步eularA+normal,不缩放cfg

中间有一步有flux的介入,主要是我想跑anine in real lift风格的2.5次元图,
这一步是在cn控制下,用flux增加少许真实纹理,其实远比IPA要慢,(我自己瞎几把摸索出来的),也是这一步导致之前16g显存在这步都要前后清显存,vae还要分块
不过最近我发现有用framePack单帧出图来实现自动溶图的节点,还没做对比

其他就是常规的TTP分块放大和脸部detail er了

巴特沃斯 发表于 2025-6-14 11:34

momoka 发表于 2025-6-14 10:26
comfyui其实我也在学。节点这种东西虽然从20多年前就接触了(早期的maya......),但是确实平时不怎么用。 ...

我是ee背景,然后因为玩vrc也会用点blender,感觉comfyui本身的使用还是没啥难度的
不去搞体积光,服饰场景一致性这些,平涂为主的话
我觉得还是比较容易上手的

难的是具体有什么节点都可以实现什么效果
各类功能类似节点的对比

Leciel 发表于 2025-6-14 11:48

巴特沃斯 发表于 2025-6-14 11:25
第一步出图1/8张1024*1024范围的图在ksampler的时间大约就是3/22秒(5090d)和5/34秒(4080),模型是各种i ...

嗯,了解为什么4080这么慢了,flux这块4080要清零。
不用flux我估计4080最多1200秒。

个人认为二次元没有必要使用flux controlnet。flux强势在于准确和真实,二次元在这两点上要求不高。要用也优先考虑flux redux,flux controlnet和flux redux效率上差不多也是。

momoka 发表于 2025-6-14 11:54

本帖最后由 momoka 于 2025-6-14 11:55 编辑

巴特沃斯 发表于 2025-6-14 11:34
我是ee背景,然后因为玩vrc也会用点blender,感觉comfyui本身的使用还是没啥难度的
不去搞体积光,服饰场景 ...

ai没有出来的时候我还兴趣用blender或max自己建模上材质做些二次元3d同人的cg的,现在。。。。。[生病]

有些放在A站上,不过也停留在3年前了。ai让自己做二次元向3dcg静帧没啥意义了。。。。。
https://www.artstation.com/mmcute

momoka 发表于 2025-6-14 12:03

Leciel 发表于 2025-6-14 11:48
嗯,了解为什么4080这么慢了,flux这块4080要清零。
不用flux我估计4080最多1200秒。



你说的Illustrious那种配合一些lora和画师串已经很满足我的需求了,可以开心的和儿子一起娱乐。二次元有时候混合点不精确的的东西挺好的,

Leciel 发表于 2025-6-14 12:38

momoka 发表于 2025-6-14 12:03
你说的Illustrious那种配合一些lora和画师串已经很满足我的需求了,可以开心的和儿子一起娱乐。二次元有 ...

开心就好。5090这种硬通货将来玩法更多。[音乐]

发几张草间弥生风格的香港女星图娱乐一下:

Barton2500+ 发表于 2025-6-14 15:11

Leciel 发表于 2025-6-14 12:38
开心就好。5090这种硬通货将来玩法更多。

发几张草间弥生风格的香港女星图娱乐一下: ...

24慧敏祖贤?13看不出

momoka 发表于 2025-6-14 15:15

本帖最后由 momoka 于 2025-6-14 15:17 编辑

Barton2500+ 发表于 2025-6-14 15:11
24慧敏祖贤?13看不出

3是林青霞啊。1一下认不出,特征不那么明显,看下眼睑或许关之琳之类的,。

神性 发表于 2025-6-14 15:21

momoka 发表于 2025-6-14 10:26
comfyui其实我也在学。节点这种东西虽然从20多年前就接触了(早期的maya......),但是确实平时不怎么用。 ...

直接从视频开始,这几天玩嗨了,4090每天24小时在跑,comfyui工作流也可以,我还没试。

神性 发表于 2025-6-14 15:38

Leciel 发表于 2025-6-14 12:38
开心就好。5090这种硬通货将来玩法更多。

发几张草间弥生风格的香港女星图娱乐一下: ...

以前不觉得,现在再看这个,一眼就知道是flux,特定的ai味太浓了。

Leciel 发表于 2025-6-14 21:11

神性 发表于 2025-6-14 15:38
以前不觉得,现在再看这个,一眼就知道是flux,特定的ai味太浓了。

你怎么看出来是flux呢,哈哈。
还是搞搞视频吧,sdxl你玩不明白的。

Leciel 发表于 2025-6-14 21:18

momoka 发表于 2025-6-14 15:15
3是林青霞啊。1一下认不出,特征不那么明显,看下眼睑或许关之琳之类的,。 ...

Bingo! 加一个鸡腿~

BetaHT 发表于 2025-6-14 21:21

再加一列显存带宽,就看出来关系了。

神性 发表于 2025-6-14 21:50

Leciel 发表于 2025-6-14 21:11
你怎么看出来是flux呢,哈哈。
还是搞搞视频吧,sdxl你玩不明白的。

这种油画一样的质地一看就是flux,之前我还以为是正常的,现在发现只有flux这么奇怪,至于画图你连nunchaku都不用,还觉得自己玩明白了,也是奇事,我在前几天玩视频前都玩了快2年了画图了。
页: 1 2 [3]
查看完整版本: 手上几张显卡的stable diffusion算图速度对比(个人向),仅供参考。