试了一下comfyui

wujiwu 发表于 2025-12-7 19:51

本帖最后由 wujiwu 于 2025-12-8 10:11 编辑

之前完全不懂ai，没有接触过本地部署和生成，除了问答对话那种玩过。
今年电脑配置好后，有点无聊，中年人也玩不动什么游戏大作。
9700X+48G+5070ti
这套配置玩以前的老游戏，魔兽世界、暗黑3、lol、还有测试了几个单机大作，也比较得心应手。
于是作死找了ai模型玩，找了一下ai生成图片和视频的comfyui集合。本意就是无聊........

拿上魔法工具下载模型
就推荐首页几个模型下载过来测试随便玩。感觉低端广告公司图片制作和小视频宣传可以接近失业状态。
通过关键字，已经可以生成不错的图片质量和短视频。还没玩到换面，变声，替换那些东西。
几个模型就把魔法血条150G每月魔法值用光。要等下个月恢复魔力......
image-z图片生成质量非常高，接近以假乱真的情况。图片生成比较快，我的电脑运行跑大概十秒左右钟就出来作品。

视频玩了一下，不行，生成太慢（自己也不懂配参数），整台电脑运行接近两个小时出5秒片。看着电脑显卡满载或者内存满载，感觉得不偿失。
还是吃了显存不够大的亏。看了一下耗时的地方，主要显卡核心和显存吃满。
通过这次试玩整体来说，ai模型部署本地，真的是小公司福音了，制作短视频和图片广告，完全可以砍去低端蓝领摸鱼的水平.....
太恐怖了。真的是生产力.....

有点后悔当时候618没配置128G内存和4T ssd硬盘。现在基本不用想了.....尝试一下就好

随便乱打关键字：

生成几个号称18cm的肌肉男手里拿着广告招贴，招贴内容是推荐chh网站，在上海街边招揽客户，写实风格

houyuzhou 发表于 2025-12-7 19:58

其实算力作用越来越低，因为这方面线上的碾压开源本地跑的，交钱就行。
GEMINI配香蕉生图片，FLOW配VEO3.1生视频，还有SORA2 PRO。发展实在是太快了。

wujiwu 发表于 2025-12-7 20:00

houyuzhou 发表于 2025-12-7 19:58
其实算力作用越来越低，因为这方面线上的碾压开源本地跑的，交钱就行。
GEMINI配香蕉生图片，FLOW配VEO3.1 ...

是比较吓人啊，这东西按照10年前，估计要拿水果找朋友帮忙制作一张。而且原创质量还不则么高的图片

houyuzhou 发表于 2025-12-7 20:04

wujiwu 发表于 2025-12-7 20:00
是比较吓人啊，这东西按照10年前，估计要拿水果找朋友帮忙制作一张。而且原创质量还不则么高的图片 ...

最可怕的是音频领域，SUNO、Synthesizer V、ACE已经让所有的音乐制作人，歌手，录音，编曲事实失去了工作的价值，让所有的未毕业的音乐系学生前途渺茫。

视频图像领域传统手艺人在计算自己的末日倒计时，音频圈无声无息的革命完成了。

现在AI编曲质量高的太可怕了。

wujiwu 发表于 2025-12-7 20:06

houyuzhou 发表于 2025-12-7 20:04
最可怕的是音频领域，SUNO、Synthesizer V、ACE已经让所有的音乐制作人，歌手，录音，编曲事实失去了工作 ...

可以想象得到。别说这些，律师、数据分析师、编剧、作家、估计低端的一系列，混一口饭吃的，不要说前景渺茫，仍然在职的估计也如坐针毡。

houyuzhou 发表于 2025-12-7 20:10

wujiwu 发表于 2025-12-7 20:06
可以想象得到。别说这些，律师、数据分析师、编剧、作家、估计低端的一系列，混一口饭吃的，不要说前景 ...

之前我们觉得AI是好东西，工具便利程度大幅度提高，实际作品创意为王，AI只会让我做得更好，不愁失业的。

没想到AI在创意方面更强大。[狂笑]

行吧，碳基生命存在的价值就是孕育出硅基生命。人类所创造出的辉煌文明远胜过自身的DNA。希望AI研究继续加速，真正的人工智能早日出现，人类文明是时候脱离基因的束缚飞升了。

he8898 发表于 2025-12-7 20:12

以后请AI律师，所有案件系列都告知AI，让AI做辩护，无敌了

manysu 发表于 2025-12-7 20:59

本帖最后由 manysu 于 2025-12-7 21:00 编辑

z-image的模型包能麻烦指个路吗？我有个朋友想要[偷笑]

原神职业玩家 发表于 2025-12-7 21:00

玩不来那个路径。。。只会webui[偷笑]
再说12g显存就不玩视频了

wujiwu 发表于 2025-12-7 21:44

本帖最后由 wujiwu 于 2025-12-7 21:47 编辑

manysu 发表于 2025-12-7 20:59
z-image的模型包能麻烦指个路吗？我有个朋友想要

下载comfyui中文版，拿上魔法，首页推荐几个模板，其中好像第一个就是z-image。非魔法本地模块下载迁移，我也不懂。我是完全新手小白。基本短期不会再研究，等更新几个大版本后，再说

你的问题，估计要去b站找更专业的了解了。

wujiwu 发表于 2025-12-7 21:50

原神职业玩家发表于 2025-12-7 21:00
玩不来那个路径。。。只会webui
再说12g显存就不玩视频了

视频真的没意思，生成太慢了。而且电脑被模型占用，玩不了游戏其他。

RainYu 发表于 2025-12-7 22:39

https://lh3.googleusercontent.com/gg-dl/ABS2GSne_bbPaHzi2KtpPoZtOAiIdYTlFcKHn8KbqXxS6C6zrTcltyjtw-b9KupozJWyO3G5C1sDsJTFgrWTJP-Qo6r0Deg-30rXFFrWJX09wkzc01dWF3zP1jsfaKWQhRioX8wzu1olBxk9GatEqZi3S7Q78-fRGF954njfVLam6M0vgQcftQ=s1024-rj

gemini生产的

chriz 发表于 2025-12-8 00:13

5090优化下可以10分钟5秒左右
B站有速度优化的视频

萌猪哥哥 发表于 2025-12-8 09:00

主要个人玩家感觉也用不上，也不需要靠这个创造生产力，倒是请问下用来修大图（数码相机直出图片）的模型哪个好点，适合新手

wohu4 发表于 2025-12-8 09:17

houyuzhou 发表于 2025-12-7 20:04
最可怕的是音频领域，SUNO、Synthesizer V、ACE已经让所有的音乐制作人，歌手，录音，编曲事实失去了工作 ...

音乐确实牛逼，B站那些ai生成的音乐合集比80%现在新唱的都好听。

yylwm1314 发表于 2025-12-8 09:27

本是想用AI来洗衣做饭搞卫生，我们才有时间来游戏，来创作，来思考。
现在好了，洗衣做饭搞卫生还是自己做。
AI却来创作。。。来思考。。。。
这个世界终究不能以自己的意志来转移。。

fightclub 发表于 2025-12-8 09:48

yylwm1314 发表于 2025-12-8 09:27
本是想用AI来洗衣做饭搞卫生，我们才有时间来游戏，来创作，来思考。
现在好了，洗衣做饭搞卫生还是自己做 ...

AI只是个工具，创作的背后还是人

wujiwu 发表于 2025-12-8 10:06

萌猪哥哥发表于 2025-12-8 09:00
主要个人玩家感觉也用不上，也不需要靠这个创造生产力，倒是请问下用来修大图（数码相机直出图片）的模型哪 ...

我也是基于这个原因尝试玩一下。还没找到办法，魔法值已经用完了

后天发表于 2025-12-8 10:21

2年前吭哧吭哧的配环境搞代码

现在越来越简单；

Setfan 发表于 2025-12-8 10:38

到处都是合成人，

basiak 发表于 2025-12-8 11:40

撸代码还是差点意思，越用越笨[偷笑]
不能全部靠它

iscity 发表于 2025-12-8 14:43

he8898 发表于 2025-12-7 20:12
以后请AI律师，所有案件系列都告知AI，让AI做辩护，无敌了

法官也AI来当[傻笑]

kinglfa 发表于 2025-12-8 21:38

你没生成个轮大切卵子我是很失望

gyc 发表于 2025-12-8 21:45

模型的话，可以看看国内的魔搭，一些国产模型也会在这里发布镜像版本。。

再说一下，小模型还好说，模型一大，直接需要60G显存，根本不是什么升级一个简单配置就能搞定的。。

Ambaril 发表于 2025-12-9 00:13

我在想一个问题，生产力提升50%~500%，需求能提升25%吗？制造业的产品、广告业的商单，最终总要C端买单吧？
AI代替了20%的人工，然后指望他们失业在家订阅API吗？

kanademoment 发表于 2025-12-9 09:21

学习过一段时间并顺便考了生成式ai高级工程师抵3600的税，水证。
对于玩过一段时间的新手，我给出我几点方向建议，
（1）comfyui里面有选择镜像下载模型，json格式工作流导入基本基本镜像下载就可以，如果你了解模型做替换也可以用魔塔官网，基本都能找到；
（2）跑图的话，在1024以下，12G基本上是能满足不OOM（卸载加载模型），直接显卡显存跑，速度很快，如果你要玩商业化工作流，要24G以上，3090是合适的，若在fp8精度下，40系显卡是最合适的，也就是目前最合适的非魔改显卡4090；
（3）要善用lora模型，可以加速生成速度、定向指定生成大方向，lora模型前期一般需要关键词（比如魔塔分享的迪丽热巴的模型，关键词需要在prompt内输入diliraba）；
（4）要学会英语描述prompt，现在底模已经部分支持中文（如qwen、z-image等），但是lora优化模型会对中文有幻视，为了稳定、准确率更高生成内容，建议统一用英文格式。功底差可以用文本框一键翻译（一个comfyui的节点）；
（5）图生成在满足配置情况下，尽量使用原工作流推荐的尺寸（比如1024）或在配置满足下以该尺寸扩大，会影响生成内容的“容积率”，可以理解为“我们给【一个人】的条件为【一个盆】，这个人无法进行【正常游泳而做出游泳动作但不是游泳】的状况”；
（6）CFG越高，输出内容提示词越相关，但如【5】的理解一样，幻视可能性越大，最容易的解决方案是底模模型更大和是lora优化两个方向，还有的时候可以利用提示词动作，比如客户需求是需要生成一个NSFW（工作期间禁止）的提示词，大模型内缺乏对NSFW的训练和内容，“蹲”和“上位式”动作差不多，但是“蹲”可以通过描述实现；
（7）学习一个软件最快的方法是带着项目去学习，和ps学习方法一样，学术派学习当然可以更好的从底层学到更巩固内容并能举一反三，但是工具多现在社会来说，还是更新太快，或许你学到的内容已经被整合成一键式；
（8）Windows下不要用amd显卡，转译、兼容性问题还是优化的很慢，社区主力还是支持cuda的NV显卡；而Linux下的amd基本上能到8-9成效果，但对于更新还是过慢（如z-image模型需要新的节点支持，这时候linux显得力不从心了）；
（9）comfyui支持API，能解决低效能和硬件配置问题，在初步了解内容和搭建的时候，优先建议使用api，而不是把大量时间放在等待生成中；
（10）保持高尚的品质，可以性压抑、可以内心黑暗，但我们要合法合规，大家都不守法不守规矩，ai这个方向的蓝海就会被加上无限道枷锁，不要传播非正能量东西（提裤）。

页: [1]

Chiphell - 分享与交流用户体验's Archiver

试了一下comfyui