wujiwu 发表于 2025-12-7 19:51

试了一下comfyui

本帖最后由 wujiwu 于 2025-12-8 10:11 编辑

之前完全不懂ai,没有接触过本地部署和生成,除了问答对话那种玩过。
今年电脑配置好后,有点无聊,中年人也玩不动什么游戏大作。
9700X+48G+5070ti
这套配置玩以前的老游戏,魔兽世界、暗黑3、lol、还有测试了几个单机大作,也比较得心应手。
于是作死找了ai模型玩,找了一下ai生成图片和视频的comfyui集合。本意就是无聊........

拿上魔法工具下载模型
就推荐首页几个模型下载过来测试随便玩。感觉低端广告公司图片制作和小视频宣传可以接近失业状态。
通过关键字,已经可以生成不错的图片质量和短视频。还没玩到换面,变声,替换 那些东西。
几个模型就把魔法血条150G每月魔法值用光。要等下个月恢复魔力......
image-z图片生成质量非常高,接近以假乱真的情况。图片生成比较快,我的电脑运行跑大概十秒左右钟就出来作品。

视频玩了一下,不行,生成太慢(自己也不懂配参数),整台电脑运行接近两个小时出5秒片。看着电脑显卡满载或者内存满载,感觉得不偿失。
还是吃了显存不够大的亏。看了一下耗时的地方,主要显卡核心和显存吃满。
通过这次试玩整体来说,ai模型部署本地,真的是小公司福音了,制作短视频和图片广告,完全可以砍去低端蓝领摸鱼的水平.....
太恐怖了。真的是生产力.....

有点后悔当时候618没配置128G内存和4T ssd硬盘。现在基本不用想了.....尝试一下就好





随便乱打关键字:

生成几个号称18cm的肌肉男手里拿着广告招贴,招贴内容是推荐chh网站,在上海街边招揽客户,写实风格

houyuzhou 发表于 2025-12-7 19:58

其实算力作用越来越低,因为这方面线上的碾压开源本地跑的,交钱就行。
GEMINI配香蕉生图片,FLOW配VEO3.1生视频,还有SORA2 PRO。 发展实在是太快了。

wujiwu 发表于 2025-12-7 20:00

houyuzhou 发表于 2025-12-7 19:58
其实算力作用越来越低,因为这方面线上的碾压开源本地跑的,交钱就行。
GEMINI配香蕉生图片,FLOW配VEO3.1 ...

是比较吓人啊,这东西按照10年前,估计要拿水果找朋友帮忙 制作一张。而且原创质量还不则么高的图片

houyuzhou 发表于 2025-12-7 20:04

wujiwu 发表于 2025-12-7 20:00
是比较吓人啊,这东西按照10年前,估计要拿水果找朋友帮忙 制作一张。而且原创质量还不则么高的图片 ...

最可怕的是音频领域,SUNO、Synthesizer V、ACE已经让所有的音乐制作人,歌手,录音,编曲事实失去了工作的价值,让所有的未毕业的音乐系学生前途渺茫。

视频图像领域传统手艺人在计算自己的末日倒计时,音频圈无声无息的革命完成了。

现在AI编曲质量高的太可怕了。

wujiwu 发表于 2025-12-7 20:06

houyuzhou 发表于 2025-12-7 20:04
最可怕的是音频领域,SUNO、Synthesizer V、ACE已经让所有的音乐制作人,歌手,录音,编曲事实失去了工作 ...

可以想象得到。别说 这些,律师、数据分析师、编剧、作家、估计低端的一系列 ,混一口饭吃的,不要说前景渺茫,仍然在职的估计也如坐针毡。

houyuzhou 发表于 2025-12-7 20:10

wujiwu 发表于 2025-12-7 20:06
可以想象得到。别说 这些,律师、数据分析师、编剧、作家、估计低端的一系列 ,混一口饭吃的,不要说前景 ...

之前我们觉得AI是好东西,工具便利程度大幅度提高,实际作品创意为王,AI只会让我做得更好,不愁失业的。

没想到AI在创意方面更强大。[狂笑]

行吧,碳基生命存在的价值就是孕育出硅基生命。 人类所创造出的辉煌文明远胜过自身的DNA。 希望AI研究继续加速,真正的人工智能早日出现,人类文明是时候脱离基因的束缚飞升了。

he8898 发表于 2025-12-7 20:12

以后请AI律师,所有案件系列都告知AI,让AI做辩护,无敌了

manysu 发表于 2025-12-7 20:59

本帖最后由 manysu 于 2025-12-7 21:00 编辑

z-image的模型包能麻烦指个路吗?我有个朋友想要[偷笑]

原神职业玩家 发表于 2025-12-7 21:00

玩不来那个路径。。。只会webui[偷笑]
再说12g显存就不玩视频了

wujiwu 发表于 2025-12-7 21:44

本帖最后由 wujiwu 于 2025-12-7 21:47 编辑

manysu 发表于 2025-12-7 20:59
z-image的模型包能麻烦指个路吗?我有个朋友想要

下载comfyui中文版,拿上魔法,首页推荐几个模板,其中好像第一个就是z-image。非魔法本地模块下载迁移,我也不懂。我是完全新手小白。基本短期不会再研究,等更新几个大版本后,再说

你的问题,估计要去b站找更专业的了解了。

wujiwu 发表于 2025-12-7 21:50

原神职业玩家 发表于 2025-12-7 21:00
玩不来那个路径。。。只会webui
再说12g显存就不玩视频了

视频真的没意思,生成太慢了。而且电脑被模型占用,玩不了游戏其他。

RainYu 发表于 2025-12-7 22:39

https://lh3.googleusercontent.com/gg-dl/ABS2GSne_bbPaHzi2KtpPoZtOAiIdYTlFcKHn8KbqXxS6C6zrTcltyjtw-b9KupozJWyO3G5C1sDsJTFgrWTJP-Qo6r0Deg-30rXFFrWJX09wkzc01dWF3zP1jsfaKWQhRioX8wzu1olBxk9GatEqZi3S7Q78-fRGF954njfVLam6M0vgQcftQ=s1024-rj

gemini生产的

chriz 发表于 2025-12-8 00:13

5090优化下可以10分钟5秒左右
B站有速度优化的视频

萌猪哥哥 发表于 2025-12-8 09:00

主要个人玩家感觉也用不上,也不需要靠这个创造生产力,倒是请问下用来修大图(数码相机直出图片)的模型哪个好点,适合新手

wohu4 发表于 2025-12-8 09:17

houyuzhou 发表于 2025-12-7 20:04
最可怕的是音频领域,SUNO、Synthesizer V、ACE已经让所有的音乐制作人,歌手,录音,编曲事实失去了工作 ...

音乐确实牛逼,B站那些ai生成的音乐合集比80%现在新唱的都好听。

yylwm1314 发表于 2025-12-8 09:27

本是想用AI来洗衣做饭搞卫生,我们才有时间来游戏,来创作,来思考。
现在好了,洗衣做饭搞卫生还是自己做。
AI却来创作。。。来思考。。。。
这个世界终究不能以自己的意志来转移。。

fightclub 发表于 2025-12-8 09:48

yylwm1314 发表于 2025-12-8 09:27
本是想用AI来洗衣做饭搞卫生,我们才有时间来游戏,来创作,来思考。
现在好了,洗衣做饭搞卫生还是自己做 ...

AI只是个工具,创作的背后还是人

wujiwu 发表于 2025-12-8 10:06

萌猪哥哥 发表于 2025-12-8 09:00
主要个人玩家感觉也用不上,也不需要靠这个创造生产力,倒是请问下用来修大图(数码相机直出图片)的模型哪 ...

我也是基于这个 原因尝试玩一下。还没找到办法,魔法值已经用完了

后天 发表于 2025-12-8 10:21

2年前吭哧吭哧的配环境搞代码

现在越来越简单;

Setfan 发表于 2025-12-8 10:38

到处都是合成人,

basiak 发表于 2025-12-8 11:40

撸代码还是差点意思,越用越笨[偷笑]
不能全部靠它

iscity 发表于 2025-12-8 14:43

he8898 发表于 2025-12-7 20:12
以后请AI律师,所有案件系列都告知AI,让AI做辩护,无敌了

法官也AI来当[傻笑]

kinglfa 发表于 2025-12-8 21:38

你没生成个轮大切卵子我是很失望

gyc 发表于 2025-12-8 21:45

模型的话,可以看看国内的 魔搭,一些国产模型也会在这里发布镜像版本。。


再说一下, 小模型还好说, 模型一大, 直接需要60G显存, 根本不是什么升级一个简单配置就能搞定的。。

Ambaril 发表于 2025-12-9 00:13

我在想一个问题,生产力提升50%~500%,需求能提升25%吗?制造业的产品、广告业的商单,最终总要C端买单吧?
AI代替了20%的人工,然后指望他们失业在家订阅API吗?

kanademoment 发表于 2025-12-9 09:21

学习过一段时间并顺便考了生成式ai高级工程师抵3600的税,水证。
对于玩过一段时间的新手,我给出我几点方向建议,
(1)comfyui里面有选择镜像下载模型,json格式工作流导入基本基本镜像下载就可以,如果你了解模型做替换也可以用魔塔官网,基本都能找到;
(2)跑图的话,在1024以下,12G基本上是能满足不OOM(卸载加载模型),直接显卡显存跑,速度很快,如果你要玩商业化工作流,要24G以上,3090是合适的,若在fp8精度下,40系显卡是最合适的,也就是目前最合适的非魔改显卡4090;
(3)要善用lora模型,可以加速生成速度、定向指定生成大方向,lora模型前期一般需要关键词(比如魔塔分享的迪丽热巴的模型,关键词需要在prompt内输入diliraba);
(4)要学会英语描述prompt,现在底模已经部分支持中文(如qwen、z-image等),但是lora优化模型会对中文有幻视,为了稳定、准确率更高生成内容,建议统一用英文格式。功底差可以用文本框一键翻译(一个comfyui的节点);
(5)图生成在满足配置情况下,尽量使用原工作流推荐的尺寸(比如1024)或在配置满足下以该尺寸扩大,会影响生成内容的“容积率”,可以理解为“我们给【一个人】的条件为【一个盆】,这个人无法进行【正常游泳而做出游泳动作但不是游泳】的状况”;
(6)CFG越高,输出内容提示词越相关,但如【5】的理解一样,幻视可能性越大,最容易的解决方案是底模模型更大和是lora优化两个方向,还有的时候可以利用提示词动作,比如客户需求是需要生成一个NSFW(工作期间禁止)的提示词,大模型内缺乏对NSFW的训练和内容,“蹲”和“上位式”动作差不多,但是“蹲”可以通过描述实现;
(7)学习一个软件最快的方法是带着项目去学习,和ps学习方法一样,学术派学习当然可以更好的从底层学到更巩固内容并能举一反三,但是工具多现在社会来说,还是更新太快,或许你学到的内容已经被整合成一键式;
(8)Windows下不要用amd显卡,转译、兼容性问题还是优化的很慢,社区主力还是支持cuda的NV显卡;而Linux下的amd基本上能到8-9成效果,但对于更新还是过慢(如z-image模型需要新的节点支持,这时候linux显得力不从心了);
(9)comfyui支持API,能解决低效能和硬件配置问题,在初步了解内容和搭建的时候,优先建议使用api,而不是把大量时间放在等待生成中;
(10)保持高尚的品质,可以性压抑、可以内心黑暗,但我们要合法合规,大家都不守法不守规矩,ai这个方向的蓝海就会被加上无限道枷锁,不要传播非正能量东西(提裤)。
页: [1]
查看完整版本: 试了一下comfyui