chungexcy 发表于 2024-2-18 22:32

nApoleon 发表于 2024-2-18 22:11
可是我至今没理解,为什么整个LR软件都可以脱离GPU,但唯独这个功能就只吃GPU…也许我有点钻牛角尖,但我始 ...

你拿aida64跑一下CPU和GPU的单精度浮点理论性能就明白了,性能差4090的数十倍。而且,你要想发挥出CPU的理论性能需要高度优化的avx专用代码,不然瓶颈跑到内存上,你能发挥出CPU1/10的性能都谢天谢地了。

nApoleon 发表于 2024-2-18 22:35

chungexcy 发表于 2024-2-18 22:32
你拿aida64跑一下CPU和GPU的单精度浮点理论性能就明白了,性能差4090的数十倍。而且,你要想发挥出CPU的 ...

你还没理解我的困惑...LR整个软件就偏偏这一项的功能是必须非GPU不可的?这可是图片编辑软件啊,其它功能调色啊之类的难道就CPU又行了?

chungexcy 发表于 2024-2-18 22:38

nApoleon 发表于 2024-2-18 22:35
你还没理解我的困惑...LR整个软件就偏偏这一项的功能是必须非GPU不可的?这可是图片编辑软件啊,其它功能调 ...

我跟你的理解相反,明明图像处理的很多其他功能都能用GPU加速,为啥它只做了这一个,其他都在偷懒?

nApoleon 发表于 2024-2-18 22:40

chungexcy 发表于 2024-2-18 22:38
我跟你的理解相反,明明图像处理的很多其他功能都能用GPU加速,为啥它只做了这一个,其他都在偷懒? ...

这话肯定不对啊,除了这个功能其它我都只用CPU编辑图片都很快啊.

chungexcy 发表于 2024-2-18 22:44

nApoleon 发表于 2024-2-18 22:40
这话肯定不对啊,除了这个功能其它我都只用CPU编辑图片都很快啊.

对,所以一个功能是否开发,得用实际需求来解释,如果计算量少,CPU就很快了,那就没有用GPU来算的必要,光pice那小带宽搬数据花的时间就可能比CPU计算部分还多。

反过来你看pr/达芬奇这些视频软件,动不动就说4k分辨率60帧的大数据量,而且GPU解码完了直接在显存里呆着,GPU直接算还不用copy回内存,哪一个不是大量使用GPU加速的?

nApoleon 发表于 2024-2-18 22:50

chungexcy 发表于 2024-2-18 22:44
对,所以一个功能是否开发,得用实际需求来解释,如果计算量少,CPU就很快了,那就没有用GPU来算的必要, ...

别拿视频和图片对比吧,视频需要你说的大显存高带宽,因为视频的源文件就很大,刻一张图片哪怕RAW也就几百兆,你觉得拿带宽和显存说服的了我嘛...或者...说服的了你自己么...
或者,我们把问题给简单化,来聊聊一个最简单的问题好了,给一张图片套滤镜换色,和给一张图片除去杂色,怎么就不一样了?难道不都是在改变每一个像素点的颜色么?
结果,前者CPU随便干,后者CPU完全趴下了...

fairness 发表于 2024-2-18 22:50

chungexcy 发表于 2024-2-18 22:44
对,所以一个功能是否开发,得用实际需求来解释,如果计算量少,CPU就很快了,那就没有用GPU来算的必要, ...

换个角度看,可以使用但未用GPU加速运算的领域还不少; 这些领域都是GPU的潜在机会。

nApoleon 发表于 2024-2-18 22:51

fairness 发表于 2024-2-18 22:50
换个角度看,可以使用但未用GPU加速运算的领域还不少; 这些领域都是GPU的潜在机会。 ...

ARM:恩?你们再说我么?

星辰柯博文 发表于 2024-2-18 22:57

本帖最后由 星辰柯博文 于 2024-2-18 23:00 编辑

CPU是标量运算、顺序运算,GPU是向量运算、并行运算。
这是大学计算机原理的基础知识。

去杂色是一个向量、并行型运算,让CPU做不是不行,但效率很差。一个向量要用好几个标量的组合来表示。在不存在通信瓶颈的情况下,CPU和GPU分别吃掉200W功耗,但CPU只能干后者几分之一的活。既然这样,不如干脆让CPU休息,后台听歌播放流畅些。

至于拔掉所有显卡并屏蔽核显,用CPU也能运行,这就更好解释了,软件渲染嘛。但凡有一张显卡在,谁用软件渲染啊。

用CPU和GPU并行工作进行向量(图形)运算,上一个这么干的厂商叫索尼。众所周知,PS2、PS3游戏出了名的难优化。

chungexcy 发表于 2024-2-18 22:58

nApoleon 发表于 2024-2-18 22:50
别拿视频和图片对比吧,视频需要你说的大显存高带宽,因为视频的源文件就很大,刻一张图片哪怕RAW也就几百兆 ...

滤镜换色20年前的CPU都能干。。。这不就是几个4x4矩阵运算的事?

你真的不了解现在卷积神经网络对计算量的恐怖需求。或者说,你觉得lr不应该用ai算法来跑降噪,应该用回以前的bm3d这种CPU算法。

nApoleon 发表于 2024-2-18 22:59

星辰柯博文 发表于 2024-2-18 22:57
CPU是标量运算、顺序运算,GPU是向量运算、并行运算。
这是大学计算机原理的基础知识。



去杂色有那么复杂嘛…

chungexcy 发表于 2024-2-18 22:59

fairness 发表于 2024-2-18 22:50
换个角度看,可以使用但未用GPU加速运算的领域还不少; 这些领域都是GPU的潜在机会。 ...

随着以后ai算法不断取代以前的旧算法,GPU的应用率回越来越多,或者npu这种专用单元

木子滴血 发表于 2024-2-18 23:04

我想法很简单啦
软件不崩溃的前提下,谁快选谁

星辰柯博文 发表于 2024-2-18 23:04

nApoleon 发表于 2024-2-18 22:59
去杂色有那么复杂嘛…

现在的去杂色是更复杂一点的“材质过滤”“纹理过滤”“抗锯齿”。
以前的去杂色是一种“模糊”。

nApoleon 发表于 2024-2-18 23:08

星辰柯博文 发表于 2024-2-18 23:04
现在的去杂色是更复杂一点的“材质过滤”“纹理过滤”“抗锯齿”。
以前的去杂色是一种“模糊”。 ...

学习了…

chungexcy 发表于 2024-2-18 23:11

本帖最后由 chungexcy 于 2024-2-18 23:13 编辑

nApoleon 发表于 2024-2-18 22:50
别拿视频和图片对比吧,视频需要你说的大显存高带宽,因为视频的源文件就很大,刻一张图片哪怕RAW也就几百兆 ...

我拿视频对比图片,和pcie带宽举例,是解释为啥同一类算法,视频处理倾向于GPU,而单张图片更倾向于不用GPU。

一个图片,读图20s,CPU调色处理2s,如果拿给GPU做,pcie来回传输就2s起步,然后GPU画0.01s计算?你觉得你回用GPU么?

chungexcy 发表于 2024-2-18 23:33

nApoleon 发表于 2024-2-18 22:50
别拿视频和图片对比吧,视频需要你说的大显存高带宽,因为视频的源文件就很大,刻一张图片哪怕RAW也就几百兆 ...

我懂了。。。你说去杂色就是改变每一个像素颜色。和调色一样,都是改变每一个像素颜色。

问题是你怎么知道要怎么改变颜色,怎么判断这个像素的是杂色,其他不是,如果是杂色又该换成什么颜色,这个决策得靠ai算啊。调色不一样,你已经告诉软件要怎么调的,他只是按照你的要求对每个像素统一处理。

像你楼上说的,以前直接高斯模糊滤镜,不需要判断,当然就跟统一调色一样快。

找老师傅维修就换了一个电容。换一个电容容易,知道换哪个需要10年经验。

tangex 发表于 2024-2-19 00:51

这种降噪技术,纯 CPU 运行一张图片需要 10 分钟,而 4090 只需几秒钟。
兩者效率差距 让CPU参与干活,想累死软件开发吧?[偷笑]

tangex 发表于 2024-2-19 00:58



4090



13900

raiya 发表于 2024-2-19 01:04

本帖最后由 raiya 于 2024-2-19 09:25 编辑

为什么不让CPU GPU同时干一件事情。

一张图片是切成几千个小块处理的。把这些小块拼起来的时候,是要参考相邻小块,把边界的像素融合在一起的。

CPU处理的在内存里,GPU处理的在显存里,这时候就是需要内存和显存数据交换。

内存慢,而且这工作也占用CPU。结果光是数据传输就已经把CPU算力耗光了。

所以还不如不要CPU。

KMDYX 发表于 2024-2-19 09:17

本帖最后由 KMDYX 于 2024-2-19 09:21 编辑

raiya 发表于 2024-2-19 01:04
为什么不让CPU GPU同时干一件事情。

一张图片是切成几千个小块处理的。把这些小块拼起来的时候,是要参考 ...

典型例子:gpu渲染器redshift很早就支持cpu+gpu混合渲染了,但是开启混合渲染之后除了cpu满载,风扇起飞,还有渲染速度变慢之外一无是处[困惑]
为了不让其他硬件空闲,就硬安排他干一些自身不擅长的工作,大概率会拖其他硬件的后退[困惑]

阿崔 发表于 2024-2-19 18:01

本帖最后由 阿崔 于 2024-2-19 18:04 编辑

nApoleon 发表于 2024-2-18 16:54
blender是什么...完全不知道...求介绍...

https://blender.org

一个3d软件,用里面compositor也能修图,compositor+video sequence editor可以处理视频,而且因为用的是python,额外要求还可以直接接opencv、tensorflow、pytorch这些。。。

基本就是修图、剪辑、特效、合成一锅炖的软件。

nApoleon 发表于 2024-2-19 18:06

chungexcy 发表于 2024-2-18 23:33
我懂了。。。你说去杂色就是改变每一个像素颜色。和调色一样,都是改变每一个像素颜色。

问题是你怎么知 ...

你终于明白我纠结的地方在哪里了...

nApoleon 发表于 2024-2-19 18:07

阿崔 发表于 2024-2-19 18:01
https://blender.org

一个3d软件,用里面compositor也能修图,compositor+video sequence editor可以处 ...

感谢,我来研究研究~

raiya 发表于 2024-2-19 20:34

nApoleon 发表于 2024-2-19 18:06
你终于明白我纠结的地方在哪里了...

是大部分人没有想到你真的不知道。我都以为你在钓鱼制造话题。

nApoleon 发表于 2024-2-19 20:36

raiya 发表于 2024-2-19 20:34
是大部分人没有想到你真的不知道。我都以为你在钓鱼制造话题。

我是有那种心机的人么...[困惑]

panzerlied 发表于 2024-2-19 21:33

难绷,哈哈哈哈。

reinhard_x 发表于 2024-2-19 21:58

好像最早的软解和硬解就是这个路子嘛。。。一个干活一个看戏

chungexcy 发表于 2024-2-19 23:53

panzerlied 发表于 2024-2-19 21:33
难绷,哈哈哈哈。

我最后是真的绷不住了哈哈

remidre 发表于 2024-2-20 02:44

在微博看到有人挂弱智,特前来围观
页: 1 2 3 [4] 5
查看完整版本: 其实所有的"AI加速"以我看就是GPU和软件厂商的PY交易~