找回密码
 加入我们
搜索
      
楼主: nApoleon

[显卡] 其实所有的"AI加速"以我看就是GPU和软件厂商的PY交易~

[复制链接]
发表于 2024-2-18 22:32 来自手机 | 显示全部楼层
nApoleon 发表于 2024-2-18 22:11
可是我至今没理解,为什么整个LR软件都可以脱离GPU,但唯独这个功能就只吃GPU…也许我有点钻牛角尖,但我始 ...

你拿aida64跑一下CPU和GPU的单精度浮点理论性能就明白了,性能差4090的数十倍。而且,你要想发挥出CPU的理论性能需要高度优化的avx专用代码,不然瓶颈跑到内存上,你能发挥出CPU1/10的性能都谢天谢地了。
 楼主| 发表于 2024-2-18 22:35 | 显示全部楼层
chungexcy 发表于 2024-2-18 22:32
你拿aida64跑一下CPU和GPU的单精度浮点理论性能就明白了,性能差4090的数十倍。而且,你要想发挥出CPU的 ...


你还没理解我的困惑...LR整个软件就偏偏这一项的功能是必须非GPU不可的?这可是图片编辑软件啊,其它功能调色啊之类的难道就CPU又行了?
发表于 2024-2-18 22:38 来自手机 | 显示全部楼层
nApoleon 发表于 2024-2-18 22:35
你还没理解我的困惑...LR整个软件就偏偏这一项的功能是必须非GPU不可的?这可是图片编辑软件啊,其它功能调 ...

我跟你的理解相反,明明图像处理的很多其他功能都能用GPU加速,为啥它只做了这一个,其他都在偷懒?
 楼主| 发表于 2024-2-18 22:40 | 显示全部楼层
chungexcy 发表于 2024-2-18 22:38
我跟你的理解相反,明明图像处理的很多其他功能都能用GPU加速,为啥它只做了这一个,其他都在偷懒? ...

这话肯定不对啊,除了这个功能其它我都只用CPU编辑图片都很快啊.
发表于 2024-2-18 22:44 来自手机 | 显示全部楼层
nApoleon 发表于 2024-2-18 22:40
这话肯定不对啊,除了这个功能其它我都只用CPU编辑图片都很快啊.

对,所以一个功能是否开发,得用实际需求来解释,如果计算量少,CPU就很快了,那就没有用GPU来算的必要,光pice那小带宽搬数据花的时间就可能比CPU计算部分还多。

反过来你看pr/达芬奇这些视频软件,动不动就说4k分辨率60帧的大数据量,而且GPU解码完了直接在显存里呆着,GPU直接算还不用copy回内存,哪一个不是大量使用GPU加速的?
 楼主| 发表于 2024-2-18 22:50 | 显示全部楼层
chungexcy 发表于 2024-2-18 22:44
对,所以一个功能是否开发,得用实际需求来解释,如果计算量少,CPU就很快了,那就没有用GPU来算的必要, ...


别拿视频和图片对比吧,视频需要你说的大显存高带宽,因为视频的源文件就很大,刻一张图片哪怕RAW也就几百兆,你觉得拿带宽和显存说服的了我嘛...或者...说服的了你自己么...
或者,我们把问题给简单化,来聊聊一个最简单的问题好了,给一张图片套滤镜换色,和给一张图片除去杂色,怎么就不一样了?难道不都是在改变每一个像素点的颜色么?
结果,前者CPU随便干,后者CPU完全趴下了...
发表于 2024-2-18 22:50 | 显示全部楼层
chungexcy 发表于 2024-2-18 22:44
对,所以一个功能是否开发,得用实际需求来解释,如果计算量少,CPU就很快了,那就没有用GPU来算的必要, ...

换个角度看,可以使用但未用GPU加速运算的领域还不少; 这些领域都是GPU的潜在机会。
 楼主| 发表于 2024-2-18 22:51 | 显示全部楼层
fairness 发表于 2024-2-18 22:50
换个角度看,可以使用但未用GPU加速运算的领域还不少; 这些领域都是GPU的潜在机会。 ...


ARM:恩?你们再说我么?
发表于 2024-2-18 22:57 | 显示全部楼层
本帖最后由 星辰柯博文 于 2024-2-18 23:00 编辑

CPU是标量运算、顺序运算,GPU是向量运算、并行运算。
这是大学计算机原理的基础知识。

去杂色是一个向量、并行型运算,让CPU做不是不行,但效率很差。一个向量要用好几个标量的组合来表示。在不存在通信瓶颈的情况下,CPU和GPU分别吃掉200W功耗,但CPU只能干后者几分之一的活。既然这样,不如干脆让CPU休息,后台听歌播放流畅些。

至于拔掉所有显卡并屏蔽核显,用CPU也能运行,这就更好解释了,软件渲染嘛。但凡有一张显卡在,谁用软件渲染啊。

用CPU和GPU并行工作进行向量(图形)运算,上一个这么干的厂商叫索尼。众所周知,PS2、PS3游戏出了名的难优化。
发表于 2024-2-18 22:58 来自手机 | 显示全部楼层
nApoleon 发表于 2024-2-18 22:50
别拿视频和图片对比吧,视频需要你说的大显存高带宽,因为视频的源文件就很大,刻一张图片哪怕RAW也就几百兆 ...

滤镜换色20年前的CPU都能干。。。这不就是几个4x4矩阵运算的事?

你真的不了解现在卷积神经网络对计算量的恐怖需求。或者说,你觉得lr不应该用ai算法来跑降噪,应该用回以前的bm3d这种CPU算法。
 楼主| 发表于 2024-2-18 22:59 来自手机 | 显示全部楼层
星辰柯博文 发表于 2024-2-18 22:57
CPU是标量运算、顺序运算,GPU是向量运算、并行运算。
这是大学计算机原理的基础知识。


去杂色有那么复杂嘛…
发表于 2024-2-18 22:59 来自手机 | 显示全部楼层
fairness 发表于 2024-2-18 22:50
换个角度看,可以使用但未用GPU加速运算的领域还不少; 这些领域都是GPU的潜在机会。 ...

随着以后ai算法不断取代以前的旧算法,GPU的应用率回越来越多,或者npu这种专用单元
发表于 2024-2-18 23:04 | 显示全部楼层
我想法很简单啦
软件不崩溃的前提下,谁快选谁
发表于 2024-2-18 23:04 | 显示全部楼层
nApoleon 发表于 2024-2-18 22:59
去杂色有那么复杂嘛…

现在的去杂色是更复杂一点的“材质过滤”“纹理过滤”“抗锯齿”。
以前的去杂色是一种“模糊”。
 楼主| 发表于 2024-2-18 23:08 来自手机 | 显示全部楼层
星辰柯博文 发表于 2024-2-18 23:04
现在的去杂色是更复杂一点的“材质过滤”“纹理过滤”“抗锯齿”。
以前的去杂色是一种“模糊”。 ...

学习了…
发表于 2024-2-18 23:11 来自手机 | 显示全部楼层
本帖最后由 chungexcy 于 2024-2-18 23:13 编辑
nApoleon 发表于 2024-2-18 22:50
别拿视频和图片对比吧,视频需要你说的大显存高带宽,因为视频的源文件就很大,刻一张图片哪怕RAW也就几百兆 ...


我拿视频对比图片,和pcie带宽举例,是解释为啥同一类算法,视频处理倾向于GPU,而单张图片更倾向于不用GPU。

一个图片,读图20s,CPU调色处理2s,如果拿给GPU做,pcie来回传输就2s起步,然后GPU画0.01s计算?你觉得你回用GPU么?
发表于 2024-2-18 23:33 来自手机 | 显示全部楼层
nApoleon 发表于 2024-2-18 22:50
别拿视频和图片对比吧,视频需要你说的大显存高带宽,因为视频的源文件就很大,刻一张图片哪怕RAW也就几百兆 ...

我懂了。。。你说去杂色就是改变每一个像素颜色。和调色一样,都是改变每一个像素颜色。

问题是你怎么知道要怎么改变颜色,怎么判断这个像素的是杂色,其他不是,如果是杂色又该换成什么颜色,这个决策得靠ai算啊。调色不一样,你已经告诉软件要怎么调的,他只是按照你的要求对每个像素统一处理。

像你楼上说的,以前直接高斯模糊滤镜,不需要判断,当然就跟统一调色一样快。

找老师傅维修就换了一个电容。换一个电容容易,知道换哪个需要10年经验。

发表于 2024-2-19 00:51 | 显示全部楼层
这种降噪技术,纯 CPU 运行一张图片需要 10 分钟,而 4090 只需几秒钟。
兩者效率差距 让CPU参与干活,想累死软件开发吧?
发表于 2024-2-19 00:58 | 显示全部楼层
螢幕擷取畫面 2024-02-19 005310.jpg

4090

螢幕擷取畫面 2024-02-19 005758.jpg

13900
发表于 2024-2-19 01:04 | 显示全部楼层
本帖最后由 raiya 于 2024-2-19 09:25 编辑

为什么不让CPU GPU同时干一件事情。

一张图片是切成几千个小块处理的。把这些小块拼起来的时候,是要参考相邻小块,把边界的像素融合在一起的。

CPU处理的在内存里,GPU处理的在显存里,这时候就是需要内存和显存数据交换。

内存慢,而且这工作也占用CPU。结果光是数据传输就已经把CPU算力耗光了。

所以还不如不要CPU。
发表于 2024-2-19 09:17 | 显示全部楼层
本帖最后由 KMDYX 于 2024-2-19 09:21 编辑
raiya 发表于 2024-2-19 01:04
为什么不让CPU GPU同时干一件事情。

一张图片是切成几千个小块处理的。把这些小块拼起来的时候,是要参考 ...


典型例子:gpu渲染器redshift很早就支持cpu+gpu混合渲染了,但是开启混合渲染之后除了cpu满载,风扇起飞,还有渲染速度变慢之外一无是处
为了不让其他硬件空闲,就硬安排他干一些自身不擅长的工作,大概率会拖其他硬件的后退
发表于 2024-2-19 18:01 | 显示全部楼层
本帖最后由 阿崔 于 2024-2-19 18:04 编辑
nApoleon 发表于 2024-2-18 16:54
blender是什么...完全不知道...求介绍...


https://blender.org

一个3d软件,用里面compositor也能修图,compositor+video sequence editor可以处理视频,而且因为用的是python,额外要求还可以直接接opencv、tensorflow、pytorch这些。。。

基本就是修图、剪辑、特效、合成一锅炖的软件。
 楼主| 发表于 2024-2-19 18:06 | 显示全部楼层
chungexcy 发表于 2024-2-18 23:33
我懂了。。。你说去杂色就是改变每一个像素颜色。和调色一样,都是改变每一个像素颜色。

问题是你怎么知 ...

你终于明白我纠结的地方在哪里了...
 楼主| 发表于 2024-2-19 18:07 | 显示全部楼层
阿崔 发表于 2024-2-19 18:01
https://blender.org

一个3d软件,用里面compositor也能修图,compositor+video sequence editor可以处 ...

感谢,我来研究研究~
发表于 2024-2-19 20:34 | 显示全部楼层
nApoleon 发表于 2024-2-19 18:06
你终于明白我纠结的地方在哪里了...

是大部分人没有想到你真的不知道。我都以为你在钓鱼制造话题。
 楼主| 发表于 2024-2-19 20:36 | 显示全部楼层
raiya 发表于 2024-2-19 20:34
是大部分人没有想到你真的不知道。我都以为你在钓鱼制造话题。


我是有那种心机的人么...
发表于 2024-2-19 21:33 | 显示全部楼层
难绷,哈哈哈哈。
发表于 2024-2-19 21:58 | 显示全部楼层
好像最早的软解和硬解就是这个路子嘛。。。一个干活一个看戏
发表于 2024-2-19 23:53 来自手机 | 显示全部楼层
panzerlied 发表于 2024-2-19 21:33
难绷,哈哈哈哈。

我最后是真的绷不住了哈哈
发表于 2024-2-20 02:44 | 显示全部楼层
在微博看到有人挂弱智,特前来围观
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2024-6-9 20:08 , Processed in 0.013782 second(s), 6 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表