其实所有的"AI加速"以我看就是GPU和软件厂商的PY交易~

cuixiang · 发表于 2024-2-17 23:31

就像老板配秘书，
有些秘书出差能力强，
干活也能干，但。。。

netjunegg · 发表于 2024-2-17 23:33

你的意思是让cpu跑满，然后实际只干了零头的活? 正常人都不愿意这么设计。

yehaku · 发表于 2024-2-17 23:37

资本一直都是玩捆绑盈利的。就像微软捆绑DX10捆绑WIN10一样。
好多硬件就本来WIN7能跑的。但是就是不让你用不给做驱动。
逼你去用阿三的新系统。体积大界面差。需要点击的鼠标次数多。

archxm · 发表于 2024-2-17 23:45

cuixiang 发表于 2024-2-17 23:29
社会在进步，硬件自然也在进步。
能干的事也会越来越多。
但也要看能效吧？

可别搞深度，负优化

可怕

一日 · 发表于 2024-2-17 23:49

nApoleon 发表于 2024-2-17 06:45
图形软件里除了这个"去杂色"其它所有的特效可都是CPU为主在干的,那你觉得是CPU干不了这个呢,还是干不好这 ...

我一直在强调CPU干不好。Lightroom这些已经有的功能，重写GPU版本费时费力，就让大家多等等呗

raiya · 发表于 2024-2-18 00:06

本帖最后由 raiya 于 2024-2-18 00:11 编辑

CPU GPU是完全不同的东西。CPU就是单核性能强，适合逻辑性时序性强的任务。GPU核心多，适合并行的，没有时序性要求的任务，比如说把一个画面分割成小块，处理完拼起来，就是GPU的强项。你强行把任务分配给CPU GPU同时处理，还要涉及到内存显存的数据交换，光这部分就已经可以占用掉100%的CPU了，还会让整件事情变慢。

苹果的芯片是一个CPU GPU AI的多个模块封装在一起的东西，他们共用一个内存。

alibabatadie · 发表于 2024-2-18 07:27

术业有专攻，让合适的产品干擅长的事情。你好我好大家好。

nApoleon · 发表于 2024-2-18 07:36

alibabatadie 发表于 2024-2-18 07:27
术业有专攻，让合适的产品干擅长的事情。你好我好大家好。

真要这样的话就应该CPU＋GPU一同出力,效率最大化,不然很明显就是开后门,毕竟CPU闲着也是闲着,况且CPU也不是不能干~

bigeblis · 发表于 2024-2-18 07:48

提示: 作者被禁止或删除内容自动屏蔽

alibabatadie · 发表于 2024-2-18 07:48

nApoleon 发表于 2024-2-18 07:36
真要这样的话就应该CPU＋GPU一同出力,效率最大化,不然很明显就是开后门,毕竟CPU闲着也是闲着,况且CPU也不 ...

cpu是领导，领导一般不干活，特别缺人运转不下去情况下才会顶替员工。领导还说了：他还要协调各部门，保证全局可控，可响应

nApoleon · 发表于 2024-2-18 07:53

bigeblis 发表于 2024-2-18 07:48
那么，你关掉GPU加速让CPU来干的时候，速度怎么样呢？
如果一样，那才是PY交易。像你测试的那样，速度差距 ...

应该是不行的,因为现在这玩意就必须要GPU…而且也只调用GPU…坏就坏在这里…

nApoleon · 发表于 2024-2-18 07:54

alibabatadie 发表于 2024-2-18 07:48
cpu是领导，领导一般不干活，特别缺人运转不下去情况下才会顶替员工。领导还说了：他还要协调各部门，保 ...

但从我的角度,CPU才是大BOSS,是一个公司的顶梁柱,GPU是员工,请员工会增加公司的运营成本,能老板亲历亲为自己干的才是真为公司省钱...

raiya · 发表于 2024-2-18 08:13

本帖最后由 raiya 于 2024-2-18 08:30 编辑

nApoleon 发表于 2024-2-18 07:54
但从我的角度,CPU才是大BOSS,是一个公司的顶梁柱,GPU是员工,请员工会增加公司的运营成本,能老板亲历亲为 ...

CPU跑的时候用的是内存，内存带宽才多少？单单是把数据在内存和显存之间传输，就可以把CPU占满，而且只会让速度变慢。所以没人这么用。

jiaxu1006 · 发表于 2024-2-18 08:19

提示: 作者被禁止或删除内容自动屏蔽

nApoleon · 发表于 2024-2-18 08:21

我试了下把GPU拔掉,LR会自动调用iGPU,时间很长,应该是Intel还没找Adobe优化的原因,然后再在驱动管理器里把iGPU的驱动卸载了,也就是整机没有任何GPU了,再进LR,居然神奇的事情发生了,CPU可以100%跑这个"去杂色"的功能,但是时间很长...

nApoleon · 发表于 2024-2-18 08:22

jiaxu1006 发表于 2024-2-18 08:19
轮大，m1是因为里面有专用asic电路干这事……普通cpu他没有啊……

所以M1的路子其实是对的,整合化+深度优化.
x86联盟吧,就是各自有各自的小算盘,心不齐,最后被一个小小的M1给干了...

南之乔 · 发表于 2024-2-18 08:25

有些活gpu是更快啊，视频转码深有体会

donkey_ever · 发表于 2024-2-18 08:27

cpu要是并行能力这么强，现在跑ai也没老黄什么事了
不是因为gpu塞了钱软件才特意优化gpu，而是这个任务，gpu干的就是比cpu快，才会特意做gpu加速的优化，因果关系别搞反了

难为水 · 发表于 2024-2-18 09:07

实际上GPU优势主要在于大数量级的流处理器带来的矩阵计算更快，而AI现在都是矩阵计算；CPU当然可以算，就是会很慢。
本来GPU就是为了画面渲染的矩阵计算而生的，只不过目前科技树发展的AI刚好也是基于矩阵计算罢了。

nApoleon · 发表于 2024-2-18 09:09

难为水发表于 2024-2-18 09:07
实际上GPU优势主要在于大数量级的流处理器带来的矩阵计算更快，而AI现在都是矩阵计算；CPU当然可以算，就是 ...

明白了…

赫敏 · 发表于 2024-2-18 09:34

结论没错，但想法有点离谱

cpu就算100%卯着劲也快不了一点，反倒会使整个机器都卡了

aibo · 发表于 2024-2-18 09:51

轮子有点那啥了
cpu的多线程优化就搞了好多好多年。
你现在再要搞cpu/gpu的同时优化

就像一堆工作，一个老师傅能以10x于小菜鸟完成的时候，你一般也不会拆分给2人啊

sthuasheng · 发表于 2024-2-18 10:07

intel新出的ultra也可以干，但是速度比独显慢不少，ai最开始的时候选择显卡肯定是显卡的架构设计更适合ai，cpu也许可以，但是效率会低非常多，如果优化完cpu满载也只能提供不到显卡10%的性能，那软件厂商肯定也不愿意为cpu优化了

sthuasheng · 发表于 2024-2-18 10:10

nApoleon 发表于 2024-2-17 22:44
那我还是觉得CPU里集成一个不大不小的GPU才是最正义的...

现在AMD和INTEL就是在这样干啊，ultra的核显就可以跑LR的AI降噪了，只不过速度还是比NV独显慢很多，大概只有4060速度的几分之一

63047838 · 发表于 2024-2-18 10:22

本帖最后由 63047838 于 2024-2-18 10:24 编辑

样样通意味着样样松，就像编解码，专业的活还是得给专业的干，不过对于非专业偶尔用用的普通用户来说，给CPU加速做适当的优化还是有好处的，但是厂商为什么要这么做呢。

curdfu · 发表于 2024-2-18 10:26

说白一点，没有专用指令集优化和浮点优化之前，cpu确实干不好这个
如果把这些优化堆上，cpu也就不是这个价格了……

litel · 发表于 2024-2-18 10:44

并行处理天生就是gpu才做的好

cpu搞的那些并行指令集 avx512之类的就是没人用

这些事情cpu是能做但是慢十几倍几十倍
比如一些ai模型一样可以纯cpu跑改个参数就行速度完全无法接受而已

开发一个使用gpu计算的程序应用到产品不是说句话花几个月就能做好的

因为老黄的cuda就是又好用开发又快

要不然opencl也不会半死不活只兼容cuda的或者只在cuda上才快的程序数量碾压其他

minw66 · 发表于 2024-2-18 10:57

nApoleon 发表于 2024-2-18 07:36
真要这样的话就应该CPU＋GPU一同出力,效率最大化,不然很明显就是开后门,毕竟CPU闲着也是闲着,况且CPU也不 ...

二者效率差距过大的时候，不是说不能让CPU参与干活，而是软件开发层面要二者协同可能也不是易事，软件开发者要决策谁做哪个部分，怎么合并输出。都知道SLI/CF他就远不是1+1>=2的效率，何况两个性能差距这么大的做协同

erid414 · 发表于 2024-2-18 11:04

nApoleon 发表于 2024-2-18 07:54
但从我的角度,CPU才是大BOSS,是一个公司的顶梁柱,GPU是员工,请员工会增加公司的运营成本,能老板亲历亲为 ...

基本原理就是cpu是boss，处理需要逻辑的问题，gpu是普工，适合不动脑的单一行为，成千上个普工的工作量和几个boss比还是差别很大的
以前有OpenCL这个框架就是协调cpu和gpu并行计算的，但是一旦一起工作了就会涉及到带宽问题，所以最好是什么事情全让gpu在自己的显存里做完
几万个工人和boss直接汇报效率太低了

BallanceHZ · 发表于 2024-2-18 11:14

jiaxu1006 发表于 2024-2-18 08:19
轮大，m1是因为里面有专用asic电路干这事……普通cpu他没有啊……

神特么没有，你猜I/A/N media engine里的硬解/硬编是干啥的，为啥效率远超软解

账号		自动登录	找回密码
密码			加入我们

bigeblis bigeblis 当前离线积分 28413	发表于 2024-2-18 07:48 \| 显示全部楼层提示: 作者被禁止或删除内容自动屏蔽
bigeblis bigeblis 当前离线积分 28413
	回复举报

jiaxu1006 jiaxu1006 当前离线积分 -107	发表于 2024-2-18 08:19 来自手机 \| 显示全部楼层提示: 作者被禁止或删除内容自动屏蔽
jiaxu1006 jiaxu1006 当前离线积分 -107
	回复举报

[显卡] 其实所有的"AI加速"以我看就是GPU和软件厂商的PY交易~

浏览过的版块