找回密码
 加入我们
搜索
      
查看: 11480|回复: 138

[显卡] 其实所有的"AI加速"以我看就是GPU和软件厂商的PY交易~

[复制链接]
发表于 2024-2-17 22:05 | 显示全部楼层 |阅读模式
1月底我发过个帖子,提到了我用Lightroom去杂色发现GPU对这个处理的时效性(效率)影响很大,原帖没看过请一定要先看一下:https://www.chiphell.com/thread-2581402-1-1.html

但我今天又发现,其实在干这个活的时候CPU是几乎空闲的,那点10%就是整机软件的运行中的"闲置"负载,那么问题就来了"为什么这活不让CPU来干呢?",是CPU干不好么?怎么可能,CPU原则上什么都能干,CPU才是真正意义上不挑什么脏活累活都要亲自上的,那么问题就来了,"这所谓的优化难道不就是为了体现GPU的价值所在?",当然,不然呢?

QQ截图20240217215917.png

QQ截图20240217215924.png

这就是GPU厂商聪明的地方,通过和软件厂商的一些PY,让其实CPU也能干的活单独给GPU开个后门,也就是这个活CPU你休息去吧,就100%全让GPU来干,那么当你如果依赖这个效果的时候,就必须依赖GPU,因为这是生产力体现呀,这是让你掏更多钱购买GPU的原始动力呀~

然而最终,这个活CPU一定也能干,就看CPU厂商什么时候再给软件厂商送一笔钱所谓"两头吃"的时候?我乱猜的~
发表于 2024-2-17 22:10 | 显示全部楼层
所谓生意其实就是深化关系,活给谁都能干,为什么不给朋友干
发表于 2024-2-17 22:12 来自手机 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
 楼主| 发表于 2024-2-17 22:12 | 显示全部楼层
iMARS 发表于 2024-2-17 22:10
所谓生意其实就是深化关系,活给谁都能干,为什么不给朋友干

对,应该就是新升级的新功能暂时先给付费的硬件厂商开后门,大概就是这么个意思...
 楼主| 发表于 2024-2-17 22:13 | 显示全部楼层
archxm 发表于 2024-2-17 22:12
这个也不能这么说,gpu 属于硬件干活,特色是往前冲。
cpu 一般靠程序代码设计,擅长条件跳转,会转弯。
如 ...

真要谈优化,我觉得CPU比GPU潜力更大,看Apple的M1就知道了.
发表于 2024-2-17 22:18 来自手机 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
发表于 2024-2-17 22:18 | 显示全部楼层
CPU啥都能干,只不过遥想当年CS1.5渲染方式选Software,640*480都卡出屎,选OpenGL用MX440跑1024*768流畅的不行
 楼主| 发表于 2024-2-17 22:19 | 显示全部楼层
InuYasha 发表于 2024-2-17 22:18
CPU啥都能干,只不过遥想当年CS1.5渲染方式选Software,640*480都卡出屎,选OpenGL用MX440跑1024*768流畅的不 ...

毕竟3D嘛,这都CPU能干那就不会有GPU这么个玩意了...
发表于 2024-2-17 22:25 | 显示全部楼层
nApoleon 发表于 2024-2-17 22:19
毕竟3D嘛,这都CPU能干那就不会有GPU这么个玩意了...

所以降噪这活可能和3D差不多只适合GPU跑,CPU累死累活跑出来的效果不如GPU的零头,所以干脆让CPU歇着了
发表于 2024-2-17 22:29 来自手机 | 显示全部楼层
gpu干1分钟完事,CPU干1个小时进度条还有一半,不歇着干嘛
发表于 2024-2-17 22:29 | 显示全部楼层
AI加速只是個名字而已...你可以叫硬件加速...23333
CPU是硬件..但GPU就不是了麼
 楼主| 发表于 2024-2-17 22:29 | 显示全部楼层
InuYasha 发表于 2024-2-17 22:25
所以降噪这活可能和3D差不多只适合GPU跑,CPU累死累活跑出来的效果不如GPU的零头,所以干脆让CPU歇着了 ...

这就是GPU厂商 这些年一直想让大家接受的,也就是GPU除了3D之外还能干其它的,可事实上作用很浅,不然也不会只是这一个小小的功能而且还是新增的功能了...
PS,看看视频解码和转码Intel的核显那么小一颗都能做到堪比4090的效率,你就应该明白其实GPU天生是为3D服务让它干其它的活其实一定不是最优解的,不然也不会出现那么小的iGPU能绊倒那么大个旗舰GPU的案例了.
发表于 2024-2-17 22:35 | 显示全部楼层
本帖最后由 银月 于 2024-2-17 22:37 编辑

一看你就不拿pc做生产力,AI推理是一种浮点运算……

cpu是跑整数的,这个确实干不了,非要干倒是也能干

7995wx的浮点性能是12t左右

而4090的浮点性能是80t左右

能效比和费效比的差距就不用我算了吧

对比起让cpu去凑合跑ai运算

目前各家最近几年的做法基本上都是

填一块npu进soc里,以前手机这么干,以后pc也得这么干了
 楼主| 发表于 2024-2-17 22:37 | 显示全部楼层
银月 发表于 2024-2-17 22:35
一看你就不拿pc做生产力,AI推理是一种浮点运算……

cpu是跑整数的,这个确实干不了,非要干倒是也能干

你说的道理我明白,但我想要说的是,但凡优化给足,差距并不会那么大,CPU和GPU,以及核显iGPU和独立的GPU,这3者之间在干这种事情上的区别并不会那么大的.
发表于 2024-2-17 22:42 | 显示全部楼层
nApoleon 发表于 2024-2-17 22:37
你说的道理我明白,但我想要说的是,但凡优化给足,差距并不会那么大,CPU和GPU,以及核显iGPU和独立的GPU,这3 ...

是这样的,浮点是一个理论性能,也就是说标称12t vs 80t,在优化一样的情况下他们大概有7倍的效率差

但实际上各种软件跑gpu的优化目前远高于cpu,差距会比7倍还大很多

不过不只是cpu,以后gpu也会慢慢脱离跑ai运算的环境,到时候需要跑ai插一块独立npu,能效比现在gpu还会高几倍的
发表于 2024-2-17 22:43 | 显示全部楼层
nApoleon 发表于 2024-2-17 06:29
这就是GPU厂商 这些年一直想让大家接受的,也就是GPU除了3D之外还能干其它的,可事实上作用很浅,不然也不会 ...

CPU它慢啊,并行能力那么弱。而GPU相当于上千小核一起搞事情,它快啊。你这种处理图片的workload天生对GPU友好,为啥不支持GPU啊,就为了CPU慢慢跑,挤点时间煮咖啡?

iGPU里面那些ASIC模块是ASIC啊,硬件实现了算法,灵活度低啊,今年才支持av1,支持一个新的算法慢得抠脚啊。

GPU现在也是通用并行计算的硬件。A100,H100 这些GPU连视频输出接口,顶点单元都没有,他天生没法为3d服务啊。
发表于 2024-2-17 22:44 | 显示全部楼层
INTEL 好像还没出AI计算卡吧,  达成只有INTEL受伤的世界
 楼主| 发表于 2024-2-17 22:44 | 显示全部楼层
银月 发表于 2024-2-17 22:42
是这样的,浮点是一个理论性能,也就是说标称12t vs 80t,在优化一样的情况下他们大概有7倍的效率差

但 ...

那我还是觉得CPU里集成一个不大不小的GPU才是最正义的...
 楼主| 发表于 2024-2-17 22:45 | 显示全部楼层
一日 发表于 2024-2-17 22:43
CPU它慢啊,并行能力那么弱。而GPU相当于上千小核一起搞事情,它快啊。你这种处理图片的workload天生对GP ...


图形软件里除了这个"去杂色"其它所有的特效可都是CPU为主在干的,那你觉得是CPU干不了这个呢,还是干不好这个呢~
发表于 2024-2-17 22:46 | 显示全部楼层
fpga的卡也可以的
发表于 2024-2-17 22:53 | 显示全部楼层
光线追踪CPU也能算,甚至部分pascal架构的N卡也能打开算,效率嘛
发表于 2024-2-17 22:54 | 显示全部楼层
PPXG 发表于 2024-2-17 22:53
光线追踪CPU也能算,甚至部分pascal架构的N卡也能打开算,效率嘛

16核 vs 16384核

发表于 2024-2-17 22:55 | 显示全部楼层
我觉得塞钱优化很合理啊,毕竟开发功能要软件工程师,而这些软件工程师的工资是软件厂付的,最后优化得益是特定硬件厂商和特定用户,那硬件厂商不付钱,软件不给优化,也很合理吧。再说了,特定用户想要特殊功能,也得付钱给定制软件或者第三方插件啊。
发表于 2024-2-17 23:09 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
发表于 2024-2-17 23:11 | 显示全部楼层
没有需求就创造需求,欧美一向这样干。不管硬件还是药品和疫苗,连军工都是。
发表于 2024-2-17 23:15 | 显示全部楼层
【【图一乐21期】为什么电脑配件里的CPU每次升级幅度不如GPU升级幅度大】 https://www.bilibili.com/video/B ... 2ad628982a28cfeddf1
看了上面那么多回复,不知道gpu和cpu的原理区别怎么比我想象中的还多,我觉得chh不至于吧
发表于 2024-2-17 23:18 | 显示全部楼层
tengyun 发表于 2024-2-17 22:44
INTEL 好像还没出AI计算卡吧,  达成只有INTEL受伤的世界

好像说今年2季度要出的 刚宣布 然后去年那个10月的禁令就跟着他发布了。。。估计真出了我们也看不到
发表于 2024-2-17 23:18 来自手机 | 显示全部楼层
本帖最后由 jxljk 于 2024-2-18 12:13 编辑

不是开后门 而是gpu能干的活越来越多了  rtx30开始 gpu可以绕过cpu直接读取硬盘里的数据 说到底还是cpu功能越来越废
发表于 2024-2-17 23:19 来自手机 | 显示全部楼层
gpu 光追 ai 运算    cpu还是最开始的那些功能 只是最近加了ai
发表于 2024-2-17 23:29 | 显示全部楼层
社会在进步,硬件自然也在进步。
能干的事也会越来越多。
但也要看能效吧?
再者收钱后搞深度优化不是很正常嘛
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2024-6-9 16:24 , Processed in 0.017569 second(s), 6 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表