找回密码
 加入我们
搜索
      
楼主: nApoleon

[显卡] 其实所有的"AI加速"以我看就是GPU和软件厂商的PY交易~

[复制链接]
发表于 2024-2-17 23:31 | 显示全部楼层
就像老板配秘书,
有些秘书出差能力强,
干活也能干,但。。。
发表于 2024-2-17 23:33 | 显示全部楼层
你的意思是让cpu跑满,然后实际只干了零头的活? 正常人都不愿意这么设计。
发表于 2024-2-17 23:37 | 显示全部楼层
资本一直都是玩捆绑盈利的。就像微软捆绑DX10捆绑WIN10一样。
好多硬件就本来WIN7能跑的。但是就是不让你用不给做驱动。
逼你去用阿三的新系统。体积大界面差。需要点击的鼠标次数多。
发表于 2024-2-17 23:45 来自手机 | 显示全部楼层
cuixiang 发表于 2024-2-17 23:29
社会在进步,硬件自然也在进步。
能干的事也会越来越多。
但也要看能效吧?

可别搞深度,负优化

可怕
发表于 2024-2-17 23:49 | 显示全部楼层
nApoleon 发表于 2024-2-17 06:45
图形软件里除了这个"去杂色"其它所有的特效可都是CPU为主在干的,那你觉得是CPU干不了这个呢,还是干不好这 ...

我一直在强调CPU干不好。Lightroom这些已经有的功能,重写GPU版本费时费力,就让大家多等等呗
发表于 2024-2-18 00:06 | 显示全部楼层
本帖最后由 raiya 于 2024-2-18 00:11 编辑

CPU GPU是完全不同的东西。CPU就是单核性能强,适合逻辑性时序性强的任务。GPU核心多,适合并行的,没有时序性要求的任务,比如说把一个画面分割成小块,处理完拼起来,就是GPU的强项。你强行把任务分配给CPU GPU同时处理,还要涉及到内存显存的数据交换,光这部分就已经可以占用掉100%的CPU了,还会让整件事情变慢。

苹果的芯片是一个CPU GPU AI的多个模块封装在一起的东西,他们共用一个内存。
发表于 2024-2-18 07:27 来自手机 | 显示全部楼层
术业有专攻,让合适的产品干擅长的事情。你好我好大家好。
 楼主| 发表于 2024-2-18 07:36 来自手机 | 显示全部楼层
alibabatadie 发表于 2024-2-18 07:27
术业有专攻,让合适的产品干擅长的事情。你好我好大家好。

真要这样的话就应该CPU+GPU一同出力,效率最大化,不然很明显就是开后门,毕竟CPU闲着也是闲着,况且CPU也不是不能干~
发表于 2024-2-18 07:48 | 显示全部楼层
那么,你关掉GPU加速让CPU来干的时候,速度怎么样呢?
如果一样,那才是PY交易。像你测试的那样,速度差距巨大,怎么能算呢?难道非得用慢的吗?
发表于 2024-2-18 07:48 来自手机 | 显示全部楼层
nApoleon 发表于 2024-2-18 07:36
真要这样的话就应该CPU+GPU一同出力,效率最大化,不然很明显就是开后门,毕竟CPU闲着也是闲着,况且CPU也不 ...

cpu是领导,领导一般不干活,特别缺人运转不下去情况下才会顶替员工。领导还说了:他还要协调各部门,保证全局可控,可响应
 楼主| 发表于 2024-2-18 07:53 来自手机 | 显示全部楼层
bigeblis 发表于 2024-2-18 07:48
那么,你关掉GPU加速让CPU来干的时候,速度怎么样呢?
如果一样,那才是PY交易。像你测试的那样,速度差距 ...

应该是不行的,因为现在这玩意就必须要GPU…而且也只调用GPU…坏就坏在这里…
 楼主| 发表于 2024-2-18 07:54 | 显示全部楼层
alibabatadie 发表于 2024-2-18 07:48
cpu是领导,领导一般不干活,特别缺人运转不下去情况下才会顶替员工。领导还说了:他还要协调各部门,保 ...

但从我的角度,CPU才是大BOSS,是一个公司的顶梁柱,GPU是员工,请员工会增加公司的运营成本,能老板亲历亲为自己干的才是真为公司省钱...
发表于 2024-2-18 08:13 | 显示全部楼层
本帖最后由 raiya 于 2024-2-18 08:30 编辑
nApoleon 发表于 2024-2-18 07:54
但从我的角度,CPU才是大BOSS,是一个公司的顶梁柱,GPU是员工,请员工会增加公司的运营成本,能老板亲历亲为 ...


CPU跑的时候用的是内存,内存带宽才多少?单单是把数据在内存和显存之间传输,就可以把CPU占满,而且只会让速度变慢。所以没人这么用。
发表于 2024-2-18 08:19 来自手机 | 显示全部楼层
nApoleon 发表于 2024-2-17 22:13
真要谈优化,我觉得CPU比GPU潜力更大,看Apple的M1就知道了.

轮大,m1是因为里面有专用asic电路干这事……普通cpu他没有啊……
 楼主| 发表于 2024-2-18 08:21 | 显示全部楼层
我试了下把GPU拔掉,LR会自动调用iGPU,时间很长,应该是Intel还没找Adobe优化的原因,然后再在驱动管理器里把iGPU的驱动卸载了,也就是整机没有任何GPU了,再进LR,居然神奇的事情发生了,CPU可以100%跑这个"去杂色"的功能,但是时间很长...
1111.png

2222.png
 楼主| 发表于 2024-2-18 08:22 | 显示全部楼层
jiaxu1006 发表于 2024-2-18 08:19
轮大,m1是因为里面有专用asic电路干这事……普通cpu他没有啊……

所以M1的路子其实是对的,整合化+深度优化.
x86联盟吧,就是各自有各自的小算盘,心不齐,最后被一个小小的M1给干了...
发表于 2024-2-18 08:25 | 显示全部楼层
有些活gpu是更快啊,视频转码深有体会
发表于 2024-2-18 08:27 来自手机 | 显示全部楼层
cpu要是并行能力这么强,现在跑ai也没老黄什么事了
不是因为gpu塞了钱软件才特意优化gpu,而是这个任务,gpu干的就是比cpu快,才会特意做gpu加速的优化,因果关系别搞反了
发表于 2024-2-18 09:07 | 显示全部楼层
实际上GPU优势主要在于大数量级的流处理器带来的矩阵计算更快,而AI现在都是矩阵计算;CPU当然可以算,就是会很慢。
本来GPU就是为了画面渲染的矩阵计算而生的,只不过目前科技树发展的AI刚好也是基于矩阵计算罢了。
 楼主| 发表于 2024-2-18 09:09 来自手机 | 显示全部楼层
难为水 发表于 2024-2-18 09:07
实际上GPU优势主要在于大数量级的流处理器带来的矩阵计算更快,而AI现在都是矩阵计算;CPU当然可以算,就是 ...

明白了…
发表于 2024-2-18 09:34 | 显示全部楼层
结论没错,但想法有点离谱

cpu就算100%卯着劲也快不了一点,反倒会使整个机器都卡了
发表于 2024-2-18 09:51 | 显示全部楼层
轮子有点那啥了
cpu的多线程优化就搞了好多好多年。
你现在再要搞cpu/gpu的同时优化

就像一堆工作,一个老师傅能以10x于小菜鸟完成的时候,你一般也不会拆分给2人啊
发表于 2024-2-18 10:07 | 显示全部楼层
intel新出的ultra也可以干,但是速度比独显慢不少,ai最开始的时候选择显卡肯定是显卡的架构设计更适合ai,cpu也许可以,但是效率会低非常多,如果优化完cpu满载也只能提供不到显卡10%的性能,那软件厂商肯定也不愿意为cpu优化了
发表于 2024-2-18 10:10 | 显示全部楼层
nApoleon 发表于 2024-2-17 22:44
那我还是觉得CPU里集成一个不大不小的GPU才是最正义的...

现在AMD和INTEL就是在这样干啊,ultra的核显就可以跑LR的AI降噪了,只不过速度还是比NV独显慢很多,大概只有4060速度的几分之一
发表于 2024-2-18 10:22 | 显示全部楼层
本帖最后由 63047838 于 2024-2-18 10:24 编辑

样样通意味着样样松,就像编解码,专业的活还是得给专业的干,不过对于非专业偶尔用用的普通用户来说,给CPU加速做适当的优化还是有好处的,但是厂商为什么要这么做呢。
发表于 2024-2-18 10:26 | 显示全部楼层
说白一点,没有专用指令集优化和浮点优化之前,cpu确实干不好这个
如果把这些优化堆上,cpu也就不是这个价格了……
发表于 2024-2-18 10:44 | 显示全部楼层
并行处理天生就是gpu才做的好

cpu搞的那些并行指令集 avx512之类的就是没人用

这些事情cpu是能做 但是慢十几倍几十倍
比如一些ai模型一样可以纯cpu跑 改个参数就行 速度完全无法接受而已

开发一个使用gpu计算的程序应用到产品不是说句话花几个月就能做好的

因为老黄的cuda就是又好用开发又快

要不然opencl也不会半死不活 只兼容cuda的或者只在cuda上才快的程序数量碾压其他
发表于 2024-2-18 10:57 | 显示全部楼层
nApoleon 发表于 2024-2-18 07:36
真要这样的话就应该CPU+GPU一同出力,效率最大化,不然很明显就是开后门,毕竟CPU闲着也是闲着,况且CPU也不 ...

二者效率差距过大的时候,不是说不能让CPU参与干活,而是软件开发层面要二者协同可能也不是易事,软件开发者要决策谁做哪个部分,怎么合并输出。都知道SLI/CF他就远不是1+1>=2的效率,何况两个性能差距这么大的做协同
发表于 2024-2-18 11:04 | 显示全部楼层
nApoleon 发表于 2024-2-18 07:54
但从我的角度,CPU才是大BOSS,是一个公司的顶梁柱,GPU是员工,请员工会增加公司的运营成本,能老板亲历亲为 ...

基本原理就是cpu是boss,处理需要逻辑的问题,gpu是普工,适合不动脑的单一行为,成千上个普工的工作量和几个boss比还是差别很大的
以前有OpenCL这个框架就是协调cpu和gpu并行计算的,但是一旦一起工作了就会涉及到带宽问题,所以最好是什么事情全让gpu在自己的显存里做完
几万个工人和boss直接汇报效率太低了
发表于 2024-2-18 11:14 | 显示全部楼层
jiaxu1006 发表于 2024-2-18 08:19
轮大,m1是因为里面有专用asic电路干这事……普通cpu他没有啊……

神特么没有,你猜I/A/N media engine里的硬解/硬编是干啥的,为啥效率远超软解
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2024-5-29 12:59 , Processed in 0.014767 second(s), 6 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表