cuixiang 发表于 2024-2-17 23:31

就像老板配秘书,
有些秘书出差能力强,
干活也能干,但。。。

netjunegg 发表于 2024-2-17 23:33

你的意思是让cpu跑满,然后实际只干了零头的活? 正常人都不愿意这么设计。

yehaku 发表于 2024-2-17 23:37

资本一直都是玩捆绑盈利的。就像微软捆绑DX10捆绑WIN10一样。
好多硬件就本来WIN7能跑的。但是就是不让你用不给做驱动。
逼你去用阿三的新系统。体积大界面差。需要点击的鼠标次数多。[睡觉]

archxm 发表于 2024-2-17 23:45

cuixiang 发表于 2024-2-17 23:29
社会在进步,硬件自然也在进步。
能干的事也会越来越多。
但也要看能效吧?


可别搞深度,负优化

可怕

一日 发表于 2024-2-17 23:49

nApoleon 发表于 2024-2-17 06:45
图形软件里除了这个"去杂色"其它所有的特效可都是CPU为主在干的,那你觉得是CPU干不了这个呢,还是干不好这 ...

我一直在强调CPU干不好。Lightroom这些已经有的功能,重写GPU版本费时费力,就让大家多等等呗

raiya 发表于 2024-2-18 00:06

本帖最后由 raiya 于 2024-2-18 00:11 编辑

CPU GPU是完全不同的东西。CPU就是单核性能强,适合逻辑性时序性强的任务。GPU核心多,适合并行的,没有时序性要求的任务,比如说把一个画面分割成小块,处理完拼起来,就是GPU的强项。你强行把任务分配给CPU GPU同时处理,还要涉及到内存显存的数据交换,光这部分就已经可以占用掉100%的CPU了,还会让整件事情变慢。

苹果的芯片是一个CPU GPU AI的多个模块封装在一起的东西,他们共用一个内存。

alibabatadie 发表于 2024-2-18 07:27

术业有专攻,让合适的产品干擅长的事情。你好我好大家好。

nApoleon 发表于 2024-2-18 07:36

alibabatadie 发表于 2024-2-18 07:27
术业有专攻,让合适的产品干擅长的事情。你好我好大家好。

真要这样的话就应该CPU+GPU一同出力,效率最大化,不然很明显就是开后门,毕竟CPU闲着也是闲着,况且CPU也不是不能干~

bigeblis 发表于 2024-2-18 07:48

alibabatadie 发表于 2024-2-18 07:48

nApoleon 发表于 2024-2-18 07:36
真要这样的话就应该CPU+GPU一同出力,效率最大化,不然很明显就是开后门,毕竟CPU闲着也是闲着,况且CPU也不 ...

cpu是领导,领导一般不干活,特别缺人运转不下去情况下才会顶替员工。领导还说了:他还要协调各部门,保证全局可控,可响应[偷笑]

nApoleon 发表于 2024-2-18 07:53

bigeblis 发表于 2024-2-18 07:48
那么,你关掉GPU加速让CPU来干的时候,速度怎么样呢?
如果一样,那才是PY交易。像你测试的那样,速度差距 ...

应该是不行的,因为现在这玩意就必须要GPU…而且也只调用GPU…坏就坏在这里…

nApoleon 发表于 2024-2-18 07:54

alibabatadie 发表于 2024-2-18 07:48
cpu是领导,领导一般不干活,特别缺人运转不下去情况下才会顶替员工。领导还说了:他还要协调各部门,保 ...

但从我的角度,CPU才是大BOSS,是一个公司的顶梁柱,GPU是员工,请员工会增加公司的运营成本,能老板亲历亲为自己干的才是真为公司省钱...

raiya 发表于 2024-2-18 08:13

本帖最后由 raiya 于 2024-2-18 08:30 编辑

nApoleon 发表于 2024-2-18 07:54
但从我的角度,CPU才是大BOSS,是一个公司的顶梁柱,GPU是员工,请员工会增加公司的运营成本,能老板亲历亲为 ...

CPU跑的时候用的是内存,内存带宽才多少?单单是把数据在内存和显存之间传输,就可以把CPU占满,而且只会让速度变慢。所以没人这么用。

jiaxu1006 发表于 2024-2-18 08:19

nApoleon 发表于 2024-2-18 08:21

我试了下把GPU拔掉,LR会自动调用iGPU,时间很长,应该是Intel还没找Adobe优化的原因,然后再在驱动管理器里把iGPU的驱动卸载了,也就是整机没有任何GPU了,再进LR,居然神奇的事情发生了,CPU可以100%跑这个"去杂色"的功能,但是时间很长...


nApoleon 发表于 2024-2-18 08:22

jiaxu1006 发表于 2024-2-18 08:19
轮大,m1是因为里面有专用asic电路干这事……普通cpu他没有啊……

所以M1的路子其实是对的,整合化+深度优化.
x86联盟吧,就是各自有各自的小算盘,心不齐,最后被一个小小的M1给干了...

南之乔 发表于 2024-2-18 08:25

有些活gpu是更快啊,视频转码深有体会

donkey_ever 发表于 2024-2-18 08:27

cpu要是并行能力这么强,现在跑ai也没老黄什么事了
不是因为gpu塞了钱软件才特意优化gpu,而是这个任务,gpu干的就是比cpu快,才会特意做gpu加速的优化,因果关系别搞反了

难为水 发表于 2024-2-18 09:07

实际上GPU优势主要在于大数量级的流处理器带来的矩阵计算更快,而AI现在都是矩阵计算;CPU当然可以算,就是会很慢。
本来GPU就是为了画面渲染的矩阵计算而生的,只不过目前科技树发展的AI刚好也是基于矩阵计算罢了。

nApoleon 发表于 2024-2-18 09:09

难为水 发表于 2024-2-18 09:07
实际上GPU优势主要在于大数量级的流处理器带来的矩阵计算更快,而AI现在都是矩阵计算;CPU当然可以算,就是 ...

明白了…

赫敏 发表于 2024-2-18 09:34

结论没错,但想法有点离谱

cpu就算100%卯着劲也快不了一点,反倒会使整个机器都卡了

aibo 发表于 2024-2-18 09:51

轮子有点那啥了
cpu的多线程优化就搞了好多好多年。
你现在再要搞cpu/gpu的同时优化

就像一堆工作,一个老师傅能以10x于小菜鸟完成的时候,你一般也不会拆分给2人啊

sthuasheng 发表于 2024-2-18 10:07

intel新出的ultra也可以干,但是速度比独显慢不少,ai最开始的时候选择显卡肯定是显卡的架构设计更适合ai,cpu也许可以,但是效率会低非常多,如果优化完cpu满载也只能提供不到显卡10%的性能,那软件厂商肯定也不愿意为cpu优化了

sthuasheng 发表于 2024-2-18 10:10

nApoleon 发表于 2024-2-17 22:44
那我还是觉得CPU里集成一个不大不小的GPU才是最正义的...

现在AMD和INTEL就是在这样干啊,ultra的核显就可以跑LR的AI降噪了,只不过速度还是比NV独显慢很多,大概只有4060速度的几分之一

63047838 发表于 2024-2-18 10:22

本帖最后由 63047838 于 2024-2-18 10:24 编辑

样样通意味着样样松,就像编解码,专业的活还是得给专业的干,不过对于非专业偶尔用用的普通用户来说,给CPU加速做适当的优化还是有好处的,但是厂商为什么要这么做呢。

curdfu 发表于 2024-2-18 10:26

说白一点,没有专用指令集优化和浮点优化之前,cpu确实干不好这个
如果把这些优化堆上,cpu也就不是这个价格了……

litel 发表于 2024-2-18 10:44

并行处理天生就是gpu才做的好

cpu搞的那些并行指令集 avx512之类的就是没人用

这些事情cpu是能做 但是慢十几倍几十倍
比如一些ai模型一样可以纯cpu跑 改个参数就行 速度完全无法接受而已

开发一个使用gpu计算的程序应用到产品不是说句话花几个月就能做好的

因为老黄的cuda就是又好用开发又快

要不然opencl也不会半死不活 只兼容cuda的或者只在cuda上才快的程序数量碾压其他

minw66 发表于 2024-2-18 10:57

nApoleon 发表于 2024-2-18 07:36
真要这样的话就应该CPU+GPU一同出力,效率最大化,不然很明显就是开后门,毕竟CPU闲着也是闲着,况且CPU也不 ...

二者效率差距过大的时候,不是说不能让CPU参与干活,而是软件开发层面要二者协同可能也不是易事,软件开发者要决策谁做哪个部分,怎么合并输出。都知道SLI/CF他就远不是1+1>=2的效率,何况两个性能差距这么大的做协同

erid414 发表于 2024-2-18 11:04

nApoleon 发表于 2024-2-18 07:54
但从我的角度,CPU才是大BOSS,是一个公司的顶梁柱,GPU是员工,请员工会增加公司的运营成本,能老板亲历亲为 ...

基本原理就是cpu是boss,处理需要逻辑的问题,gpu是普工,适合不动脑的单一行为,成千上个普工的工作量和几个boss比还是差别很大的
以前有OpenCL这个框架就是协调cpu和gpu并行计算的,但是一旦一起工作了就会涉及到带宽问题,所以最好是什么事情全让gpu在自己的显存里做完
几万个工人和boss直接汇报效率太低了

BallanceHZ 发表于 2024-2-18 11:14

jiaxu1006 发表于 2024-2-18 08:19
轮大,m1是因为里面有专用asic电路干这事……普通cpu他没有啊……

神特么没有,你猜I/A/N media engine里的硬解/硬编是干啥的,为啥效率远超软解[睡觉]
页: 1 [2] 3 4 5
查看完整版本: 其实所有的"AI加速"以我看就是GPU和软件厂商的PY交易~