ekiuc 发表于 2024-6-6 15:24

Ryzen AI 300的设备大概什么时候能上市呀?

眼看着下一代也快来了,结果最近不少掌机反而在这个节点更新了8840u/Z1E……[无奈]

所以大家觉得搭载Strix Point大概什么时候会上市?我看它整个SKU相比之前也偏少,是不是只有部分高端货才会用上?[流泪]


(还是说掌机上会倾向于用LNL?)

xy. 发表于 2024-6-6 15:25

下个月, 首发大眼睛

psps3 发表于 2024-6-6 15:28

发布会好像没说总ai算力[困惑]
集成显卡的ai算力是多少呢[困惑]

ekiuc 发表于 2024-6-6 15:30

psps3 发表于 2024-6-6 15:28
发布会好像没说总ai算力
集成显卡的ai算力是多少呢

我模糊记得好像总算力80T,intel那边提自己家总和能到120T(5+48+67)的时候好像提了一嘴

话说这个应该能从架构和规格反推?不过上次A家的人来我们这儿做讲座的时候,好像没提iGPU该怎么调用,我感觉应该是ROCm的支持还没做全,有点鸡肋

5ik0z33v 发表于 2024-6-6 18:54

掌机暂时不出估计,一是清一波库存,二是不是芯片价格比较高?ASUS 估计是在等Z2E。

ekiuc 发表于 2024-6-6 19:16

5ik0z33v 发表于 2024-6-6 18:54
掌机暂时不出估计,一是清一波库存,二是不是芯片价格比较高?ASUS 估计是在等Z2E。 ...

asus刚把掌机更新了一波,主要加了电池,哎[困惑]

los_parrot 发表于 2024-6-6 21:14

strix point跟hawk point是drop in兼容的,现有的8x40模具直接换芯片就行

wjm47196 发表于 2024-6-6 21:15

ekiuc 发表于 2024-6-6 15:30
我模糊记得好像总算力80T,intel那边提自己家总和能到120T(5+48+67)的时候好像提了一嘴

话说这个应该 ...

牙膏厂总算力120tops 按摩店只说了npu50tops,按摩店的cpu+gpu算力会比牙膏厂低?

af_x_if 发表于 2024-6-6 21:37

wjm47196 发表于 2024-6-6 21:15
牙膏厂总算力120tops 按摩店只说了npu50tops,按摩店的cpu+gpu算力会比牙膏厂低? ...

没有特别提,那多半就是照上一代按规模提升。
上一代GPU提供了23TOPS,规模增加了1/3,再考虑频率也略有提升,所以……34T?

los_parrot 发表于 2024-6-6 21:41

amd光一个avx512,cpu核心跑4g,12核的算力不是24t吗?intel的cpu核才5t算力,洗洗睡吧。



psps3 发表于 2024-6-6 21:57

ekiuc 发表于 2024-6-6 15:30
我模糊记得好像总算力80T,intel那边提自己家总和能到120T(5+48+67)的时候好像提了一嘴

话说这个应该 ...

ryzen ai 300系列,内存支持到多高频率?

kaiwenwu 发表于 2024-6-6 22:00

los_parrot 发表于 2024-6-6 21:41
amd光一个avx512,cpu核心跑4g,12核的算力不是24t吗?intel的cpu核才5t算力,洗洗睡吧。




所以是AMD 24T+34T+50T=108T 大于Intel 48T+67T=115T喽[偷笑]

CPU算力再高有屁用,不用CPU干活都吊打了。

不是CPU该干活了就别硬干省的出来丢脸[狂笑]

los_parrot 发表于 2024-6-6 22:13

kaiwenwu 发表于 2024-6-6 22:00
所以是AMD 24T+34T+50T=108T 大于Intel 48T+67T=115T喽

CPU算力再高有屁用,不用CPU干活都吊打了。


intel gpu的67t大概是什么8bit甚至4bit算力,你把amd的34t乘个4再比把

gtx9 发表于 2024-6-6 22:32

los_parrot 发表于 2024-6-6 21:41
amd光一个avx512,cpu核心跑4g,12核的算力不是24t吗?intel的cpu核才5t算力,洗洗睡吧。




怎么算的?好像不对吧

kaiwenwu 发表于 2024-6-6 22:35

los_parrot 发表于 2024-6-6 22:13
intel gpu的67t大概是什么8bit甚至4bit算力,你把amd的34t乘个4再比把

厉害,原来你这么会比啊[狂笑]

los_parrot 发表于 2024-6-6 23:05

gtx9 发表于 2024-6-6 22:32
怎么算的?好像不对吧

全部换算成int8咯

ai算力这不是基操吗?

los_parrot 发表于 2024-6-6 23:08

kaiwenwu 发表于 2024-6-6 22:35
厉害,原来你这么会比啊

你觉得intel的集成的gpu规模有4090的多少成?

4090的fp32算力 是70t。

zerozerone 发表于 2024-6-6 23:46

intel更懂宣传,自有大把自来水帮忙洗地。

大头吃小头 发表于 2024-6-6 23:50

psps3 发表于 2024-6-6 15:28
发布会好像没说总ai算力
集成显卡的ai算力是多少呢

说是npu 50t算力,应该差不多了吧 别的也交火不了吧,有个特殊技术是可以兼容16位的,不至于8位效果稀烂

ekiuc 发表于 2024-6-7 13:35

本帖最后由 ekiuc 于 2024-6-7 16:18 编辑

wjm47196 发表于 2024-6-6 21:15
牙膏厂总算力120tops 按摩店只说了npu50tops,按摩店的cpu+gpu算力会比牙膏厂低? ...

你要是知道数据你说呗,咋地,俩个数字的事情打听不到啊?拿架构倒推也能算出来吧

最近AMD的人给我们做报告的时候全程没提iGPU的事情啊,重点一直在和FPGA同架构的NPU上,讲7900的时候还提了一嘴ROCm,到APU这边提都不提。

我做异构并行的,市面上要是再多一个可以让我并行的玩意我非常高兴的,8840u没提这事我还难受了一阵子,毕竟nv和高通大家论文都发了不知道多少篇了,太卷了[偷笑]

某些人别没料还装舅舅党,能接触到的人还不如我那就好笑了[偷笑]

题外话,写TensorRT的时候发现,如果DLA有兼容性之类的问题,可以往iGPU回落,保证能跑

但是上次AMD的人宣传NPU的时候,告诉我们遇到兼容性问题,可以往 C P U 回 落[震惊]

我不懂,但我大为震感




更新
华硕给的数据,CPU+GPU合计31 TOPS,跟我记忆里还有大家推算的基本一致,这个错的概率不大了,按摩店的cpu+gpu的tops确实比牙膏厂低

不过现在这个点高了也没用,他ROCm支持要是还是像现在这个半成品的样子,学术圈的都没心思没他玩,赶紧把支持做做好,别让做GPU的那帮人一提RDNA上的ROCm立马痛苦面具才是真的

ekiuc 发表于 2024-6-7 13:43

本帖最后由 ekiuc 于 2024-6-7 13:58 编辑

大头吃小头 发表于 2024-6-6 23:50
说是npu 50t算力,应该差不多了吧 别的也交火不了吧,有个特殊技术是可以兼容16位的,不至于8位效果稀烂 ...

int8 tensor性能不丢人,老黄来了也宣传这个,而且是iGPU+2*DLA(NPU)加在一起算的,你真要并行起来这几个玩意还有访存冲突,甚至达不到老黄宣传的效果

而且精度还有进一步变低的趋势(B200)

ekiuc 发表于 2024-6-7 13:49

本帖最后由 ekiuc 于 2024-6-7 13:56 编辑

af_x_if 发表于 2024-6-6 21:37
没有特别提,那多半就是照上一代按规模提升。
上一代GPU提供了23TOPS,规模增加了1/3,再考虑频率也略有 ...

如果是34T这个数字,倒是比较符合我印象里的80T(50+30)这个数字

intel的120t还算了cpu是挺扯淡的,几乎没人会用这玩意

不过去掉这个,看上去这代GPU的类tensor core堆了不少东西,到时候看看疗效如何

不过上一代他的参数就是23TOPS?那就说明已经是int8了吧

kingofgu 发表于 2024-6-7 13:59

有点好奇 目前有什么落地的东西能这么高效的异构并行,能用上了这一堆算力最后性能还是个代数合 我觉得吊打OpenAI都是侮辱,简直是三体人降临

ekiuc 发表于 2024-6-7 14:05

本帖最后由 ekiuc 于 2024-6-7 14:08 编辑

kingofgu 发表于 2024-6-7 13:59
有点好奇 目前有什么落地的东西能这么高效的异构并行,能用上了这一堆算力最后性能还是个代数合 我觉得吊打 ...

高度优化的嵌入式环境能尝试一下,不过与其说能不能高效的异构并行,不如说哪怕是纯tensor core甚至纯cuda core那个算力也都很难达到,这还是有老黄强大的支持的情况下

最高这么干好像是高通我记得,CPU+GPU+NPU,后来老黄他们都这个宣传了

用户 发表于 2024-6-7 14:47

推特转总HXL刚算了算,R9 AI HX系列5.1Ghz单核堪比14900k/7950x。比z1又是个大升级。

ekiuc 发表于 2024-6-7 14:51

用户 发表于 2024-6-7 14:47
推特转总HXL刚算了算,R9 AI HX系列5.1Ghz单核堪比14900k/7950x。比z1又是个大升级。 ...

啥时候能上个掌机嘞,现在这一堆8840u还不便宜,感觉亏的慌[困惑]

fluttershy 发表于 2024-6-7 14:53

掌机一直在捡垃圾 即使有实力定制都在考虑成本

SuperLac 发表于 2024-6-7 15:01

用户 发表于 2024-6-7 14:47
推特转总HXL刚算了算,R9 AI HX系列5.1Ghz单核堪比14900k/7950x。比z1又是个大升级。 ...

7940HS单核一样是5.15G啊,按照目前爆出来的单核R23分才2000+,如果ipc按R23 SC+17%来算,这个AI HX测试的分甚至没有跑满5.1G

SuperLac 发表于 2024-6-7 15:05

kaiwenwu 发表于 2024-6-6 22:00
所以是AMD 24T+34T+50T=108T 大于Intel 48T+67T=115T喽

CPU算力再高有屁用,不用CPU干活都吊打了。


上一代8700G的AI算力宣传的是总39T,其中NPU16T,那CPU+GPU就是23T。
这一代我看到NPU=50T了,CPU+GPU未知。考虑到GPU应该占大头,按照提升1/3的算法去算,也就是30T,总的确实也就80T左右。
这么看牙膏这个核显算力还挺强的。

ekiuc 发表于 2024-6-7 15:20

本帖最后由 ekiuc 于 2024-6-7 15:23 编辑

SuperLac 发表于 2024-6-7 15:05
上一代8700G的AI算力宣传的是总39T,其中NPU16T,那CPU+GPU就是23T。
这一代我看到NPU=50T了,CPU+GPU未 ...

这次intel的iGPU算力大爆发我看是把dGPU上的Matrix Engine加回去了,上一代应该是直接阉割掉了

尤其是在nv如此强势且成熟的情况下,iGPU甚至dGPU上到底有没有必要用宝贵的面积加这种类Tensor Core的设计,以及到底要加多少,还是要根据企业规划自己权衡的,intel看来还是对ai有野心,Matrix Engine的面积并不算小[偷笑]
页: [1] 2
查看完整版本: Ryzen AI 300的设备大概什么时候能上市呀?