Chiphell - 分享与交流用户体验

标题: Ryzen AI 300的设备大概什么时候能上市呀？ [打印本页]

作者: ekiuc 时间: 2024-6-6 15:24
标题: Ryzen AI 300的设备大概什么时候能上市呀？
眼看着下一代也快来了，结果最近不少掌机反而在这个节点更新了8840u/Z1E……

所以大家觉得搭载Strix Point大概什么时候会上市？我看它整个SKU相比之前也偏少，是不是只有部分高端货才会用上？

（还是说掌机上会倾向于用LNL？）

作者: xy. 时间: 2024-6-6 15:25
下个月, 首发大眼睛

作者: psps3 时间: 2024-6-6 15:28
发布会好像没说总ai算力

集成显卡的ai算力是多少呢

作者: ekiuc 时间: 2024-6-6 15:30

psps3 发表于 2024-6-6 15:28
发布会好像没说总ai算力
集成显卡的ai算力是多少呢

我模糊记得好像总算力80T，intel那边提自己家总和能到120T（5+48+67）的时候好像提了一嘴

话说这个应该能从架构和规格反推？不过上次A家的人来我们这儿做讲座的时候，好像没提iGPU该怎么调用，我感觉应该是ROCm的支持还没做全，有点鸡肋

作者: 5ik0z33v 时间: 2024-6-6 18:54
掌机暂时不出估计，一是清一波库存，二是不是芯片价格比较高？ASUS 估计是在等Z2E。

作者: ekiuc 时间: 2024-6-6 19:16

5ik0z33v 发表于 2024-6-6 18:54
掌机暂时不出估计，一是清一波库存，二是不是芯片价格比较高？ASUS 估计是在等Z2E。 ...

asus刚把掌机更新了一波，主要加了电池，哎

作者: los_parrot 时间: 2024-6-6 21:14
strix point跟hawk point是drop in兼容的，现有的8x40模具直接换芯片就行

作者: wjm47196 时间: 2024-6-6 21:15

ekiuc 发表于 2024-6-6 15:30
我模糊记得好像总算力80T，intel那边提自己家总和能到120T（5+48+67）的时候好像提了一嘴

话说这个应该 ...

牙膏厂总算力120tops 按摩店只说了npu50tops，按摩店的cpu+gpu算力会比牙膏厂低？

作者: af_x_if 时间: 2024-6-6 21:37

wjm47196 发表于 2024-6-6 21:15
牙膏厂总算力120tops 按摩店只说了npu50tops，按摩店的cpu+gpu算力会比牙膏厂低？ ...

没有特别提，那多半就是照上一代按规模提升。
上一代GPU提供了23TOPS，规模增加了1/3，再考虑频率也略有提升，所以……34T？

作者: los_parrot 时间: 2024-6-6 21:41
amd光一个avx512，cpu核心跑4g,12核的算力不是24t吗？intel的cpu核才5t算力，洗洗睡吧。

作者: psps3 时间: 2024-6-6 21:57

ekiuc 发表于 2024-6-6 15:30
我模糊记得好像总算力80T，intel那边提自己家总和能到120T（5+48+67）的时候好像提了一嘴

话说这个应该 ...

ryzen ai 300系列，内存支持到多高频率？

作者: kaiwenwu 时间: 2024-6-6 22:00

los_parrot 发表于 2024-6-6 21:41
amd光一个avx512，cpu核心跑4g,12核的算力不是24t吗？intel的cpu核才5t算力，洗洗睡吧。

所以是AMD 24T+34T+50T=108T 大于Intel 48T+67T=115T喽

CPU算力再高有屁用，不用CPU干活都吊打了。

不是CPU该干活了就别硬干省的出来丢脸

作者: los_parrot 时间: 2024-6-6 22:13

kaiwenwu 发表于 2024-6-6 22:00
所以是AMD 24T+34T+50T=108T 大于Intel 48T+67T=115T喽

CPU算力再高有屁用，不用CPU干活都吊打了。

intel gpu的67t大概是什么8bit甚至4bit算力，你把amd的34t乘个4再比把

作者: gtx9 时间: 2024-6-6 22:32

los_parrot 发表于 2024-6-6 21:41
amd光一个avx512，cpu核心跑4g,12核的算力不是24t吗？intel的cpu核才5t算力，洗洗睡吧。

怎么算的？好像不对吧

作者: kaiwenwu 时间: 2024-6-6 22:35

los_parrot 发表于 2024-6-6 22:13
intel gpu的67t大概是什么8bit甚至4bit算力，你把amd的34t乘个4再比把

厉害，原来你这么会比啊

作者: los_parrot 时间: 2024-6-6 23:05

gtx9 发表于 2024-6-6 22:32
怎么算的？好像不对吧

全部换算成int8咯

ai算力这不是基操吗？

作者: los_parrot 时间: 2024-6-6 23:08

kaiwenwu 发表于 2024-6-6 22:35
厉害，原来你这么会比啊

你觉得intel的集成的gpu规模有4090的多少成？

4090的fp32算力是70t。

作者: zerozerone 时间: 2024-6-6 23:46
intel更懂宣传，自有大把自来水帮忙洗地。

作者: 大头吃小头 时间: 2024-6-6 23:50

psps3 发表于 2024-6-6 15:28
发布会好像没说总ai算力
集成显卡的ai算力是多少呢

说是npu 50t算力，应该差不多了吧别的也交火不了吧，有个特殊技术是可以兼容16位的，不至于8位效果稀烂

作者: ekiuc 时间: 2024-6-7 13:35
本帖最后由 ekiuc 于 2024-6-7 16:18 编辑

wjm47196 发表于 2024-6-6 21:15
牙膏厂总算力120tops 按摩店只说了npu50tops，按摩店的cpu+gpu算力会比牙膏厂低？ ...

你要是知道数据你说呗，咋地，俩个数字的事情打听不到啊？拿架构倒推也能算出来吧

最近AMD的人给我们做报告的时候全程没提iGPU的事情啊，重点一直在和FPGA同架构的NPU上，讲7900的时候还提了一嘴ROCm，到APU这边提都不提。

我做异构并行的，市面上要是再多一个可以让我并行的玩意我非常高兴的，8840u没提这事我还难受了一阵子，毕竟nv和高通大家论文都发了不知道多少篇了，太卷了

某些人别没料还装舅舅党，能接触到的人还不如我那就好笑了

题外话，写TensorRT的时候发现，如果DLA有兼容性之类的问题，可以往iGPU回落，保证能跑

但是上次AMD的人宣传NPU的时候，告诉我们遇到兼容性问题，可以往 C P U 回落

我不懂，但我大为震感

更新
华硕给的数据，CPU+GPU合计31 TOPS，跟我记忆里还有大家推算的基本一致，这个错的概率不大了，按摩店的cpu+gpu的tops确实比牙膏厂低

不过现在这个点高了也没用，他ROCm支持要是还是像现在这个半成品的样子，学术圈的都没心思没他玩，赶紧把支持做做好，别让做GPU的那帮人一提RDNA上的ROCm立马痛苦面具才是真的

作者: ekiuc 时间: 2024-6-7 13:43
本帖最后由 ekiuc 于 2024-6-7 13:58 编辑

大头吃小头发表于 2024-6-6 23:50
说是npu 50t算力，应该差不多了吧别的也交火不了吧，有个特殊技术是可以兼容16位的，不至于8位效果稀烂 ...

int8 tensor性能不丢人，老黄来了也宣传这个，而且是iGPU+2*DLA（NPU）加在一起算的，你真要并行起来这几个玩意还有访存冲突，甚至达不到老黄宣传的效果

而且精度还有进一步变低的趋势（B200）

作者: ekiuc 时间: 2024-6-7 13:49
本帖最后由 ekiuc 于 2024-6-7 13:56 编辑

af_x_if 发表于 2024-6-6 21:37
没有特别提，那多半就是照上一代按规模提升。
上一代GPU提供了23TOPS，规模增加了1/3，再考虑频率也略有 ...

如果是34T这个数字，倒是比较符合我印象里的80T（50+30）这个数字

intel的120t还算了cpu是挺扯淡的，几乎没人会用这玩意

不过去掉这个，看上去这代GPU的类tensor core堆了不少东西，到时候看看疗效如何

不过上一代他的参数就是23TOPS？那就说明已经是int8了吧

作者: kingofgu 时间: 2024-6-7 13:59
有点好奇目前有什么落地的东西能这么高效的异构并行，能用上了这一堆算力最后性能还是个代数合我觉得吊打OpenAI都是侮辱，简直是三体人降临

作者: ekiuc 时间: 2024-6-7 14:05
本帖最后由 ekiuc 于 2024-6-7 14:08 编辑

kingofgu 发表于 2024-6-7 13:59
有点好奇目前有什么落地的东西能这么高效的异构并行，能用上了这一堆算力最后性能还是个代数合我觉得吊打 ...

高度优化的嵌入式环境能尝试一下，不过与其说能不能高效的异构并行，不如说哪怕是纯tensor core甚至纯cuda core那个算力也都很难达到，这还是有老黄强大的支持的情况下

最高这么干好像是高通我记得，CPU+GPU+NPU，后来老黄他们都这个宣传了

作者: 用户 时间: 2024-6-7 14:47
推特转总HXL刚算了算，R9 AI HX系列5.1Ghz单核堪比14900k/7950x。比z1又是个大升级。

作者: ekiuc 时间: 2024-6-7 14:51

用户发表于 2024-6-7 14:47
推特转总HXL刚算了算，R9 AI HX系列5.1Ghz单核堪比14900k/7950x。比z1又是个大升级。 ...

啥时候能上个掌机嘞，现在这一堆8840u还不便宜，感觉亏的慌

作者: fluttershy 时间: 2024-6-7 14:53
掌机一直在捡垃圾即使有实力定制都在考虑成本

作者: SuperLac 时间: 2024-6-7 15:01

用户发表于 2024-6-7 14:47
推特转总HXL刚算了算，R9 AI HX系列5.1Ghz单核堪比14900k/7950x。比z1又是个大升级。 ...

7940HS单核一样是5.15G啊，按照目前爆出来的单核R23分才2000+，如果ipc按R23 SC+17%来算，这个AI HX测试的分甚至没有跑满5.1G

作者: SuperLac 时间: 2024-6-7 15:05

kaiwenwu 发表于 2024-6-6 22:00
所以是AMD 24T+34T+50T=108T 大于Intel 48T+67T=115T喽

CPU算力再高有屁用，不用CPU干活都吊打了。

上一代8700G的AI算力宣传的是总39T，其中NPU16T，那CPU+GPU就是23T。
这一代我看到NPU=50T了，CPU+GPU未知。考虑到GPU应该占大头，按照提升1/3的算法去算，也就是30T，总的确实也就80T左右。
这么看牙膏这个核显算力还挺强的。

作者: ekiuc 时间: 2024-6-7 15:20
本帖最后由 ekiuc 于 2024-6-7 15:23 编辑

SuperLac 发表于 2024-6-7 15:05
上一代8700G的AI算力宣传的是总39T，其中NPU16T，那CPU+GPU就是23T。
这一代我看到NPU=50T了，CPU+GPU未 ...

这次intel的iGPU算力大爆发我看是把dGPU上的Matrix Engine加回去了，上一代应该是直接阉割掉了

尤其是在nv如此强势且成熟的情况下，iGPU甚至dGPU上到底有没有必要用宝贵的面积加这种类Tensor Core的设计，以及到底要加多少，还是要根据企业规划自己权衡的，intel看来还是对ai有野心，Matrix Engine的面积并不算小

作者: psps3 时间: 2024-6-7 16:09

ekiuc 发表于 2024-6-6 15:30
我模糊记得好像总算力80T，intel那边提自己家总和能到120T（5+48+67）的时候好像提了一嘴

话说这个应该 ...

看了下网上新闻，华硕笔记本PPT给出的数据 RYZEN CPU+IGPU 31TOPS
https://www.ithome.com/0/772/831.htm

作者: ekiuc 时间: 2024-6-7 16:12

psps3 发表于 2024-6-7 16:09
看了下网上新闻，华硕笔记本PPT给出的数据 RYZEN CPU+IGPU 31TOPS
https://www.ithome.com/0/772/831.ht ...

这个应该错的可能性不大了，非常感谢

而且都用TOPS，精度的争论也可以告一段落了

作者: psps3 时间: 2024-6-7 16:17

ekiuc 发表于 2024-6-7 16:12
这个应该错的可能性不大了，非常感谢

而且都用TOPS，精度的争论也可以告一段落了 ...

内存频率支持到多少？没看到数据

作者: ekiuc 时间: 2024-6-7 16:19

psps3 发表于 2024-6-7 16:17
内存频率支持到多少？没看到数据

我没搜到，我甚至AI 300整个信息都没搜到多少

估计7500-8333吧我猜

作者: wjm47196 时间: 2024-6-7 18:22

ekiuc 发表于 2024-6-7 13:35
你要是知道数据你说呗，咋地，俩个数字的事情打听不到啊？拿架构倒推也能算出来吧

最近AMD的人给我们做 ...

我只是问一下而已，不用阴阳怪气，我对这个东西也没啥打听的想法，aipc短时间内不都是忽悠人的么
而且你也知道异构并行难做，拿总算力本来就挺耍流氓的，至于回落cpu那不是很正常，你是不是高估按摩店的软件团队了

apu的rocm支持已经在路上了，这玩意搞了这么久还是半成品，已经吐槽很多次了，现在是赛灵思的人有介入，未来1年看看rocm7有没有大改进吧

作者: ekiuc 时间: 2024-6-7 19:14
本帖最后由 ekiuc 于 2024-6-7 19:19 编辑

wjm47196 发表于 2024-6-7 18:22
我只是问一下而已，不用阴阳怪气，我对这个东西也没啥打听的想法，aipc短时间内不都是忽悠人的么
而且你 ...

ryzen ai和ROCm现在我看起来完全就是两套体系，这玩意不像TensorRT那样虽然写起来痛苦，dla和tensor core但是好歹还算在一套体系下。

intel那边周围暂时还没有仔细研究的，我大致听说有个统一的API，在nv上做的一些工作是可以迁移过去的，所以那个120T虽然挺扯淡的，不过应该能都利用上一些，当然，这个得能买到实物再说，intel现在吹牛吹的太多，实在是没法相信，到手再来个高频不稳定也是完全有可能的，听说NPU的48TOPS是发布前从45T拉上去的

AMD现在的搞法，一些传统的NPU和iGPU之间互相支持优化的小trick是没法用的，这个才是最糟心的，希望他们快点把软件做好吧，毕竟ROCm相比cuda能研究的东西是要更多的，现在没人做实在是amd的工具链太原始了，bug也多，总不能大家所有的工作都要从CNDA开始吧？那玩意比H100还难买多了

PS：我没别的意思，但是你第一次回复我起手就像是阴阳怪气，很难不让我产生攻击性

作者: ekiuc 时间: 2024-6-8 10:57
本帖最后由 ekiuc 于 2024-6-8 11:01 编辑

psps3 发表于 2024-6-7 16:17
内存频率支持到多少？没看到数据

找到了，DDR5-5600/LPDDR5X-7500，L3 16M->24M，有提升，但不多……

ECC没了，PCIe好像也缩了（我记得上一代20条），外围整体上和上一代差不多

https://www.amd.com/en/products/ ... en-ai-9-hx-370.html

作者: wjm47196 时间: 2024-6-8 11:17

ekiuc 发表于 2024-6-7 19:14
ryzen ai和ROCm现在我看起来完全就是两套体系，这玩意不像TensorRT那样虽然写起来痛苦，dla和tensor core ...

按摩店我个人感觉之前压根就没想推进rocm生态，管理很混乱，又是不兼容前面的卡，新的游戏卡出了支持的也很不及时。。。现在稍微好一些。。。

欢迎光临 Chiphell - 分享与交流用户体验 (https://www.chiphell.com/)