Chiphell - 分享与交流用户体验

标题: Ryzen AI 300的设备大概什么时候能上市呀? [打印本页]

作者: ekiuc    时间: 2024-6-6 15:24
标题: Ryzen AI 300的设备大概什么时候能上市呀?
眼看着下一代也快来了,结果最近不少掌机反而在这个节点更新了8840u/Z1E……

所以大家觉得搭载Strix Point大概什么时候会上市?我看它整个SKU相比之前也偏少,是不是只有部分高端货才会用上?


(还是说掌机上会倾向于用LNL?)
作者: xy.    时间: 2024-6-6 15:25
下个月, 首发大眼睛
作者: psps3    时间: 2024-6-6 15:28
发布会好像没说总ai算力
集成显卡的ai算力是多少呢

作者: ekiuc    时间: 2024-6-6 15:30
psps3 发表于 2024-6-6 15:28
发布会好像没说总ai算力
集成显卡的ai算力是多少呢


我模糊记得好像总算力80T,intel那边提自己家总和能到120T(5+48+67)的时候好像提了一嘴

话说这个应该能从架构和规格反推?不过上次A家的人来我们这儿做讲座的时候,好像没提iGPU该怎么调用,我感觉应该是ROCm的支持还没做全,有点鸡肋
作者: 5ik0z33v    时间: 2024-6-6 18:54
掌机暂时不出估计,一是清一波库存,二是不是芯片价格比较高?ASUS 估计是在等Z2E。
作者: ekiuc    时间: 2024-6-6 19:16
5ik0z33v 发表于 2024-6-6 18:54
掌机暂时不出估计,一是清一波库存,二是不是芯片价格比较高?ASUS 估计是在等Z2E。 ...

asus刚把掌机更新了一波,主要加了电池,哎
作者: los_parrot    时间: 2024-6-6 21:14
strix point跟hawk point是drop in兼容的,现有的8x40模具直接换芯片就行

作者: wjm47196    时间: 2024-6-6 21:15
ekiuc 发表于 2024-6-6 15:30
我模糊记得好像总算力80T,intel那边提自己家总和能到120T(5+48+67)的时候好像提了一嘴

话说这个应该 ...

牙膏厂总算力120tops 按摩店只说了npu50tops,按摩店的cpu+gpu算力会比牙膏厂低?
作者: af_x_if    时间: 2024-6-6 21:37
wjm47196 发表于 2024-6-6 21:15
牙膏厂总算力120tops 按摩店只说了npu50tops,按摩店的cpu+gpu算力会比牙膏厂低? ...


没有特别提,那多半就是照上一代按规模提升。
上一代GPU提供了23TOPS,规模增加了1/3,再考虑频率也略有提升,所以……34T?
作者: los_parrot    时间: 2024-6-6 21:41
amd光一个avx512,cpu核心跑4g,12核的算力不是24t吗?intel的cpu核才5t算力,洗洗睡吧。




作者: psps3    时间: 2024-6-6 21:57
ekiuc 发表于 2024-6-6 15:30
我模糊记得好像总算力80T,intel那边提自己家总和能到120T(5+48+67)的时候好像提了一嘴

话说这个应该 ...


ryzen ai 300系列,内存支持到多高频率?
作者: kaiwenwu    时间: 2024-6-6 22:00
los_parrot 发表于 2024-6-6 21:41
amd光一个avx512,cpu核心跑4g,12核的算力不是24t吗?intel的cpu核才5t算力,洗洗睡吧。

所以是AMD 24T+34T+50T=108T 大于Intel 48T+67T=115T喽

CPU算力再高有屁用,不用CPU干活都吊打了。

不是CPU该干活了就别硬干省的出来丢脸
作者: los_parrot    时间: 2024-6-6 22:13
kaiwenwu 发表于 2024-6-6 22:00
所以是AMD 24T+34T+50T=108T 大于Intel 48T+67T=115T喽

CPU算力再高有屁用,不用CPU干活都吊打了。

intel gpu的67t大概是什么8bit甚至4bit算力,你把amd的34t乘个4再比把


作者: gtx9    时间: 2024-6-6 22:32
los_parrot 发表于 2024-6-6 21:41
amd光一个avx512,cpu核心跑4g,12核的算力不是24t吗?intel的cpu核才5t算力,洗洗睡吧。

怎么算的?好像不对吧
作者: kaiwenwu    时间: 2024-6-6 22:35
los_parrot 发表于 2024-6-6 22:13
intel gpu的67t大概是什么8bit甚至4bit算力,你把amd的34t乘个4再比把

厉害,原来你这么会比啊
作者: los_parrot    时间: 2024-6-6 23:05
gtx9 发表于 2024-6-6 22:32
怎么算的?好像不对吧

全部换算成int8咯

ai算力这不是基操吗?


作者: los_parrot    时间: 2024-6-6 23:08
kaiwenwu 发表于 2024-6-6 22:35
厉害,原来你这么会比啊

你觉得intel的集成的gpu规模有4090的多少成?

4090的fp32算力 是70t。
作者: zerozerone    时间: 2024-6-6 23:46
intel更懂宣传,自有大把自来水帮忙洗地。
作者: 大头吃小头    时间: 2024-6-6 23:50
psps3 发表于 2024-6-6 15:28
发布会好像没说总ai算力
集成显卡的ai算力是多少呢

说是npu 50t算力,应该差不多了吧 别的也交火不了吧,有个特殊技术是可以兼容16位的,不至于8位效果稀烂
作者: ekiuc    时间: 2024-6-7 13:35
本帖最后由 ekiuc 于 2024-6-7 16:18 编辑
wjm47196 发表于 2024-6-6 21:15
牙膏厂总算力120tops 按摩店只说了npu50tops,按摩店的cpu+gpu算力会比牙膏厂低? ...


你要是知道数据你说呗,咋地,俩个数字的事情打听不到啊?拿架构倒推也能算出来吧

最近AMD的人给我们做报告的时候全程没提iGPU的事情啊,重点一直在和FPGA同架构的NPU上,讲7900的时候还提了一嘴ROCm,到APU这边提都不提。

我做异构并行的,市面上要是再多一个可以让我并行的玩意我非常高兴的,8840u没提这事我还难受了一阵子,毕竟nv和高通大家论文都发了不知道多少篇了,太卷了

某些人别没料还装舅舅党,能接触到的人还不如我那就好笑了

题外话,写TensorRT的时候发现,如果DLA有兼容性之类的问题,可以往iGPU回落,保证能跑

但是上次AMD的人宣传NPU的时候,告诉我们遇到兼容性问题,可以往 C P U 回 落

我不懂,但我大为震感





更新
华硕给的数据,CPU+GPU合计31 TOPS,跟我记忆里还有大家推算的基本一致,这个错的概率不大了,按摩店的cpu+gpu的tops确实比牙膏厂低

不过现在这个点高了也没用,他ROCm支持要是还是像现在这个半成品的样子,学术圈的都没心思没他玩,赶紧把支持做做好,别让做GPU的那帮人一提RDNA上的ROCm立马痛苦面具才是真的
作者: ekiuc    时间: 2024-6-7 13:43
本帖最后由 ekiuc 于 2024-6-7 13:58 编辑
大头吃小头 发表于 2024-6-6 23:50
说是npu 50t算力,应该差不多了吧 别的也交火不了吧,有个特殊技术是可以兼容16位的,不至于8位效果稀烂 ...


int8 tensor性能不丢人,老黄来了也宣传这个,而且是iGPU+2*DLA(NPU)加在一起算的,你真要并行起来这几个玩意还有访存冲突,甚至达不到老黄宣传的效果

而且精度还有进一步变低的趋势(B200)
作者: ekiuc    时间: 2024-6-7 13:49
本帖最后由 ekiuc 于 2024-6-7 13:56 编辑
af_x_if 发表于 2024-6-6 21:37
没有特别提,那多半就是照上一代按规模提升。
上一代GPU提供了23TOPS,规模增加了1/3,再考虑频率也略有 ...


如果是34T这个数字,倒是比较符合我印象里的80T(50+30)这个数字

intel的120t还算了cpu是挺扯淡的,几乎没人会用这玩意

不过去掉这个,看上去这代GPU的类tensor core堆了不少东西,到时候看看疗效如何

不过上一代他的参数就是23TOPS?那就说明已经是int8了吧
作者: kingofgu    时间: 2024-6-7 13:59
有点好奇 目前有什么落地的东西能这么高效的异构并行,能用上了这一堆算力最后性能还是个代数合 我觉得吊打OpenAI都是侮辱,简直是三体人降临
作者: ekiuc    时间: 2024-6-7 14:05
本帖最后由 ekiuc 于 2024-6-7 14:08 编辑
kingofgu 发表于 2024-6-7 13:59
有点好奇 目前有什么落地的东西能这么高效的异构并行,能用上了这一堆算力最后性能还是个代数合 我觉得吊打 ...


高度优化的嵌入式环境能尝试一下,不过与其说能不能高效的异构并行,不如说哪怕是纯tensor core甚至纯cuda core那个算力也都很难达到,这还是有老黄强大的支持的情况下

最高这么干好像是高通我记得,CPU+GPU+NPU,后来老黄他们都这个宣传了
作者: 用户    时间: 2024-6-7 14:47
推特转总HXL刚算了算,R9 AI HX系列5.1Ghz单核堪比14900k/7950x。比z1又是个大升级。
作者: ekiuc    时间: 2024-6-7 14:51
用户 发表于 2024-6-7 14:47
推特转总HXL刚算了算,R9 AI HX系列5.1Ghz单核堪比14900k/7950x。比z1又是个大升级。 ...

啥时候能上个掌机嘞,现在这一堆8840u还不便宜,感觉亏的慌
作者: fluttershy    时间: 2024-6-7 14:53
掌机一直在捡垃圾 即使有实力定制都在考虑成本
作者: SuperLac    时间: 2024-6-7 15:01
用户 发表于 2024-6-7 14:47
推特转总HXL刚算了算,R9 AI HX系列5.1Ghz单核堪比14900k/7950x。比z1又是个大升级。 ...

7940HS单核一样是5.15G啊,按照目前爆出来的单核R23分才2000+,如果ipc按R23 SC+17%来算,这个AI HX测试的分甚至没有跑满5.1G
作者: SuperLac    时间: 2024-6-7 15:05
kaiwenwu 发表于 2024-6-6 22:00
所以是AMD 24T+34T+50T=108T 大于Intel 48T+67T=115T喽

CPU算力再高有屁用,不用CPU干活都吊打了。

上一代8700G的AI算力宣传的是总39T,其中NPU16T,那CPU+GPU就是23T。
这一代我看到NPU=50T了,CPU+GPU未知。考虑到GPU应该占大头,按照提升1/3的算法去算,也就是30T,总的确实也就80T左右。
这么看牙膏这个核显算力还挺强的。
作者: ekiuc    时间: 2024-6-7 15:20
本帖最后由 ekiuc 于 2024-6-7 15:23 编辑
SuperLac 发表于 2024-6-7 15:05
上一代8700G的AI算力宣传的是总39T,其中NPU16T,那CPU+GPU就是23T。
这一代我看到NPU=50T了,CPU+GPU未 ...


这次intel的iGPU算力大爆发我看是把dGPU上的Matrix Engine加回去了,上一代应该是直接阉割掉了

尤其是在nv如此强势且成熟的情况下,iGPU甚至dGPU上到底有没有必要用宝贵的面积加这种类Tensor Core的设计,以及到底要加多少,还是要根据企业规划自己权衡的,intel看来还是对ai有野心,Matrix Engine的面积并不算小
作者: psps3    时间: 2024-6-7 16:09
ekiuc 发表于 2024-6-6 15:30
我模糊记得好像总算力80T,intel那边提自己家总和能到120T(5+48+67)的时候好像提了一嘴

话说这个应该 ...


看了下网上新闻,华硕笔记本PPT给出的数据 RYZEN  CPU+IGPU 31TOPS
https://www.ithome.com/0/772/831.htm
作者: ekiuc    时间: 2024-6-7 16:12
psps3 发表于 2024-6-7 16:09
看了下网上新闻,华硕笔记本PPT给出的数据 RYZEN  CPU+IGPU 31TOPS
https://www.ithome.com/0/772/831.ht ...

这个应该错的可能性不大了,非常感谢

而且都用TOPS,精度的争论也可以告一段落了
作者: psps3    时间: 2024-6-7 16:17
ekiuc 发表于 2024-6-7 16:12
这个应该错的可能性不大了,非常感谢

而且都用TOPS,精度的争论也可以告一段落了 ...

内存频率支持到多少?没看到数据
作者: ekiuc    时间: 2024-6-7 16:19
psps3 发表于 2024-6-7 16:17
内存频率支持到多少?没看到数据

我没搜到,我甚至AI 300整个信息都没搜到多少

估计7500-8333吧我猜
作者: wjm47196    时间: 2024-6-7 18:22
ekiuc 发表于 2024-6-7 13:35
你要是知道数据你说呗,咋地,俩个数字的事情打听不到啊?拿架构倒推也能算出来吧

最近AMD的人给我们做 ...


我只是问一下而已,不用阴阳怪气,我对这个东西也没啥打听的想法,aipc短时间内不都是忽悠人的么
而且你也知道异构并行难做,拿总算力本来就挺耍流氓的,至于回落cpu那不是很正常,你是不是高估按摩店的软件团队了
apu的rocm支持已经在路上了,这玩意搞了这么久还是半成品,已经吐槽很多次了,现在是赛灵思的人有介入,未来1年看看rocm7有没有大改进吧
作者: ekiuc    时间: 2024-6-7 19:14
本帖最后由 ekiuc 于 2024-6-7 19:19 编辑
wjm47196 发表于 2024-6-7 18:22
我只是问一下而已,不用阴阳怪气,我对这个东西也没啥打听的想法,aipc短时间内不都是忽悠人的么
而且你 ...


ryzen ai和ROCm现在我看起来完全就是两套体系,这玩意不像TensorRT那样虽然写起来痛苦,dla和tensor core但是好歹还算在一套体系下。

intel那边周围暂时还没有仔细研究的,我大致听说有个统一的API,在nv上做的一些工作是可以迁移过去的,所以那个120T虽然挺扯淡的,不过应该能都利用上一些,当然,这个得能买到实物再说,intel现在吹牛吹的太多,实在是没法相信,到手再来个高频不稳定也是完全有可能的,听说NPU的48TOPS是发布前从45T拉上去的

AMD现在的搞法,一些传统的NPU和iGPU之间互相支持优化的小trick是没法用的,这个才是最糟心的,希望他们快点把软件做好吧,毕竟ROCm相比cuda能研究的东西是要更多的,现在没人做实在是amd的工具链太原始了,bug也多,总不能大家所有的工作都要从CNDA开始吧?那玩意比H100还难买多了

PS:我没别的意思,但是你第一次回复我起手就像是阴阳怪气,很难不让我产生攻击性
作者: ekiuc    时间: 2024-6-8 10:57
本帖最后由 ekiuc 于 2024-6-8 11:01 编辑
psps3 发表于 2024-6-7 16:17
内存频率支持到多少?没看到数据


找到了,DDR5-5600/LPDDR5X-7500,L3 16M->24M,有提升,但不多……

ECC没了,PCIe好像也缩了(我记得上一代20条),外围整体上和上一代差不多

https://www.amd.com/en/products/ ... en-ai-9-hx-370.html
作者: wjm47196    时间: 2024-6-8 11:17
ekiuc 发表于 2024-6-7 19:14
ryzen ai和ROCm现在我看起来完全就是两套体系,这玩意不像TensorRT那样虽然写起来痛苦,dla和tensor core ...

按摩店我个人感觉之前压根就没想推进rocm生态,管理很混乱,又是不兼容前面的卡,新的游戏卡出了支持的也很不及时。。。现在稍微好一些。。。




欢迎光临 Chiphell - 分享与交流用户体验 (https://www.chiphell.com/) Powered by Discuz! X3.5