埃律西昂 发表于 2022-9-29 10:38

SPR的硬件加速器官方Demo

https://www.anandtech.com/show/17596/intel-demos-sapphire-rapids-accelerators-at-innovation-2022

有点太模糊了,一下子看不清楚。

momo77989724 发表于 2022-9-29 10:41

那么今年上不上HEDT。。。

埃律西昂 发表于 2022-9-29 10:42

momo77989724 发表于 2022-9-29 10:41
那么今年上不上HEDT。。。

今年基本不可能,Innovation是最后的大发布会了,要上也是CES 2023

人撞猪上 发表于 2022-9-29 10:54

翻译其中一段:
“此处使用单个 CPU 内核来展示效率(并且因为几个 CPU 内核就足以使链路饱和),与仅使用英特尔优化的 DSA 模块相比,DSA 模块允许 Sapphire Rapids 在 128K QD64 顺序读取上提供 76% 以上的 IOPS相同工作负载上的 ISA-L 库。 EPYC 系统的领先优势更大,DSA 的延迟远低于 2000us。

还使用较小的 16K QD256 随机读取进行了类似的测试,针对 2 个 CPU 内核运行。 DSA 的性能优势在这里并没有那么大——与 Sapphire Rapids 上的优化软件相比只有 22%——但与 EPYC 相比,优势再次更大,延迟更低。”

看来这货出来以后, AMD就会彻底失去最后的遮羞布了,春秋大梦醒后,还是回去专注与属于自己的低端低价市场吧

847681220 发表于 2022-9-29 11:16

人撞猪上 发表于 2022-9-29 10:54
翻译其中一段:
“此处使用单个 CPU 内核来展示效率(并且因为几个 CPU 内核就足以使链路饱和),与仅使用 ...

mi300也有封装fpga或asic版本啊

Xerxes2 发表于 2022-9-29 11:30

人撞猪上 发表于 2022-9-29 10:54
翻译其中一段:
“此处使用单个 CPU 内核来展示效率(并且因为几个 CPU 内核就足以使链路饱和),与仅使用 ...

如果没加你的私货,看起来还是蛮正常的一个人,可惜了

qh88511 发表于 2022-9-30 09:38

如果INTEL的新HEDT平台出来了,旗舰CPU的价格应该会比10980xe价格要高吧??

aasa0001 发表于 2022-10-1 01:27

hedt版本估计把这些都阉割了。
amx和avx512还是很有用,阉了就很鸡肋。剩下的确实WS很难用到。

aibo 发表于 2022-10-1 01:30

qh88511 发表于 2022-9-30 09:38
如果INTEL的新HEDT平台出来了,旗舰CPU的价格应该会比10980xe价格要高吧??

10980已经是菜鸡了,7980才是巅峰。
不过如果以后还有hedt,超7980应该是小意思

赫敏 发表于 2022-10-1 03:03

怪不得拖了这么久,原来是搞了一堆ASIC在里面。编译器和调试debug用了很久应该

SPR看来是一款专为云ISP设计的CPU。里面网络加速单元,nvme OF加速单元都是给AWS成品服务设计的。只可惜AWS不一定有兴趣,在搞自己的一套arm,可能微软azure会有兴趣搞这些。一般的公司没必要也没精力搞

赫敏 发表于 2022-10-1 03:04

当然传统CPU算力明显是寄了,跟zen3比才领先这么点。把zen3提到SPR同功耗水平应该直接反杀了

赫敏 发表于 2022-10-1 03:05

aasa0001 发表于 2022-9-30 12:27
hedt版本估计把这些都阉割了。
amx和avx512还是很有用,阉了就很鸡肋。剩下的确实WS很难用到。 ...

你去看看amx现在才几条指令,连个加法都没有。现在就起个名字把坑占住而已

赫敏 发表于 2022-10-1 03:08

847681220 发表于 2022-9-28 22:16
mi300也有封装fpga或asic版本啊

CPU直接集成这些还是有优势,不用来回倒数据。外挂ASIC可能算力过剩IO跟不上

用户 发表于 2022-10-1 04:26

赫敏 发表于 2022-10-1 03:03
怪不得拖了这么久,原来是搞了一堆ASIC在里面。编译器和调试debug用了很久应该

SPR看来是一款专为云ISP设 ...

微软看x3d那一波,看着已经all in amd了吧

用户 发表于 2022-10-1 04:28

赫敏 发表于 2022-10-1 03:05
你去看看amx现在才几条指令,连个加法都没有。现在就起个名字把坑占住而已 ...

amx加法和avx有区别吗

tudou02 发表于 2022-10-1 09:56

momo77989724 发表于 2022-9-29 10:41
那么今年上不上HEDT。。。

买WORKSTATION呗[偷笑]HEDT怕是不会再有

ternnence@chh 发表于 2022-10-1 12:03

用户 发表于 2022-10-1 04:28
amx加法和avx有区别吗

如果有的话,估计就是同时操作的数据不一样吧。amx都是int8的,而且宽度也比avx512宽。amx的寄存器是二维矩阵形式的。avx都是向量。

ternnence@chh 发表于 2022-10-1 12:08

赫敏 发表于 2022-10-1 03:08
CPU直接集成这些还是有优势,不用来回倒数据。外挂ASIC可能算力过剩IO跟不上 ...

dsa有三种模式:协处理器,集成在cpu但走pcie,插在主板上。

各有优势,看使用场景了。

有些巧合的是,via之前发布的cna处理器和intel这个一样都是第二种。而且via那个团队被intel买走了。估计是集中了相关的人才。

ternnence@chh 发表于 2022-10-1 12:11

赫敏 发表于 2022-10-1 03:08
CPU直接集成这些还是有优势,不用来回倒数据。外挂ASIC可能算力过剩IO跟不上 ...

外挂加速器走的就是offload路线,就像显卡一样,任务全包,板载显存,自带dma可以访问内存。gpu收到的任务基本不需要cpu就可以全部做完了。其实也没有什么问题。

不过intel不会走这个路线就是了。

ternnence@chh 发表于 2022-10-1 12:14

现在各大数据中心厂商基本自研npu(网络加速器),就是走的外接设备路线。所有计算都offload,包括openssl这些。和cpu基本没关系。cpu的作用就是协调管理。

当然,更有想法的就买arm授权自己做集成在cpu的dsa,比如aws和阿里。

a6057c 发表于 2022-10-1 12:26

赫敏 发表于 2022-10-1 03:03
怪不得拖了这么久,原来是搞了一堆ASIC在里面。编译器和调试debug用了很久应该

SPR看来是一款专为云ISP设 ...

[偷笑] 亚马逊有自己的Nitro加速卡根本瞧不上这些CPU内置的东西,迭代慢还卖的贵。微软也有类似的。

momo77989724 发表于 2022-10-1 12:58

tudou02 发表于 2022-10-1 09:56
买WORKSTATION呗HEDT怕是不会再有

也不是工作用就是看看自己组个玩 如果价格不离谱的话有时候过段日子 又改注意了

chenwen834 发表于 2022-10-1 13:07

赫敏 发表于 2022-10-1 03:08
CPU直接集成这些还是有优势,不用来回倒数据。外挂ASIC可能算力过剩IO跟不上 ...

有没有一种可能,MI300是超级APU

kaiwenwu 发表于 2022-10-1 14:24

Xerxes2 发表于 2022-9-29 11:30
如果没加你的私货,看起来还是蛮正常的一个人,可惜了

就算当前产品,epyc也不行啊,intel的指令集优势很大,epyc现在也就在一些不依赖指令集支持的应用里比较有优势,比如储存,渲染这种纯算力场景[流汗]

gtx9 发表于 2022-10-1 14:35

kaiwenwu 发表于 2022-10-1 14:24
就算当前产品,epyc也不行啊,intel的指令集优势很大,epyc现在也就在一些不依赖指令集支持的应用里比较 ...

Intel也不敢说你这话[偷笑]

kaiwenwu 发表于 2022-10-1 15:11

gtx9 发表于 2022-10-1 14:35
Intel也不敢说你这话

这个也不是我说的,intel自己说的[偷笑]
页: [1]
查看完整版本: SPR的硬件加速器官方Demo