SPR的硬件加速器官方Demo
https://www.anandtech.com/show/17596/intel-demos-sapphire-rapids-accelerators-at-innovation-2022有点太模糊了,一下子看不清楚。 那么今年上不上HEDT。。。 momo77989724 发表于 2022-9-29 10:41
那么今年上不上HEDT。。。
今年基本不可能,Innovation是最后的大发布会了,要上也是CES 2023 翻译其中一段:
“此处使用单个 CPU 内核来展示效率(并且因为几个 CPU 内核就足以使链路饱和),与仅使用英特尔优化的 DSA 模块相比,DSA 模块允许 Sapphire Rapids 在 128K QD64 顺序读取上提供 76% 以上的 IOPS相同工作负载上的 ISA-L 库。 EPYC 系统的领先优势更大,DSA 的延迟远低于 2000us。
还使用较小的 16K QD256 随机读取进行了类似的测试,针对 2 个 CPU 内核运行。 DSA 的性能优势在这里并没有那么大——与 Sapphire Rapids 上的优化软件相比只有 22%——但与 EPYC 相比,优势再次更大,延迟更低。”
看来这货出来以后, AMD就会彻底失去最后的遮羞布了,春秋大梦醒后,还是回去专注与属于自己的低端低价市场吧 人撞猪上 发表于 2022-9-29 10:54
翻译其中一段:
“此处使用单个 CPU 内核来展示效率(并且因为几个 CPU 内核就足以使链路饱和),与仅使用 ...
mi300也有封装fpga或asic版本啊 人撞猪上 发表于 2022-9-29 10:54
翻译其中一段:
“此处使用单个 CPU 内核来展示效率(并且因为几个 CPU 内核就足以使链路饱和),与仅使用 ...
如果没加你的私货,看起来还是蛮正常的一个人,可惜了 如果INTEL的新HEDT平台出来了,旗舰CPU的价格应该会比10980xe价格要高吧?? hedt版本估计把这些都阉割了。
amx和avx512还是很有用,阉了就很鸡肋。剩下的确实WS很难用到。 qh88511 发表于 2022-9-30 09:38
如果INTEL的新HEDT平台出来了,旗舰CPU的价格应该会比10980xe价格要高吧??
10980已经是菜鸡了,7980才是巅峰。
不过如果以后还有hedt,超7980应该是小意思 怪不得拖了这么久,原来是搞了一堆ASIC在里面。编译器和调试debug用了很久应该
SPR看来是一款专为云ISP设计的CPU。里面网络加速单元,nvme OF加速单元都是给AWS成品服务设计的。只可惜AWS不一定有兴趣,在搞自己的一套arm,可能微软azure会有兴趣搞这些。一般的公司没必要也没精力搞 当然传统CPU算力明显是寄了,跟zen3比才领先这么点。把zen3提到SPR同功耗水平应该直接反杀了 aasa0001 发表于 2022-9-30 12:27
hedt版本估计把这些都阉割了。
amx和avx512还是很有用,阉了就很鸡肋。剩下的确实WS很难用到。 ...
你去看看amx现在才几条指令,连个加法都没有。现在就起个名字把坑占住而已 847681220 发表于 2022-9-28 22:16
mi300也有封装fpga或asic版本啊
CPU直接集成这些还是有优势,不用来回倒数据。外挂ASIC可能算力过剩IO跟不上 赫敏 发表于 2022-10-1 03:03
怪不得拖了这么久,原来是搞了一堆ASIC在里面。编译器和调试debug用了很久应该
SPR看来是一款专为云ISP设 ...
微软看x3d那一波,看着已经all in amd了吧 赫敏 发表于 2022-10-1 03:05
你去看看amx现在才几条指令,连个加法都没有。现在就起个名字把坑占住而已 ...
amx加法和avx有区别吗 momo77989724 发表于 2022-9-29 10:41
那么今年上不上HEDT。。。
买WORKSTATION呗[偷笑]HEDT怕是不会再有 用户 发表于 2022-10-1 04:28
amx加法和avx有区别吗
如果有的话,估计就是同时操作的数据不一样吧。amx都是int8的,而且宽度也比avx512宽。amx的寄存器是二维矩阵形式的。avx都是向量。 赫敏 发表于 2022-10-1 03:08
CPU直接集成这些还是有优势,不用来回倒数据。外挂ASIC可能算力过剩IO跟不上 ...
dsa有三种模式:协处理器,集成在cpu但走pcie,插在主板上。
各有优势,看使用场景了。
有些巧合的是,via之前发布的cna处理器和intel这个一样都是第二种。而且via那个团队被intel买走了。估计是集中了相关的人才。 赫敏 发表于 2022-10-1 03:08
CPU直接集成这些还是有优势,不用来回倒数据。外挂ASIC可能算力过剩IO跟不上 ...
外挂加速器走的就是offload路线,就像显卡一样,任务全包,板载显存,自带dma可以访问内存。gpu收到的任务基本不需要cpu就可以全部做完了。其实也没有什么问题。
不过intel不会走这个路线就是了。 现在各大数据中心厂商基本自研npu(网络加速器),就是走的外接设备路线。所有计算都offload,包括openssl这些。和cpu基本没关系。cpu的作用就是协调管理。
当然,更有想法的就买arm授权自己做集成在cpu的dsa,比如aws和阿里。 赫敏 发表于 2022-10-1 03:03
怪不得拖了这么久,原来是搞了一堆ASIC在里面。编译器和调试debug用了很久应该
SPR看来是一款专为云ISP设 ...
[偷笑] 亚马逊有自己的Nitro加速卡根本瞧不上这些CPU内置的东西,迭代慢还卖的贵。微软也有类似的。 tudou02 发表于 2022-10-1 09:56
买WORKSTATION呗HEDT怕是不会再有
也不是工作用就是看看自己组个玩 如果价格不离谱的话有时候过段日子 又改注意了 赫敏 发表于 2022-10-1 03:08
CPU直接集成这些还是有优势,不用来回倒数据。外挂ASIC可能算力过剩IO跟不上 ...
有没有一种可能,MI300是超级APU Xerxes2 发表于 2022-9-29 11:30
如果没加你的私货,看起来还是蛮正常的一个人,可惜了
就算当前产品,epyc也不行啊,intel的指令集优势很大,epyc现在也就在一些不依赖指令集支持的应用里比较有优势,比如储存,渲染这种纯算力场景[流汗] kaiwenwu 发表于 2022-10-1 14:24
就算当前产品,epyc也不行啊,intel的指令集优势很大,epyc现在也就在一些不依赖指令集支持的应用里比较 ...
Intel也不敢说你这话[偷笑] gtx9 发表于 2022-10-1 14:35
Intel也不敢说你这话
这个也不是我说的,intel自己说的[偷笑]
页:
[1]