找回密码
 加入我们
搜索
      
查看: 8432|回复: 25

[CPU] SPR的硬件加速器官方Demo

[复制链接]
发表于 2022-10-1 12:03 来自手机 | 显示全部楼层
用户 发表于 2022-10-1 04:28
amx加法和avx有区别吗

如果有的话,估计就是同时操作的数据不一样吧。amx都是int8的,而且宽度也比avx512宽。amx的寄存器是二维矩阵形式的。avx都是向量。
发表于 2022-10-1 12:08 来自手机 | 显示全部楼层
赫敏 发表于 2022-10-1 03:08
CPU直接集成这些还是有优势,不用来回倒数据。外挂ASIC可能算力过剩IO跟不上 ...

dsa有三种模式:协处理器,集成在cpu但走pcie,插在主板上。

各有优势,看使用场景了。

有些巧合的是,via之前发布的cna处理器和intel这个一样都是第二种。而且via那个团队被intel买走了。估计是集中了相关的人才。
发表于 2022-10-1 12:11 来自手机 | 显示全部楼层
赫敏 发表于 2022-10-1 03:08
CPU直接集成这些还是有优势,不用来回倒数据。外挂ASIC可能算力过剩IO跟不上 ...

外挂加速器走的就是offload路线,就像显卡一样,任务全包,板载显存,自带dma可以访问内存。gpu收到的任务基本不需要cpu就可以全部做完了。其实也没有什么问题。

不过intel不会走这个路线就是了。
发表于 2022-10-1 12:14 来自手机 | 显示全部楼层
现在各大数据中心厂商基本自研npu(网络加速器),就是走的外接设备路线。所有计算都offload,包括openssl这些。和cpu基本没关系。cpu的作用就是协调管理。

当然,更有想法的就买arm授权自己做集成在cpu的dsa,比如aws和阿里。
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2025-6-12 21:13 , Processed in 0.010298 second(s), 6 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表