gpu的l1就是可以不要求一致性的, 仍然堆不动, 面积上就是堆不动的
容量堆不动,带宽应该堆得动 flshlion 发表于 2024-1-9 03:14
之前看资料ZEN3的6发射,Intel这边12代之前是4发射,12代后是6发射。不知道8发射10发射什么时候出来 。 ...
发射数不一定代表线性提升,关键要保证在一个很小的窗口内确实能找到这么多无数据相关性的指令
发射数翻倍可能需要寄存器和缓冲区4倍来配合,基本上规模要X4还要多几倍的连线。但X4的规模可以有很多其他选择比如增加核心数或者加缓存加小核
页:
1
[2]