panzerlied 发表于 2022-10-14 17:11

我黄总对L2的阉割方式很好理解,你看看12代

12代处理器,每个节点的LLC Slice是3M,12-way,某些处理器阉割到了2.5M,10-way

大概是L2+MC+xbar构成了一个FBP,现在ROP放在GPC里了,AD102有6个FBP

AD102一共有48个L2 Slice,每个Slice是2M,多少way不知道,RTX 4090的每个Slice阉割到了1.5M,1.5M*48=72M,但是显存位宽依然是384bit,依然是6FBP

经过以上计算,RTX 4090可利用的带宽大概就是完整版本的四分之三,这个很好理解吧

与之相对比的是,GA102也是48个L2 Slice,每个Slice是128K,显存位宽是384bit,6FBP



ADA的L2和MC分开阉割,逻辑大概是,砍L2不一定影响FBP,但是砍FBP一定影响L2。

举个例子,假如我们未来看到一个3.5FBP的AD103卡,那么他的后端规格就是224bit,56M L2,我们再看到一个2.5FBP的AD104卡,那么他的后端就是160bit,40M L2。

ztwindwalker 发表于 2022-10-14 19:15

所以没准会有160bit显存位宽 10GB显存的型号作为入门版?(取代以前的128bit版本?)

PolyMorph 发表于 2022-10-14 19:18

ztwindwalker 发表于 2022-10-14 19:15
所以没准会有160bit显存位宽 10GB显存的型号作为入门版?(取代以前的128bit版本?) ...

4070 10g

PolyMorph 发表于 2022-10-14 19:32

512 KB of L2 cache is paired with each GA102 32-bit memory controller
1组32bit匹配4 slice 8mb
1 fbp匹配2x32bit

PolyMorph 发表于 2022-10-14 19:37

本帖最后由 PolyMorph 于 2022-10-14 19:44 编辑

直接理解为4090 虽然size大,但是肾虚
万元卡都这么下刀,AMD有点拉

zhoubi 发表于 2022-10-14 20:24

一切技术贴皆可转农企去世

TakanashiRikka 发表于 2022-10-14 20:49

ztwindwalker 发表于 2022-10-14 19:15
所以没准会有160bit显存位宽 10GB显存的型号作为入门版?(取代以前的128bit版本?) ...

1060 5g 后继有人了[傻笑]

chp1979 发表于 2022-10-14 21:16

zhoubi 发表于 2022-10-14 20:24
一切技术贴皆可转农企去世

急需你去发一个万万一收录农企去世言论
页: [1]
查看完整版本: 我黄总对L2的阉割方式很好理解,你看看12代