我黄总对L2的阉割方式很好理解,你看看12代
12代处理器,每个节点的LLC Slice是3M,12-way,某些处理器阉割到了2.5M,10-way大概是L2+MC+xbar构成了一个FBP,现在ROP放在GPC里了,AD102有6个FBP
AD102一共有48个L2 Slice,每个Slice是2M,多少way不知道,RTX 4090的每个Slice阉割到了1.5M,1.5M*48=72M,但是显存位宽依然是384bit,依然是6FBP
经过以上计算,RTX 4090可利用的带宽大概就是完整版本的四分之三,这个很好理解吧
与之相对比的是,GA102也是48个L2 Slice,每个Slice是128K,显存位宽是384bit,6FBP
ADA的L2和MC分开阉割,逻辑大概是,砍L2不一定影响FBP,但是砍FBP一定影响L2。
举个例子,假如我们未来看到一个3.5FBP的AD103卡,那么他的后端规格就是224bit,56M L2,我们再看到一个2.5FBP的AD104卡,那么他的后端就是160bit,40M L2。 所以没准会有160bit显存位宽 10GB显存的型号作为入门版?(取代以前的128bit版本?) ztwindwalker 发表于 2022-10-14 19:15
所以没准会有160bit显存位宽 10GB显存的型号作为入门版?(取代以前的128bit版本?) ...
4070 10g 512 KB of L2 cache is paired with each GA102 32-bit memory controller
1组32bit匹配4 slice 8mb
1 fbp匹配2x32bit 本帖最后由 PolyMorph 于 2022-10-14 19:44 编辑
直接理解为4090 虽然size大,但是肾虚
万元卡都这么下刀,AMD有点拉 一切技术贴皆可转农企去世 ztwindwalker 发表于 2022-10-14 19:15
所以没准会有160bit显存位宽 10GB显存的型号作为入门版?(取代以前的128bit版本?) ...
1060 5g 后继有人了[傻笑] zhoubi 发表于 2022-10-14 20:24
一切技术贴皆可转农企去世
急需你去发一个万万一收录农企去世言论
页:
[1]