[两年一度的见异思迁] ADA和Ampere的同频同规格测试
本帖最后由 panzerlied 于 2022-10-31 10:26 编辑预告发过了,坑还是要填的。
之前发的这类帖子都被归档了,挺没意思的,不过该发的还是要发。
一、测试方案
本次测试采用控制变量法。
1、AD103和GA102采用相同的7GPC*6TPC结构,在使用相同阉割方法的情况下,可以做到管线结构一致,没办法做到42TPC的AD103,那就把GA102阉割到38TPC。ROP,纹理那些数量都是一样的。
2、使用debug工具使核心频率锁定在1500MHz,关闭boost。
3、显存子系统不变,4FBP打6FBP,22.4Gbps+256-bit+64M L2打19.5Gbps+384-bit+6M L2。
4、为避免功耗墙影响测试,GA102拉到400W,AD103拉到360W。
二、测试平台
AMD Ryzen 7 5800X3D
MSI MEG B550 Unify-X
Crucial Ballistix RGB DDR4 3200 32Gx2@3600MHz
Sliverstone ST1200-G+海韵原装16-pin转接线
三、测试数据
1、AIDA64理论数据
2、3DMark理论数据
3、游戏数据
4、渲染和填充率数据
5、功耗数据
四、数据分析
1、和之前预告的也差不多,在综合性基准测试里,ADA领先Ampere有5.25%,DXR测试领先12.99%。
2、受显存带宽影响,Hash能力ADA相比Ampere降低27.37%,我也跑过AD103的干活能力,只有七十多M,大缓存在这种情况下不起作用。
3、反应在带光追的实际游戏里,ADA对比Ampere平均提升7.06%。
4、ADA的GPC的光栅化效率略有降低,不太像是误差。
5、在1.5G下,功耗几乎降低了一半,能耗比几乎提升了100%。
6、DLSS3看起来很好,都在4K Performance档位下,DLSS1提升倍率是1.9X,DLSS2的倍率是2.5X,DLSS3是3.4X,也就是说,DLSS3在理论上对比DLSS2有36%的提升。
五、后记
以前我们开玩笑说什么NV的提升全靠光追,DLSS什么的,这次几乎可以这么说了,当然,必须还得加上一个频率,虽然这个频率确实没有达到预期就是了。 这么说性能提升就靠加规模和换工艺[晕倒] 省流:等50系[偷笑] 看来这代主要靠DLSS和台积电提频 [偷笑]台积电NB! 本帖最后由 LOLI反应堆 于 2022-10-31 10:45 编辑
还行啊,至少游戏没倒退,以后要不要把AD104和GA104的效率也比比[傻笑] 制程能耗比高,但架不住往死里超
可以预见明年的40系移动端也是一个路数,切一切然后超一超再塞进移动端
加规格,那可不兴加太猛,频率一拉,制程红利都喂狗 LOLI反应堆 发表于 2022-10-31 10:44
还行啊,至少游戏没倒退,以后要不要把AD104和GA104的效率也比比
5*6和6*4不好比哦 panzerlied 发表于 2022-10-31 10:47
5*6和6*4不好比哦
就同粗大比嘛,看看少一两个GPC效率差多少[恶魔] 8086k 发表于 2022-10-31 10:35
这么说性能提升就靠加规模和换工艺
IPC提升5%,比按摩店代际提升要差的样子[偷笑] RMSMajestic 发表于 2022-10-31 10:56
大佬流处理器是怎么阉割关闭的? 另外能耗比会不会是被第一代GDDR6X 显存拖下水了? 用RTX A6000 测是否会更 ...
显存确实会有一些影响,所以我把功耗墙拉高了。这确实也会影响能耗比,所以最后距离翻倍还有点距离。 有种感觉zen4/13th/ada好像套路都一致,优化or制程大大提升频率,能耗比大幅提升,但是还是热的一批,因为频率提到了灰烬的程度,并且本身架构改动不大。。/ zxd1997 发表于 2022-10-31 11:04
有种感觉zen4/13th/ada好像套路都一致,优化or制程大大提升频率,能耗比大幅提升,但是还是热的一批,因为 ...
架构优化越来越难了 AD103上笔记本挺好的 zxd1997 发表于 2022-10-31 11:04
有种感觉zen4/13th/ada好像套路都一致,优化or制程大大提升频率,能耗比大幅提升,但是还是热的一批,因为 ...
我记得我是不是在很久很久之前说过,“要用工程能力强拱一代”。
换工艺这样操作是可以理解的,关键是价格。 六副总牛逼,这能耗比确实漂亮 Barcelona 发表于 2022-10-31 10:38
台积电NB!
不是台积电NB,是三星太拉 1.62倍的晶体管,规格开倒车,ipc也牙膏,真全堆光追dlss了? 全靠台积电的功劳。性能提升全靠拉频率。 LambdaDelta 发表于 2022-10-31 11:15
六副总牛逼,这能耗比确实漂亮
3x fp32,2x tse,1.6x game performance,有没有一种90T算力喂狗的感觉?其实老黄应该升级成512+bit比较靠谱[怪脸]linux驱动同步发布的,可就没见过有人测过ai benchmark,如果炼丹能3x性能,还是能聊以自慰的 所有提升都来自规格和频率。。。 huhudna 发表于 2022-10-31 11:47
所有提升都来自规格和频率。。。
架构更新要留着下一次挤,50系的工艺大概率保持不变或者小提升 这个能效提升确实很好看。[震惊]
如果AD102再给一刀到256B GD6X 实际同频率下的性能提升应该会更多一些吧,这样比较也会合理一点吧?
ga102咋屏蔽到9728的,有实际工程样品? 本帖最后由 chungexcy 于 2022-10-31 12:28 编辑
panzerlied 发表于 2022-10-31 10:47
5*6和6*4不好比哦
整一个6*5的AD103[偷笑]
顺便要不要试试阉割成 9216 cuda 的 ad103 vs ga102[偷笑] atiufo 发表于 2022-10-31 12:04
架构更新要留着下一次挤,50系的工艺大概率保持不变或者小提升
hopper 的新sm架构估计留给下一代了 T.JOHN 发表于 2022-10-31 11:40
3x fp32,2x tse,1.6x game performance,有没有一种90T算力喂狗的感觉?其实老黄应该升级成512+bit比较 ...
ai画图的出图速度好像跟3080一样,估计软件上有点问题 本帖最后由 PolyMorph 于 2022-10-31 12:39 编辑
3080 8704 1830mhz760gb
8700tse320w
阉割位宽功耗让给核心超频,分数都高于只降频,只能说确实被gd6x拉下水了
建议补个核心显存功耗
chungexcy 发表于 2022-10-31 12:26
整一个6*5的AD103
我知道你的意思。但是4080的阉割不是逮着一个GPC薅的,所以6GPC做不到9216。
页:
[1]
2