panzerlied 发表于 2022-10-1 21:03

[沙雕测试四] 对Ada Lovelace的暴论兼测试预告

如果Ampere是超级猛男版的RDNA1,那么Ada Lovelace就是超级猛男版的RDNA2。

因为没法拔高AD103,就只能想办法阉割GA102。

我还没时间测严格的同频定频,先粗略测试一下。



1、把GA102和AD103同时阉割到9728CUDA

2、AD103 offset -810MHz,此时两张卡的面板频率是一样的1395-1695

3、GA102 TGP 350W,AD103 offset到55%,基本上是TGP 175W,模拟GN21-X11,也就是笔记本顶级卡的情况

4、显存子系统不动,GA102为6M L2+19.5Gbps,AD103为64M L2+22.4Gbps



在这个情况下,

1、AD103的TSE跑分对比GA102提升3.41%,也就是说,在经过进一步精细调校后的GN21-X11,起码是一个3090的性能。

2、AD103的AIDA64 Memory Copy是GA102的2.28X,这个其实又是AIDA64的老“问题”,跑在了缓存里。

3、用求秒自己写的测试软件测出来大概等效带宽提升了200G,ROP未见增加,这有待进一步测试。



看起来40系确实是一个后端带宽加强,SM内单元小改,光追加强的暴力提频30系

但是提升是非常可观的

以上抛砖引玉,不抢媒体的风头。

希望大家对40系有个较为准确的认识。

houyuzhou 发表于 2022-10-1 21:05

记得你之前就说过 n i打算用自己的工程能力,传统架构上硬挤出一代来,还是挺准的。

i先不讨论

路西法大大 发表于 2022-10-1 21:11

阉割了4090之后的半代升级满血版TITAN或者4090TI又能跟老4090拉开接近25%的差距就又可以收割一波啦

issues 发表于 2022-10-1 21:13

到时候用什么形容900W呢?

阿诺德施瓦辛格 发表于 2022-10-1 21:16

ad103本身就是新工艺的ga102吧

psps3 发表于 2022-10-1 21:18

几号解禁评测?

atiufo 发表于 2022-10-1 21:20

psps3 发表于 2022-10-1 21:18
几号解禁评测?

11号FE解禁,12号非公解禁

yourclassdoggy 发表于 2022-10-1 21:25

能用“nvidia-smi -lgc”定频吗?

取个名字真是难 发表于 2022-10-1 21:26

同cuda下ad103用175w略赢350W的ga102,这能耗比还行[吃惊]

panzerlied 发表于 2022-10-1 21:27

yourclassdoggy 发表于 2022-10-1 21:25
能用“nvidia-smi -lgc”定频吗?

应该是可以的,就是如果要定频   我得去测两个卡 麻烦死了 我要抓紧WLK 没时间啊

atiufo 发表于 2022-10-1 21:33

盲猜一个50系是工艺小幅度升级(比如n4p,当然也有可能用回三星),核心规模小幅度提升,sm内单元有较大改进,核心频率拉到3.5GHz+,感觉差不多够了[偷笑]

取个名字真是难 发表于 2022-10-1 21:40

atiufo 发表于 2022-10-1 21:33
盲猜一个50系是工艺小幅度升级(比如n4p,当然也有可能用回三星),核心规模小幅度提升,sm内单元有较大改 ...

现在amd这边显卡性能逼得这么紧,除非40系能跟n31拉开40%的差距,不然用回三星工艺就是找死吧[偷笑]

chp1979 发表于 2022-10-1 21:49

取个名字真是难 发表于 2022-10-1 21:40
现在amd这边显卡性能逼得这么紧,除非40系能跟n31拉开40%的差距,不然用回三星工艺就是找死吧 ...

[偷笑]好工艺旧架构、坏工艺新架构,牙膏选一个挤吧

atiufo 发表于 2022-10-1 21:51

取个名字真是难 发表于 2022-10-1 21:40
现在amd这边显卡性能逼得这么紧,除非40系能跟n31拉开40%的差距,不然用回三星工艺就是找死吧 ...

老黄的骚操作无法预估,真要上三星所谓的3nm也不是不可能[恶魔]

xudi8092 发表于 2022-10-1 21:53

说了一百次,40系还是注水cuda,台积电版的30系
,,,,

叹息之墙 发表于 2022-10-1 21:54

这下Ampere变电子垃圾了

邪恶的光B 发表于 2022-10-1 22:17

反正我一直说的是这次提升是有的,该骂的是老黄刀法,总不能逢人推荐只买他们1W3的4090啊。现在这个"4080"性能和定价,基本把普通玩家全部挡掉,要么入手就巨亏;要么就只能帮他们清30系矿存,都特么是坑。

程杰sir 发表于 2022-10-1 22:36

好,多来点,不捶一锤,黄勋(没有仁)要飘了。。。争取市值腰斩之后,给他来个营收腰斩,哈哈哈。

faimie6183 发表于 2022-10-1 23:09

邪恶的光B 发表于 2022-10-1 22:17
反正我一直说的是这次提升是有的,该骂的是老黄刀法,总不能逢人推荐只买他们1W3的4090啊。现在这个"4080" ...

我们可以建议别人等明年满血4090TI啊

邪恶的光B 发表于 2022-10-1 23:16

faimie6183 发表于 2022-10-1 23:09
我们可以建议别人等明年满血4090TI啊

[偷笑][偷笑][偷笑]也是,我现在一般也不推荐别人买的。如果他自己说3080值不值,我就说小心**,性能值不值他说的那个价。

chp1979 发表于 2022-10-1 23:24

faimie6183 发表于 2022-10-1 23:09
我们可以建议别人等明年满血4090TI啊

满血不存在的[偷笑]TITAN大概都不满血

PolyMorph 发表于 2022-10-1 23:46

同频进步5%差不多了

geenii 发表于 2022-10-1 23:55

4090是值的,可是又有几个富哥呢
刀法版本还得等跳水才有性价比

qicaihong 发表于 2022-10-1 23:56

175是算上显存吗?那很猛啊

pcgsf22 发表于 2022-10-2 00:09

取个名字真是难 发表于 2022-10-1 21:40
现在amd这边显卡性能逼得这么紧,除非40系能跟n31拉开40%的差距,不然用回三星工艺就是找死吧 ...

三星先上了gaa可能会有性能优势

chungexcy 发表于 2022-10-2 00:28

看来hopper上的fp32+fp32+in32并没有继承啊,还是fp32+fp32/int32。。。

Enio❤Kdtree 发表于 2022-10-2 00:31

[可爱]支持超级猛男

panzerlied 发表于 2022-10-2 00:34

chungexcy 发表于 2022-10-2 00:28
看来hopper上的fp32+fp32+in32并没有继承啊,还是fp32+fp32/int32。。。

其实是继承了的

chungexcy 发表于 2022-10-2 00:38

本帖最后由 chungexcy 于 2022-10-2 00:52 编辑

panzerlied 发表于 2022-10-2 00:34
其实是继承了的

那问题来了。。。要是继承了为啥不是25-30%的提升。。。为啥效率没有回到turning架构。。。

GA102的7gpc效率相对6gpc提升太少。这3%的性能看上去就像ad103改进了7gpc的效率,别的啥都没变一样。当然ad102的12gpc效率也是一个笑话。

你要是能试着把AD103降到3080 12G的8960规模,同频下怕是还没有3%的提升

panzerlied 发表于 2022-10-2 00:58

chungexcy 发表于 2022-10-2 00:38
那问题来了。。。要是继承了为啥不是25-30%的提升。。。为啥效率没有回到turning架构。。。

GA102的7gpc ...

那不至于,缓存摆在那里的。

问题并不是管线,还是在warp那里。
页: [1] 2 3
查看完整版本: [沙雕测试四] 对Ada Lovelace的暴论兼测试预告