找回密码
 加入我们
搜索
      
查看: 5151|回复: 33

[内存] 英特尔专用条实际上比普通内存条更强--实测rank与bankgroup对内存效能的影响

[复制链接]
发表于 2025-1-2 06:37 来自手机 | 显示全部楼层 |阅读模式
本帖最后由 烟与玫瑰 于 2025-1-2 12:43 编辑

       经过很多前辈的实践已经可以形成的共识是,双面颗粒的内存通常在读写效能和实际帧率,特别是low帧上大幅领先于单面内存,而这往往是通过超频所不能弥补的。同时,插满四根内存时(也可以视作2ranks),也会在同频同参情况下帧率超过两根内存。不过,在笔者意外买到一对英特尔专用条(服务器4bit颗粒)后发现,这种专用条是双面单rank的,因此很好奇相比常规2ranks的内存条其性能如何。内存条是错发成4bit专用条的,因此笔者重新下单后就有了相同颗粒不同设置(1rank 8bg和2ranks 4bg)的两种实验对象。
       经过实机测试,同颗粒同型号的两条海力士cjr(老款)双面内存,定频4133c18,2r 4bg相比1r 8bg帧率要更低一些,差距大约在2%左右。同时2r需要的电压显著更高(2r达成电压需要1.53v,而8bg只需要1.35v)、小参也更难压低,而1r 8bg的内存几乎和单面1r 4bg的内存一样好超频。也就是说2r不仅不对性能起正向作用,反而起到了负面作用,这也符合2ranks的原理,即cpu一次只能寻址一个rank,因此另一个rank会在访问时处于等待状态,进而增加延迟。
       因此可以认为,双面内存强于单面内存纯粹是因为它有更多的颗粒而不是因为它有更多rank。在笔记本端颗粒更多的8bit内存条强于颗粒少的16bit内存条也即是这个原理。根据我查阅的一些文献所得到的解释,更多的颗粒可以降低延迟。因此8bg相比4bg的每bankgroup延迟更低(这点通常并不是aida64之类内存延迟测试软件所关注的)。我想这也是为什么第三时序中的小参trdrdsg(发生在一个BankGroup地址中的两个读取命令之间的间隔时钟周期)对游戏帧率影响巨大了。
       最后,笔者新换的同款4bit颗粒到了,故得以测试专用条的最终版本,插满四根后得到的2ranks 8bg。相比只插两根,插满四根时笔者甚至不需要更改任何电压,只用把原本第二时序的紧参稍微放松一些就可以过测,甚至远比两根2ranks 4bg的老cjr轻松。本站也有yangxun8774关于四根专用条cjr超频的帖子,可以证明并非笔者的体质特例。因为笔者并没有老cjr的单面颗粒条,故无法用单面作为对比。大致在同一款游戏中反复多次测试后,同为4133-18-22-22-40-560情况下,2r 4bg帧率大约在161帧附近(虽然频率和主副时序相同,但2r 4bg的二三时序需要更宽松),1r 8bg大约在168帧附近,而2r 8bg可以达到惊人的173帧,此时已经和笔者的双面三星bdie(2r 4bg)在4000 c16-16-16-280时帧率相当了,略微超过笔者紧参的4000 c17-20-19-600的镁光双面bdie 32gx2(171帧),与其4300 c19-23-23-42-666时相当(这个是抄的本站momoka酱的作业)。而这四根插满的64g内存甚至只需要1.35v的dram电压,相比三星bdie和镁光bdie无论是sa电压,vddq电压还是dram电压都要低很多,实现了跨级挑战。
       综合上述测试来看,4bit颗粒对于游戏性能具有很高价值,笔者也期待起4bit颗粒能早日应用在d5消费端。同时,笔者也很好奇bdie如果做成1r 8bg会有何种表现。笔者以2133-ecc-三星为关键词进行检索发现,大部分这些服务器内存条都是bcpb这种特挑bdie(当然早期版本更不容易上高频)。如果使用性能比较好的pcb自己拆颗粒进行焊接组装的话,或许可以得到一对效能极高的内存之王。当然,笔者没有足够的技术功底,只是抛砖引玉,希望能有幸看到大佬的实践。
 楼主| 发表于 2025-1-2 06:43 | 显示全部楼层
没搞懂本站要怎么发图片。以下贴上关于颗粒增多的解释及出处链接:
越多越好,加速读写能力

家用电脑的记忆体控制器已经进入双通道记忆体控制器多年,加速原理为增加资料汇流排宽度,达到同时读写更多资料的能力。



另一种增加频宽的方法就是减少延迟,利用多个 chip 或是 bank 达成。一般的记忆体读取延迟为命令下达+记忆体读取延迟+输出资料,如果命令下达延迟为 2ns、记忆体读取延迟为 10ns、输出资料延迟为 2ns,那麽读取 2 笔资料的总延迟就会是(2+10+2)×2=24ns。



如果现在能够将资料拆分至 2 颗记忆体上,那麽 2 笔读取延迟将降低至 16ns,因为不需等到前笔资料读取完成才发出下一笔的读取命令,在第一笔资料进入记忆体读取时即可发出。这种概念也可应用到目前最夯的 SSD 上,较多CE(Chip Enable)封装的快闪记忆体晶片,通常都比较少 CE 封装的晶片来得快。
http://m.blog.chinaunix.net/uid-28541347-id-5795423.html
发表于 2025-1-2 06:45 来自手机 | 显示全部楼层
一包烟一壶茶,一套小参摸一天
然后被隔壁轰成渣
 楼主| 发表于 2025-1-2 06:46 | 显示全部楼层
引用的本站momoka酱关于镁光双面bdie的参数原文如下:https://www.chiphell.com/thread-2495438-1-1.html
引用的本站yangxun8774关于四根cjr专用条的链接如下:https://www.chiphell.com/thread-2533769-1-1.html
发表于 2025-1-2 07:30 | 显示全部楼层
本帖最后由 wwwyj 于 2025-1-2 07:40 编辑

测试颗粒不统一 测试方法不严谨 测试结论无意义

解释:
测试没有考虑同型号颗粒个体差异
任何同颗粒的内存体质差异都可以极大,极度影响实验结果
测试应选用同一颗粒上不同夹具测试。测试方法可选用精确到颗粒的memtest86等做参考。
筛选出在同一测试环境下体质基本相同的8~16颗粒再进行测试。
发表于 2025-1-2 07:33 | 显示全部楼层
bdie如果做成1r 8bg会有何种表现
这个16-17年厂商已经试过了,无意义
你现在看到的pcb就是试错后最好的结果
发表于 2025-1-2 08:35 来自手机 | 显示全部楼层
而1r 8bg的内存几乎和单面4bg的内存一样好超频。也就是说2r不仅不对性能起正向作用,反而起到了负面作用

1r 8bg大约在168帧附近,而2r 8bg可以达到惊人的173帧

单双面根rank有什么关系吗,前后写的牛头不对马嘴
发表于 2025-1-2 09:05 | 显示全部楼层
200多32g套条,专用条 cjr颗粒的 随便上4000,还要啥自行车
发表于 2025-1-2 09:50 | 显示全部楼层
双面一般就是2Rank了,解释一下
1.DDR4非ECC内存单条64bit,常规的内存PCB布局是单面8颗粒/双面16颗粒
2.消费类的颗粒主要为X8,双面16个颗粒的PCB搭配X8的Dram颗粒如果都在1个Rank内总共128bit了,所以必须做成2Rank的方式,才满足单条内存64bit的要求
 楼主| 发表于 2025-1-2 12:32 来自手机 | 显示全部楼层
ZJYZY 发表于 2025-1-2 08:35
而1r 8bg的内存几乎和单面4bg的内存一样好超频。也就是说2r不仅不对性能起正向作用,反而起到了负面作用

1 ...

单面基本只有1r的,不过确实是我没写清。专用条只插两根就是1r 8bg,此时和单面内存1r 4bg一样很好超频。因为2r不仅比1r更难超频,实际效能也不如,因此认为2r对性能起到了副作用。插满四根的专用条是2r 8bg,此时效能最高。
 楼主| 发表于 2025-1-2 12:34 来自手机 | 显示全部楼层
LumStp 发表于 2025-1-2 09:50
双面一般就是2Rank了,解释一下
1.DDR4非ECC内存单条64bit,常规的内存PCB布局是单面8颗粒/双面16颗粒
2.消 ...

专用条因为用的服务器拆机颗粒,所以单颗颗粒是4bit的。虽然16g单条的专用条是双面的,但是它实际上还是1rank(64bit对16个4bit)。而常规消费端内存条是8bit颗粒,双面16颗粒的话是64bitx2,也就是2ranks。
 楼主| 发表于 2025-1-2 12:39 来自手机 | 显示全部楼层
wwwyj 发表于 2025-1-2 07:30
测试颗粒不统一 测试方法不严谨 测试结论无意义

解释:

内存毕竟是一个整体而不是颗粒,实际效能要看它对游戏的影响。本次测试中所有内存都压到了尽可能低的小参,并且广泛参考了网上内存体质的分享。常规8bit颗粒的2ranks cjr内存确实很难超频,笔者的这个超频结果已经好于网上许多同颗粒内存了。即使考虑到芯片体质因素,假定2r 4bg的实际性能不弱于1r 8bg,电压上差的0.18v也是实实在在的。
发表于 2025-1-2 12:47 来自手机 | 显示全部楼层
1700接口其实我感受不到单双面的实测fps差距,这个和1151或1200接口有差别。至于aida64跑分这种是另外回事。
发表于 2025-1-2 12:55 | 显示全部楼层
zqintel 发表于 2025-1-2 06:45
一包烟一壶茶,一套小参摸一天
然后被隔壁轰成渣

默认打不过就算了,超频还打不过是自己菜吧
发表于 2025-1-2 13:05 | 显示全部楼层
5800H改用4bg确实有提升 延迟和跑分大概提升5个点
发表于 2025-1-2 13:26 | 显示全部楼层
跑核显时差距更大一些。笔记本同配置比较,12GBx2的核显性能比16GBx2要低10%以上。
发表于 2025-1-2 13:56 | 显示全部楼层
烟与玫瑰 发表于 2025-1-2 12:39
内存毕竟是一个整体而不是颗粒,实际效能要看它对游戏的影响。本次测试中所有内存都压到了尽可能低的小参 ...

没有压时序和超频,都在默认Jedec下我看到2Rank性能是明显好过1Rank的
发表于 2025-1-2 16:37 来自手机 | 显示全部楼层
就是说把手上的16*2出掉,买4个16g的Intel专用条插上效能更好?
发表于 2025-1-2 16:47 来自手机 | 显示全部楼层
kolot 发表于 2025-1-2 16:37
就是说把手上的16*2出掉,买4个16g的Intel专用条插上效能更好?

那你就帮人家清库存了
 楼主| 发表于 2025-1-2 18:29 来自手机 | 显示全部楼层
LumStp 发表于 2025-1-2 13:56
没有压时序和超频,都在默认Jedec下我看到2Rank性能是明显好过1Rank的

但是专用条的bankgroup是不一样的。同为4bg情况下2r比1r多了一倍颗粒,而同为双面共16颗粒情况下1r 8bg的性能比2r 4bg要更高。
 楼主| 发表于 2025-1-2 18:32 来自手机 | 显示全部楼层
momoka 发表于 2025-1-2 12:47
1700接口其实我感受不到单双面的实测fps差距,这个和1151或1200接口有差别。至于aida64跑分这种是另外回事 ...

虽然没有测单面颗粒,但是专用条插两根对比插四根刚好就是1r 8bg和2r 8bg。2r的帧率就是会比1r高很多(虽然根据我的测试主要是颗粒增多而不是rank的影响)。另外朋友有用双面bdie和单面bdie在pubg里测试,双面还是会强一些的。
 楼主| 发表于 2025-1-2 18:37 来自手机 | 显示全部楼层
kolot 发表于 2025-1-2 16:37
就是说把手上的16*2出掉,买4个16g的Intel专用条插上效能更好?

前提是颗粒相同。我这个cjr叠了2r 8bg的buff其实也就摸到吊车尾特挑bdie的屁股。同颗粒情况下颗粒越多性能越强,但颗粒本身更重要一些。如果是三星cdie,镁光早期edie之类的那叠了这个buff也不行。
发表于 2025-1-2 18:42 | 显示全部楼层
刚卖了两根七彩虹16G 3200 C22,打的标是镁光d9tbj
发表于 2025-1-3 09:11 | 显示全部楼层
烟与玫瑰 发表于 2025-1-2 18:29
但是专用条的bankgroup是不一样的。同为4bg情况下2r比1r多了一倍颗粒,而同为双面共16颗粒情况下1r 8bg的 ...

存疑,1Rank*4的布局不会改变X4颗粒依然是4Bank Group的规格(和X8颗粒一样),不是8BG
发表于 2025-1-3 14:27 | 显示全部楼层
烟与玫瑰 发表于 2025-1-2 18:29
但是专用条的bankgroup是不一样的。同为4bg情况下2r比1r多了一倍颗粒,而同为双面共16颗粒情况下1r 8bg的 ...

后面是不是写反了。1R x8  不是8颗?2Rx4 不是32颗?
发表于 2025-1-3 15:14 | 显示全部楼层
笔者也期待起4bit颗粒能早日应用在d5消费端


实际上恐怕是反过来,4bit颗粒要凑满64bit位宽要16个颗粒,封装成本在芯片制造上也不可忽视,PCB设计也复杂很多。而16bit颗粒只需要4个,消费级相比企业级本来利润就低,要进一步降本增效,大趋势反而会是采用16bit颗粒,大容量的内存条可能会大量采用2Rx16共8颗粒
发表于 2025-1-3 17:30 | 显示全部楼层
本帖最后由 KazamiKazuki 于 2025-1-3 17:32 编辑

D4还有8BG的?只知道D4 2BG/4BG、D5 4BG/8BG
发表于 2025-1-3 17:39 | 显示全部楼层
本帖最后由 ghgfhghj 于 2025-1-3 17:44 编辑
momoka 发表于 2025-1-2 12:47
1700接口其实我感受不到单双面的实测fps差距,这个和1151或1200接口有差别。至于aida64跑分这种是另外回事 ...


1700个别游戏还是有,就比如ultra2很擅长跑的那个地平线零之曙光重制版,ddr4双面大概强4%,ddr5基本就是2%以内误差级,完全不如单面高频

am5则是完全没有。。。
 楼主| 发表于 2025-1-5 21:37 来自手机 | 显示全部楼层
gartour 发表于 2025-1-3 14:27
后面是不是写反了。1R x8  不是8颗?2Rx4 不是32颗?

Bank group是每两个颗粒组成一个的。1r 8bg是2*8=16,2r 4bg是2*8=16。
 楼主| 发表于 2025-1-5 21:38 来自手机 | 显示全部楼层
Wurenji 发表于 2025-1-3 15:14
实际上恐怕是反过来,4bit颗粒要凑满64bit位宽要16个颗粒,封装成本在芯片制造上也不可忽视,PCB设计也复 ...

大趋势是这样没错,不过等中后期服务器拆机毕竟便宜。专用条一开始也是小厂搞出来的。
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2025-4-26 16:08 , Processed in 0.014474 second(s), 5 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表