2.9▐ 压缩解压缩
2.9.1▐ 7-Zip Compression 22.01
这是对 7-Zip 压缩/解压缩及其集成基准功能的测试
▲
单路1P:
Xeon w9-3495X@353978 MIPS@269179 MIPS
Xeon Platinum 8490H@378741 MIPS@291248 MIPS
EPYC 9554@545728 MIPS@523531 MIPS
单路EPYC 9554平均测试数据量更大,性能更好。
2.10.1▐ LeelaChessZero
▲
单路1P:
Xeon w9-3495X@10182 Nodes/Seconds
Xeon Platinum 8490H@10513 Nodes/Seconds
EPYC 9554@8996 Nodes/Seconds
但凡涉及神经网络的计算,Intel总是会让你看到奇迹。
2.10.2▐ asmFish 2018-07-23
asmFish 是用 Assembly 编写的高级国际象棋基准测试。
▲
单路1P:
Xeon w9-3495X@127328259 Nodes/Seconds
Xeon Platinum 8490H@130447170 Nodes/Seconds
EPYC 9554@209533141 Nodes/Seconds
▲所有测试结束,系统统计了以下平均CPU功耗。
前面大家看到了太多Xeon w9-3495X默认状态下输给Xeon Platinum 8490H和EPYC 9554的测试了,不用急马上可以翻身。因为Ubutu没有适用的超频软件,所以我们要超频必须对BIOS进行设置调整,我推荐两种,我命名为OC SOP1和OC SOP2。
2.12.1▐ OC SOP1
OC SOP1是降压超频的操作,直接将Core Voltage降低0.1-0.15V,因为此时CPU的TDP没解锁,所以理论上降压后性能会得到提升。
▲
AdvancedOverclocking feature
ProcessorCore Voltage Offset = 100-150
ProcessorOffset Prefix = [-]
图中我是直接降压0.15V
2.12.2▐ OC SOP2
OC SOP2是解锁超频的操作,解除功耗锁,解除电流锁
▲
AdvancedCPU ConfigurationAdvanced Power Management Configuration
Package Current ConfigCurrent Limit Override = Enabled
▲
Package Current ConfigCurrent Limitation = 1FFF
Current Limitation:0表示 Auto, 以 Xeon w9-3495X 为例 , Auto 值為 1130(16进制) = 550A。而设置为1FFF(16进制) = 1023.875A。
▲
SOCKET RAPL ConfigPL1 Power Limit = 4095
PL1 Time Window = 448
SOCKET RAPL ConfigPL2 Power Limit = 4095
PL2 Time Window = 0.438
PL1 Power Limit :0表示 Auto, 为CPU 的 Max.TDP,以Xeon w9-3495X为例 , Auto 值为350.
PL2 Power Limit:0表示 Auto, 为CPU的Boost.TDP,是PL1的1.2 倍 , 以Xeon w9-3495X为例 , Auto 值为420.
2.12.3▐ 测试
以上两种都直接通过BIOS设置,无论Win11还是Ubuntu都可以直接使用,稳定高效。
其实我非常喜欢EPYC 9554,但是它的性能是固化的,而Xeon w9-3495X性能是可以通过适度OC提升的,我借用一个Ubuntu下的NAMD 2.14的测试来说明问题,为什么选择NAMD 2.14?第一是这个测试非常耗电,容易跑到满载以上,第二是这个空气动力学计算项目对intel没有任何商业优化。
▲无论是OC SOP1的降压还是OC SOP2的解锁,都可以轻松超越EPYC 9554和Xeon Platinum 8490H。OC SOP2的性能略高,但是会增加100W左右的功耗。
NAMD 2.14:
days/ns < Lower Is Better
Xeon w9-3495X ...................... 0.30016 |=====================
Xeon Platinum 8490H ...........0.29076 |====================
EPYC 9554 .................................0.28101 |====================
Xeon w9-3495X OC SOP1 .. 0.26260 |===================
Xeon w9-3495X OC SOP2 .. 0.25761 |==================
CPU Power Consumption Monitor
Watts < Lower Is Better
Xeon w9-3495X OC SOP2 ......MIN: 44 AVG: 403 MAX: 527
Xeon w9-3495X .........................MIN: 86 AVG: 304 MAX: 399
Xeon w9-3495X OC SOP1 .....MIN: 55 AVG: 299 MAX: 381
Xeon Platinum 8490H ............MIN: 82 AVG: 298 MAX: 376
EPYC 9554 ..................................MIN: 23 AVG: 259 MAX: 328
CPU Temperature Monitor
Celsius < Lower Is Better
Xeon w9-3495X OC SOP2 . MIN: 23.0 AVG: 38.5 MAX: 45.0
Xeon w9-3495X OC SOP1 . MIN: 24.0 AVG: 33.0 MAX: 36.0
▲我把有价值的信息汇总如上,各位自行判定。性能分析和功耗温度一目了然。首选OC SOP1不解锁功耗,直接降压超频,优点是功耗不会增加,缺点是-0.10V还是0.15V需要自行摸索,次选OC SOP2直接解锁功耗墙,电流开到1FFF最大,不动主频直接使用,缺点是待机和满载功耗都会增加,温度也会上升。你需要更强大的AIO散热以及更高瓦数的电源,总体使用成本会增加。
3▐ Windows 11 22H2 X64 Workstation
3.1▐ 刷新BIOS
最新的BIOS版本是1.1a,习惯Windows刷新BIOS的用户可以关注SuperMicro出品的SuperDoctor5。
▲第一步上传BIOS
▲第二步刷新BIOS
▲第三步刷新完毕重启即可
▲下面的测试会涉及到一些BIOS的截图操作,本来对于SuperMicro这种AMI BIOS而言截图十分困难,但是借助于SuperMicro BMC的IPMI系统可以方便的对BIOS进行远程截图操作。
▲BIOS启动界面
▲主板BIOS已经刷新为1.1a版本,发布时间为2023年4月25日
▲对于这颗CPU而言,请在使用时将WINDOWS电源模式设置为卓越性能,否则会有间歇性卡顿情况出现。
为了测试的公正性,本次选用的测试套件包含在BENCHMATE 10.12.2内部,可以反馈即时的频率和TDP功耗。
Windows 11 22H2 X64 Workstation即使是最新的Windows在执行CINEBENCH R23 X64的时候也无法跑满全部核心,所以在测试之前我们要进行如下设置保证56核心能够全速运行。
▲使用管理员权限打开Windows PowerShell,输入以下代码
- reg add "HKEY_LOCAL_MACHINESYSTEMCurrentControlSetControlNUMA" /v SplitLargeNodes /t REG_DWORD /d 1
复制代码3.3.1▐ 默认性能
SuperMicro X13SWA-TF默认状态下是不解锁CPU TDP限制的,那么这颗CPU依然被锁在Base TDP=350W,Turbo TDP=420W。
▲首先在默认状态下,R23得分61348,TDP 369W,CPU最高温度46度。
3.3.2▐ OC SOP1
▲在降压0.15V超频状态下,R23得分7**,TDP 361W,CPU最高温度45度。其实这个状态是比较舒服的一个临界点,功耗温度性能得到一个平衡,适合长期使用。
3.3.3▐ OC SOP2
▲在解锁超频状态下,R23得分72261,TDP 411W,CPU最高温度45度。功耗比OC SOP1解锁有提升,这个状态也比较稳定适合长期使用。下面我们来打一下这块主板的重度超频。
3.3.4▐ 重度超频
▲在OC SOP2的BIOS调试基础上,直接进入Intel XTU调试
Voltage Offset = -0.175V
Performance Active-Core Tuning/47 to 56 = 41
点击Apply测试,最终获得R23 99776的成绩,TDP 715W,CPU最高温度59度。这是全核4.1GHz的成绩。
4.1▐ 关于Ubuntu下的测试
首先出于对真理的探索和对测试者的尊重,我保持了CPU的默认设置进行对比测试,主要是想探知其真实的性能。一开始就直接超频对其他CPU不公平。
4.1.1▐ Xeon w9-3495X和Xeon Platinum 8490H
把条件设定在单路1P默认性能范畴:
性能上:Xeon w9-3495X可以理解成Xeon Platinum 8490H的93%~97%,超频后轻松秒。
功耗上:Xeon w9-3495X可以理解成Xeon Platinum 8490H的100%~105%
言尽于此!
4.1.2▐ Xeon w9-3495X 只有一个DSA加速器,影响使用体验么?
w9-3495X只有1个DSA加速器,还缺少另外的3个加速器,但目前庞大的测试数据说明Xeon w9-3495X可以理解成加速器满血版Xeon Platinum 8490H的93%~97%性能。包括一些深度学习的测试也充分说明了问题。
4.2▐ 关于Windows下的测试
4.2.1▐ 手动超频
即使是最新发布的1.1a BIOS,我发现Intel的原味设置还是会有问题,比如核心频率的BIOS设置还是乱七八糟的不生效,所以如果要动主频,尽量使用XTU会比较简单。
4.2.2▐ 游戏性能
如果需要游戏性能,可以直接购买一颗Core i9 13900K或者Ryzen 9 7950X,游戏性能会远超Xeon w9-3495X和Xeon Platinum 8490H。
4.3▐ 电源模式
Ubuntu请设置为性能模式,Windows请设置为卓越性能,设置后日常功耗会增加,但是丝般顺滑。不设置会日常卡顿。
4.4▐ Xeon w9-3495X在X13SWA-TF上的使用感受
某些主板会偷偷动一下默认电压,但是X13SWA-TF没有,所以默认性能是正常的,只有某些板的设置激进了,默认性能同时默认功耗和温度也会降低,正常的OC使用请参考我上面的两点建议,会迅速让你找回性能雄起。这颗CPU的OC媒体宣传感觉纯属误导,OC只是一个很小的卖点,而且某些OC评测已经放弃了使用体验,追求昙花一现。这颗CPU的亮点是在Intel oneDNN和oneAPI框架下的深度学习性能优化,提升相当大。X13SWA-TF是一块中轨中距的板,它的亮点是唯一的16条DIMM主板,其PCIe插槽的设计可以同时容纳四张涡轮双槽显卡,槽点就是PCH的U.2使用了PCIe3.0x4而不是主流的PCIe4.0x4,供电部分的设计我觉得可以,因为这块板是为了稳定的输出性能而设计,不是为了拿超频冠军而设计,产品定位问题,毕竟它只卖1000美金以内的价格而已。ADATA的DDR5 ECC RDIMM内存很稳定,ABEE的SPR360效能真的出乎我的意料,Coolermaster的HAF700和CoolerMaster MWE GOLD V2 1250提供了超强的EATX主板兼容性以及稳定的供电输出,特别是HAF700,我本来很想购买SilverStone RM44 4U Rack配合X13SWA-TF上四张RTX 4090涡轮,后来在HAF700上一试,顿时觉得冷却和安静才是王道。
参考
TIP :本次使用 Supermicro X13SWA-TF 重点测试了Xeon w9-3495X 在Server方面的性能,对比侧重于和Xeon Platinum 8490H以及EPYC 9554对比,下次想选择ASUS Pro WS W790-SAGE SE 和 ASRock W790 WS 测试一下Workstation方面的性能,着重对比AMD Ryzen Threadripper PRO 5995WX的性能差异,以及OC后的表现,重点在POWER和BOOST,所以下一篇我们来在这两块主板中选择一块做专业性能测试,在5月底之前发布,先看哪一张主板我比较容易拿到吧。因为这两片主板对电源的要求比较高,所以下篇我会选择高瓦数的电源比如Seasonic TX-1600来进行Benchmark。感谢观看,再见!