找回密码
 加入我们
搜索
      
查看: 6081|回复: 67

[电脑] 性能功耗体积全优的桌面超算CPU:AMD TR 9980X 9970X测评

[复制链接]
发表于 2025-9-17 22:06 | 显示全部楼层 |阅读模式
_01.jpg
最近我在做一些生物学的计算以及计算化学模拟的时候,遇到了严重的性能不足。我平时会接触到的科学计算其实很多,如果完全排除GPU参与的过程的话,那么对CPU要求很高的一般会涉及到两个方面,一个生物化学中的大分子折叠计算,另一个则是机器学习的CatBoost算法。这两个算法都是非常单纯的CPU应用,而从原理上也很难使用GPU进行加速。
_01a1.png
这些科学计算的时间直接影响到我在工作和科研上的进度,因为这些事情往往是线性的,而最近需求不断提高,以至于这些科学计算成为了我目前工作中的瓶颈。我工作学习的地方其实不是没有计算资源,相反,总共160 +112个CPU节点的计算资源已经称得上是体面了,但是面对我目前的工作负载,还是显得力不从心,只要我一开始工作,机房里那台体积庞大的服务器就像油门踩到底一样开始轰鸣。
所以,为了我的工作体验,不得不请出最新最好的桌面CPU计算平台,也就是AMD最新一代的县城撕裂者 Threadripper 9980X和9970X!
_01a2.png
一、简介
本次测试的是两个9000系的线程撕裂者,TR 9980X 以及9970X,分别是64核128线程以及32核64线程的配置。两颗CPU的包装使用了更显专业的黑色主题,比一般的CPU盒更重更大,因为包装中的CPU体积硕大,缓震材料和附赠的配件也不少
_01b.jpg
_01c.jpg
和TR一直以来的传统一样,这两颗CPU都赠送了水冷扣具和螺丝刀,专门用于TR这个巨大的CPU插槽。另一面则是CPU,使用专门的双层塑料盒保护,同时在下层还有贴纸和说明书
_01d.jpg
_01e.jpg
TR最引人注目的就是硕大的CPU面积,以及在CPU周围的橙色保护框架,这个框架用于安装和拆卸时的定位,是CPU必要的组件
_01f.jpg
_01g.jpg
CPU的正面是标有线程撕裂者的金属顶盖,线程撕裂者目前使用sTR5接口,在大小规格上和TR4或者SP3是基本一致的,需要使用特制的散热器才能实现完全覆盖
_01h.jpg
简单演示一下这个CPU要怎么安装,按照顺序打开CPU的插槽,建议使用附赠的工具。然后再插入CPU,利用框架和底座的滑轨进行定位。最后关上顶盖,按照顺序拧上螺丝。
_01i.jpg
_01j.jpg
_01k.jpg
本次测试使用的主板是华硕的WS TRX50系列的TRX50-SAGE,这块主板属于工作站系列,相比ATX略微超宽但并不是标准的EATX,可以放入兼容EATX的机箱,4条内存槽是为普通线程撕裂者准备的。
_01kf.jpg
_1003518.jpg
主板正面的马甲非常精准地给了供电和芯片组,并且做了主动散热,规模庞大且做工精良,一切都是为了默认就有350W的TR打造。WS TRX50-SAGE有一个特色是双供电系统,可以使用两套相同的电源为主板CPU同时供电,从而提升系统稳定性并且提供惊人的CPU超频能力。(最吓人的难道不是华硕在WS主板上也没有完全放弃超频吗)
_1003528.jpg
_1003531.jpg
_1003534.jpg
_1003537.jpg
主板提供了异常丰富的IO功能,CPU可用88条PCIE,被完全给到PCIE区域,同时提供了3个m.2接口。在背部IO区域,这块主板有高速的TypeC接口和6个10G的USB-A,并且是双有线网卡,最大10G带宽,附带的WIFI模块也是最新的WIFI7。同时音频同时提供数字音频和光纤口,并且提供Bios-flashback和clearcmos的物理按键
_1003543.jpg
_1003548.jpg
理论性能测试
先开机验明正身,9980X的CPUID信息显示,这个CPU使用的是最新的台积电N4p工艺,64核心128线程,并且支持4通道内存(Pro级别的TR支持8通道)。和这CPU一起测试的是芝奇的32Gx4内存,以及华硕的RTX5070Ti显卡,散热使用银欣的定制水冷,电源为华硕的WS 1600W电源,保证使用过程中的稳定。9700X的CPUID信息类似,但是核心规模和各类缓存都少一半,只有32核心,不过仍然超过了目前大核数量最多的普通桌面级9950X3D一倍,也支持4通道内存
_1003548a.png
_1003548b.png
首先烤鸡测试一下让硅脂化开(确信),从统计信息可以看到,这两个CPU在默认情况下都能跑到350W的TDP,虽然看着很吓人,但是简单对比一下目前intel的Ultra9那250W的功耗,再联想一下9980X这个64核心的身板,8倍于285K的大核数量,只需要这一点功耗好像能耗比一下就上来了。而且因为功耗不高,所以使用银欣的360水冷就能稳稳压住,9980X和9970X的温度稳定在了67℃和77℃,即使是最热点最高也没有超过85℃
_1003548bd.png

_1003548bdc.png

下面是多核和单核的理论测试,毕竟是HEDT的CPU,跑分跑起来直接性能爆表,cinebench这种原本上万分就算不错的测试,9980X直接跑出了15w分。Ultra9 285K默认可以跑出4w分,需要250W的功耗,9980X只需要350W就能跑15W,也直接证明了TR的能效比有多吓人。而双精度的实力也达到了接近10TFlops,就算是A100这种服务器级别的显卡,双精度能力也只有9.4TFlops,也就是这颗CPU凭借硬算,直接能硬刚以前的专业级旗舰卡的双精度算力
_1003548bdd.png
在单核性能上,这两颗CPU也是目前接近旗舰级别的。因为这两个CPU都使用了最新的Zen5构架,而且单核boost频率并不差,所以单核表现和9950X已经很接近了。一般服务器CPU多核强单核弱,但是这两颗CPU完全是单核多核都强到爆炸,并且能耗比高得惊人
_1003548bde.png
_1003548bdf.png

在常规的windows生产力应用上,因为使用了4通道内存,并且有不错的单核,实测在LLM推理、图片和视频处理上,这两颗CPU也可以轻松胜任。不过这些都是比较虚无缥缈的
_1003548bg.png
_1003548bgg.png

科学计算对比测试
说到科学计算,大家脑海里可能第一个联想到的就是长相猎奇的科学家在草稿纸上计算一些神秘的数字,然后科学家惊喜地拿着计算结果大喊道:“尤里卡!”。然而实际上科学计算仍然非常依赖软件和硬件的共同优化,即使是现在最为领先的科学计算工具,也不能跳脱出CPU的单核多核性能而遑论速度。目前我用的最多的两个CPU科学计算工具,分别是机器学习中的Catboost模型,以及生物大分子的RNAStructure,他们都非常依赖CPU的上述性能。
_1003548f.png
_1003548g.png
而也如大家所见,实验室中的CPU计算资源里的112线程和开头提到的160线程的计算节点已经被吃得一点不剩了。他们的配置是intel的Xeon Gold 6330和 6248,而且一个是双CPU平台,另一个是4 CPU平台,买来的时候单价都不算低。像6330这种核心和频率稍微高一点的CPU,现在价格仍然不算低,服务器CPU中最金贵的两个东西就是多插槽适配以及高基础频率,所以沾上这两点即使是老Xeon Gold的价格也一直没怎么下来。
_1003548g1a.png
_1003548ga.png
首先测试的是Xeon Gold 6330 x2的平台,4U服务器,56核心112线程,买来的时候被寄予厚望。第一个测试是用于生物大分子二级结构预测的RNAStructure,这个应用每一个线程上只能跑一个序列,所以在序列较少的时候是偏单核的,但是序列较多的时候就会考验多核。我分别测试了50条(单核为主),500条(混合),5000条(多核为主)的性能,这一台服务器的结果如下,明显看到50条和5000条的时间只差了一倍,单核性能限制了服务器的发挥。
_1003548gaa.png
第二个测试的则是Catboost的拟合,使用相同的拟合轮次和随机种子,对一组数据进行拟合,数据量分别是100% 75% 50% 35% 25%。每一轮的时间都有统计,最后统计了花费的总时间,112线程的双6330用了55分钟,还是挺慢的,不过比我本地的办公用垃圾8核CPU还是快很多倍了
_1003548gab.png
_1003548gb.png
下面测试的是Xeon Gold 6248 x2的平台,4U服务器,80核心160线程,已经是相当不错的CPU计算节点了。首先,生物大分子二级结构预测的RNAStructure测试的结果,单核多核性能都比112线程的6330平台稍好一点,这也说明基础频率+核心数量多确实是有用的。而在Catboost的测试里面,速度变快了很多,只花了32min就跑完了全部测试,多核性能的提升带来的结果是是实打实的
_1003548gbc.png
_1003548gbd.png
下面就是TR 9980X和9970X这两个CPU的的测试结果了,我按照相同的方式安装了ubuntu系统以及依赖项
_1003548gd.jpg
首先是9980X的测试结果,和刚才的两个4U机架式服务器相比,9980X的速度简直快到无以复加。首先Catboost的测试,只花了14:50就全部完成,这还不到80核的6248x4的一半,更是不到6330x2的1/3。多核性能已经足够强的时候,瓶颈就主要存在于文件的IO了,此时CPU并不是完全占满的,如果没有瓶颈可能领先会更大。在全部相同的参数下,计算过程和结果也是相同的,全部符合要求。
_1003548gdba.png
而在生物大分子二级结构预测的RNAStructure的测试里面,因为TR那傲人的单核成绩,50序列的结果只花了46s就完成了,换算一下,9980X的单核成绩大概是上面这些老Xeon的三倍!同时我们还能通过多核成绩推断,64c的9980X也有着将近二倍于80c的6248x4的多核能力,只用了一颗CPU就实现了这个性能,实在是太强了
_1003548gdbb.png
而9970X的成绩也颇为傲人,Catboost中也有16min的成绩,明显好于其他的Xeon平台。而生物大分子二级结构预测的RNAStructure也是相近的结果。9970X的单核能力更强,所以50条序列的测试比9980X更快,而多核成绩稍逊,因此5000序列略慢,但是也远远胜于Xeon平台
_1003548gdbc.png
_1003548gdbd.png
下面来看一下成绩汇总吧,经过测试,可以说这些老Xeon不管是单核还是多核的性能,在新的TR面前已经被秒的渣都不剩了。TR的多核比核心数量大于自己的服务器U都还领先不少,多核为主的任务速度可以轻松超过一倍。TR尤其出众的是单核能力,基本是本世代旗舰级别的单核,而又是HEDT的身板,一般的服务器难以望其项背。如此一来,就给TR的应用范围扩宽不少,文可依靠单核速跑小批量实验,武可依靠多核速算大规模任务
_1003548gdbdc.png
_1003548gdbdd.png

测试硬件展示
下面是参测的硬件展示,首先就是两个CPU,TR 9980X和TR9970X。AMD的HEDT一直在更新,在进入DDR5时代之后,TR也更新到了sTR5接口,搭载于TRX50系列主板上
_1003562.jpg
_1003569.jpg
_1003583.jpg
_1003585.jpg
使用的内存是芝奇的6400MHz 32Gx4内存,这一套内存是全新内置时钟发生器的CUDIMM,不需要单独开启XMP或者EXPO,插上主板就是自动的JEDEC标准 6400MHz,很有实力,在计算用的平台上非常仰仗默认高频的稳定性
_1003588.jpg
_1003589.jpg
_1003590.jpg
_1003593.jpg
_1003594.jpg
_1003595.jpg
_1003597.jpg
_1003598.jpg
散热为银欣定制散热,因为冷头较为特殊所以使用了泵排一体的设计。散热效果也是一流,在实际使用中,350W的TR被压到了70度
_1003601.jpg
_1003603.jpg
_1003604.jpg
_1003605.jpg
使用的电源是华硕的Pro Workstation系列 1600W电源,这个电源专门为工作站打造,高功率高效率,并且也是少有的支持两个12VHPWR接口的电源,可以同时给两张显卡供电,完美适配使用5090x2的情况
_1003730.jpg
_1003739.jpg
_1003747.jpg
_1003755.jpg
_1003756.jpg
_1003761.jpg
_1003762a.jpg
测试中使用的显卡是RTX5070Ti华硕的TUF白色款,这张显卡有着TUF的系列外观,不过外壳改为了银白色,成为了目前与白色Astral并列的另一个白色系列显卡。这也是本世代颇具实力的一款非公显卡,散热好噪音小,用起来很舒服
A01.jpg
P1001008.jpg
P1001018.jpg
P1001019.jpg
总结
ThreadRipper线程撕裂者这个名字出来的时候确实有够震撼,一开始就有最大32核的CPU,而同期intel的HEDT (high-end desktop平台)才10核,一下就高下立判。而现在TR已经发展到最大96核心8通道内存,非PRO版本的也有64核心,作为HEDT而言相当成功。
当代的9980X的计算能力更是强到爆炸,拿目前intel的单CPU的服务器计算节点做对比,24年发布的新Xeon 6980P有128大核256线程,结果一看cinebench单核才1500,多核就90000分,全都赶不上9980X的2200分和150000分,何况价格还比9980X贵。而同规格的6761P,也是64c128t,也是350W,25年Q1发布,用上了最新工艺,结果性能一看差点没打过32c64t的9970X。
单纯论性能可能有一种200斤大力士偷袭老同志的感觉,但是TR的优势还体现在体积功耗上。一般的服务器U必须用家用机箱难以装下的4U服务器箱子,刚才提到的6980P已经目前最强的单CPU了,功耗500W,散热器也是直升机一样的4U服务器散热器。而反观TR,可以用常规的EATX机箱,并且可以使用水冷,噪音温度也不高,完全就是桌面级计算机的使用体验,却有着比服务器更强的性能,这便是我将它称为性能功耗体积全优的桌面超算的原因。


感谢大家围观

最2.jpg


评分

参与人数 6邪恶指数 +270 门户文章 +1 收起 理由
zrex + 10 就是NB
ilas + 200
梵谷的左耳 + 20
sunjun5 + 20
神月妍妍 + 20
nApoleon + 1

查看全部评分

 楼主| 发表于 2025-9-21 21:39 | 显示全部楼层
scopolamine 发表于 2025-9-21 20:30
服务器大部分选择的CPU都是主频低核多,所以单核性能差,主频高的CPU核又少,两难。
不过AMD的CPU似乎可以 ...

这就是HEDT存在的意义
发表于 2025-9-21 20:30 | 显示全部楼层
服务器大部分选择的CPU都是主频低核多,所以单核性能差,主频高的CPU核又少,两难。
不过AMD的CPU似乎可以两者兼顾。
 楼主| 发表于 2025-9-21 18:31 | 显示全部楼层
do0wmt1 发表于 2025-9-21 12:39
其实真心可以考虑9005系列的CPU装在台式机工作站上,超微或者技嘉的主板,12通道内存。同样是64核心,9575F ...

这确实是个思路,不过还是JD带票的更方便,现在服务器U和主板得发票才能列入采购登记固定资产,得找有保修的代理商,得提招投标,JD就不存在这些问题了
发表于 2025-9-21 12:39 | 显示全部楼层
其实真心可以考虑9005系列的CPU装在台式机工作站上,超微或者技嘉的主板,12通道内存。同样是64核心,9575F可以跑400W,性能高于不超频的9980X,更多核心的话,9755和9965性能都高于线程撕裂者,500W,而且便宜很多,还能组双路。
 楼主| 发表于 2025-9-21 09:49 | 显示全部楼层
hjk123 发表于 2025-9-21 09:26
感谢分享,看到这个四通道羡慕,我手上的双通道开xmp还行,四通道就默频了,而且很不稳定,时常开机失败 ...

这个四通道是jedec6400,默认就是这么高频率,不需要开xmp或者expo,属于最新科技了哈哈
发表于 2025-9-21 09:26 | 显示全部楼层
感谢分享,看到这个四通道羡慕,我手上的双通道开xmp还行,四通道就默频了,而且很不稳定,时常开机失败
发表于 2025-9-20 11:45 | 显示全部楼层
AMD Yes!
 楼主| 发表于 2025-9-20 09:51 | 显示全部楼层
absolutelyman 发表于 2025-9-19 23:27
就喜欢这种专业性质的测评应用, 我是做电磁和热仿真的,准备自己家里搞一台 ...

感谢支持,有限元用这个算也挺爽的
 楼主| 发表于 2025-9-20 09:50 | 显示全部楼层
炼無休日 发表于 2025-9-20 07:49
传说中的工作站吗?

是的,非常WS
发表于 2025-9-20 07:49 | 显示全部楼层
传说中的工作站吗?
发表于 2025-9-20 00:00 来自手机 | 显示全部楼层
这个厉害了。
发表于 2025-9-19 23:27 | 显示全部楼层
就喜欢这种专业性质的测评应用, 我是做电磁和热仿真的,准备自己家里搞一台
 楼主| 发表于 2025-9-19 20:58 | 显示全部楼层
lusia999 发表于 2025-9-19 17:32
哈哈哈哈,扫雷纯属玩笑,不过这个机器做视频处理是不是会特别强?记得以前看过一个帖子(还是新闻记不清 ...

用CPU压制视频肯定会快不少的,平时简单的编辑有N卡i卡速度也挺快
发表于 2025-9-19 17:32 | 显示全部楼层
gwha2 发表于 2025-9-19 16:33
扫雷还是得靠人脑

哈哈哈哈,扫雷纯属玩笑,不过这个机器做视频处理是不是会特别强?记得以前看过一个帖子(还是新闻记不清了),有人花了10w+的费用,搭了台用TR的U的机器,说视频处理速度一下子从10几个小时变成1-2小时了,说觉得这钱花的物有所值
 楼主| 发表于 2025-9-19 16:33 | 显示全部楼层
lusia999 发表于 2025-9-19 13:22
好漂亮,工业美学
这机器玩扫雷一定超级快吧

扫雷还是得靠人脑
发表于 2025-9-19 13:22 | 显示全部楼层
好漂亮,工业美学
这机器玩扫雷一定超级快吧
 楼主| 发表于 2025-9-19 10:47 | 显示全部楼层
chrootCHH 发表于 2025-9-19 06:04
请问楼主为何说catboost很难用GPU加速?我不了解这个软件但是看到官方是有CUDA支持的。文档里说因为GPU做加 ...

我下来再试试吧,catboost的gpu版本在使用的时候可能是用的openCL,我实际体验效率是没有CPU快的,而且文件IO需要多走一次pcie,大文件就更慢了
 楼主| 发表于 2025-9-19 10:31 | 显示全部楼层
ninepiece 发表于 2025-9-18 22:07
核多就是爽,内存很漂亮。

有一种朴素的强大感
 楼主| 发表于 2025-9-19 10:31 | 显示全部楼层
vistb 发表于 2025-9-18 18:16
上高频的双路epyc是不是可以更强,哈哈哈!另外,换傲腾的话会不会提升io水平?还是用企业级pcie gen5的ssd ...

双路epic还是没有TR的单核这么强,TR这个甚至是可以开pbo和超频的。至于IO,我觉得pcie ssd可能更适合这个,因为通道够多,速度也足够
发表于 2025-9-19 06:04 | 显示全部楼层
请问楼主为何说catboost很难用GPU加速?我不了解这个软件但是看到官方是有CUDA支持的。文档里说因为GPU做加法的顺序无法预测所以训练结果不是deterministic的,就只是因为这个吗?
发表于 2025-9-18 23:29 来自手机 | 显示全部楼层
好强大的性能
发表于 2025-9-18 22:07 | 显示全部楼层
核多就是爽,内存很漂亮。
发表于 2025-9-18 21:22 | 显示全部楼层
强,壕,以后有大项目也搞一搞
发表于 2025-9-18 20:49 | 显示全部楼层
大受震撼大开眼界啊,赞一个:)
楼主能否补充一下CPU-Z的跑分,比较好奇:)
发表于 2025-9-18 18:16 | 显示全部楼层
上高频的双路epyc是不是可以更强,哈哈哈!另外,换傲腾的话会不会提升io水平?还是用企业级pcie gen5的ssd就可以提升io。
发表于 2025-9-18 18:05 | 显示全部楼层
就是牛逼。。。。我们这种用不上的看看就羡慕。。。
 楼主| 发表于 2025-9-18 17:35 | 显示全部楼层
vethenc 发表于 2025-9-18 15:45
大为震撼,这是什么桌面超跑

桌面航母,64搭载量!all out attack!
 楼主| 发表于 2025-9-18 17:35 | 显示全部楼层
fu2000lin 发表于 2025-9-18 15:49
有一点不解的是为何没选9000WX系列的CPU,毕竟官网介绍WX才是工作站用的U(9000X系列也是 )。 ...

96C和64C价格差挺多,96C的wx的8通道内存确实也用不上,加上主板更贵,所以还是买了常规TR。64C实力也是不容小觑的,我感觉目前够用
 楼主| 发表于 2025-9-18 17:33 | 显示全部楼层
一笑生花 发表于 2025-9-18 16:50
想了解下满载时噪音如何

很安静,银欣这个水冷就是常规泵排一体的散热器,350W的TDP跑满和一般ATX机箱里面的水冷噪音是一样的,可以说是基本无声了
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2025-9-22 06:20 , Processed in 0.017295 second(s), 9 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表