找回密码
 加入我们
搜索
      
查看: 1499|回复: 17

[CPU] Linux 6.18 的"Sheaves" 缓存层将给 AMD 多 CCD 芯片带来巨大性能提升

[复制链接]
发表于 2025-9-16 14:45 | 显示全部楼层 |阅读模式
https://www.phoronix.com/news/Linux-Sheaves-AMD-Performance

"Sheaves"是一个可选的、基于每CPU数组的缓存层,用于SLUB内核分配器,预计将在Linux 6.18版本中推出。

谷歌工程师Sudarsan Mahendran发布的基准测试显示,Sheaves代码对大型AMD系统产生了巨大的性能提升。

主要优势:

- 改善了Linux在处理CPU缓存调度方面的不足,特别是L2和L3缓存的调度问题
- 对于拥有多个CCD(Core Complex Die)的AMD系统尤其有效
- 可能改善游戏和高性能计算在双CCD系统(如7950X)上的表现,避免任务在不同CCD之间频繁切换

这项技术有望对AMD EPYC服务器和消费级多CCD处理器带来显著的性能改进,特别是在处理缓存敏感的工作负载时。一旦这些补丁进入主线内核(预计在Linux 6.18),将会有更多硬件平台的基准测试来验证性能提升。
发表于 2025-9-16 14:53 | 显示全部楼层
现在这个大环境下还愿意优化cpu代码实属不易
发表于 2025-9-16 15:13 | 显示全部楼层
赫敏 发表于 2025-9-16 14:53
现在这个大环境下还愿意优化cpu代码实属不易


愿意优化 cpu 代码的, 之前环境现在环境都是那么多人; 现在的情况是是个人都能写程序了
 楼主| 发表于 2025-9-16 15:16 | 显示全部楼层
xy. 发表于 2025-9-16 15:13
愿意优化 cpu 代码的, 之前环境现在环境都是那么多人; 现在的情况是是个人都能写程序了 ...

LLM 写写应用层代码差不多了,写底层代码还要实际测试的话不是是个人都行的
发表于 2025-9-16 15:16 | 显示全部楼层
赫敏 发表于 2025-9-16 14:53
现在这个大环境下还愿意优化cpu代码实属不易


也可能是AMD自己的内核工程师提交的补丁

Written by Michael Larabel in AMD
发表于 2025-9-16 15:18 | 显示全部楼层
Xerxes2 发表于 2025-9-16 15:16
LLM 写写应用层代码差不多了,写底层代码还要实际测试的话不是是个人都行的 ...

当然. 
发表于 2025-9-16 15:19 | 显示全部楼层
赫敏 发表于 2025-9-16 14:53
现在这个大环境下还愿意优化cpu代码实属不易

这个估计主要给服务器准备的,顺道下放给民用,所以动力十足。
发表于 2025-9-16 15:20 来自手机 | 显示全部楼层
希望基于linux的掌机os们能跟进呀
发表于 2025-9-16 16:18 来自手机 | 显示全部楼层
tim6252 发表于 2025-9-16 07:20
希望基于linux的掌机os们能跟进呀

大头在steam deck 你说它几个ccd
发表于 2025-9-16 16:19 | 显示全部楼层
nlnjnj 发表于 2025-9-16 02:16
也可能是AMD自己的内核工程师提交的补丁

Written by Michael Larabel in AMD

这只是网站标签,东西是SUSE做的
发表于 2025-9-16 16:33 | 显示全部楼层
对amd友好,对牙膏不会是倒吸吧
发表于 2025-9-16 18:34 来自手机 | 显示全部楼层
YsHaNg 发表于 2025-9-16 16:18
大头在steam deck 你说它几个ccd

无所谓,我现在用的BazziteOS,它面向的设备多了去了,甚至包括台式机
发表于 2025-9-16 18:45 | 显示全部楼层
对服务器更有用
发表于 2025-9-16 19:08 | 显示全部楼层
除了7950X,还有哪些支持啊?
发表于 2025-9-16 19:47 | 显示全部楼层
keshl 发表于 2025-9-16 19:08
除了7950X,还有哪些支持啊?

多CCX的都吃吧。
发表于 2025-9-16 19:50 | 显示全部楼层
iooo 发表于 2025-9-16 16:33
对amd友好,对牙膏不会是倒吸吧

牙膏也是大三缓了。。服务器五代开始就是以前3倍起
发表于 2025-9-16 22:09 | 显示全部楼层
压力给到窗户了,看着办吧
发表于 2025-9-16 22:20 | 显示全部楼层
momo77989724 发表于 2025-9-16 19:50
牙膏也是大三缓了。。服务器五代开始就是以前3倍起


至少这个没啥用
Sudarsan Mahendran commented on the mailing list:
"I ported this patch series on top of v6.17 and ran some benchmarks: will-it-scale, hackbench, redis, unixbench and kernbench. I ran the benchmarks on Intel Granite Rapids (480 cores), AMD Turin (512 cores) and ARM (80 cores)

Summary of the results:

- Significant change (meaning >10% difference between base and experiment) on will-it-scale tests in AMD.
- No significant change on other benchmarks ran."

严谨一点的解读是,三家都测了,只有AMD出现10%以上提升
结合后文,提升是
Going over his benchmarks on that LKML thread were exciting when seeing "+28.58%" mean improvements to get started, but also some 13~20% regressions... But when getting to the higher process counts for these scalability benchmarks was when it was getting really wild with +70.59%, +126.89%, +112.89%, and other massive wins. See all of the Google engineer's data in this thread.
最大126.89%
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2025-9-17 02:51 , Processed in 0.009834 second(s), 4 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表