avx512的疑问
现在那些应用能受益avx512,之前我只知道ps3模拟器avx512能大幅提升性能,另外avx512功耗很高,在功耗墙的限制下频率会降低多少,那么avx512带来的综合提升有多少呢? 就我们用的科学计算程序(算是对速度最敏感的一类应用了吧),大部分还都没用到AVX512,小部分上了AVX512之后速度略微变快发热暴涨,真正能把AVX512优化明白的凤毛麟角所以说结论就是如果你不知道你的使用场景有没有提升,那就是没提升 综合提升很难说,关键看多少应用能支持到avx512。但科学计算上,能支持avx512几乎是100%的IPC提升,就算频率比原来缩个20%,提升也依然可观。 有些3d渲染器会调用一部分这个 本帖最后由 momoka 于 2024-8-15 23:35 编辑
140w功耗墙,高频curve负压40,max频率curve负压30的,跑r23可以5.4左右,r24甚至经常彪5.5。但是换成烤fpu,会降4.6-4.7G,电压仅1v出头,应该是迫于avx512的带来的压力。
补充:
我定频定压试了下,1.3v只能跑几秒5.4G的fpu,功耗170多,即使1.2v 5.2G也要150w。如果关闭avx512,那么可以大概1.225v跑5.5G fpu,秒变“雕”(然后发现其他测试都跑不过。。。。),差距还是非常大。但是avx512的频率比锁定功耗时候好很多。 momoka 发表于 2024-8-15 18:47
140w功耗墙,高频curve负压40,max频率curve负压30的,跑r23可以5.4左右,r24甚至经常彪5.5。但是换成烤fpu ...
全核5.4G的R23能摸47000? gihu 发表于 2024-8-15 19:12
全核5.4G的R23能摸47000?
只有9700x,5.4确实有23500以上 momoka 发表于 2024-8-15 19:16
只有9700x,5.4确实有23500以上
挖掘架构潜力,非摸摸卡莫属[狂笑] llama.cpp可以使用AVX512的,CPU推理写7B 13B模型,速度还尚可 gihu 发表于 2024-8-15 19:12
全核5.4G的R23能摸47000?
锁了全核测试了5.4是24200 自由之翼 发表于 2024-8-15 21:56
锁了全核测试了5.4是24200
比想象的高啊[偷笑] gihu 发表于 2024-8-15 19:12
全核5.4G的R23能摸47000?
全核5.4理论上应该48600左右 我9700x全核5.4是24300左右 gihu 发表于 2024-8-15 22:01
比想象的高啊
5.5的跑分,可惜fpu跑不了5分钟就红了[生病] 别说512了,就连256能用满的都不算多 archyfilafs 发表于 2024-8-15 22:37
全核5.4理论上应该48600左右 我9700x全核5.4是24300左右
按照隔壁牙膏6.2G默认就4 500瓦锁肛的玩法,9950xR23应该能跑5万分才对 inflation 发表于 2024-8-15 23:11
别说512了,就连256能用满的都不算多
不至于,AIDA64那几个CPU跑分,11900K 3.5G吊打12600K 5.2G。 llamacpp用avx512能1.37倍性能,不过内存带宽已经受限了,6核(两个ccd各开3核)和28线程性能没区别。 darkness66201 发表于 2024-8-15 23:13
按照隔壁牙膏6.2G默认就4 500瓦锁肛的玩法,9950xR23应该能跑5万分才对
是这么个道理 ,压缩机,特挑大雕都搞上。干冒烟跑个分,然后美其名曰基本盘[傻笑]缩不缩那是以后了,反正赢特尔了 一个周期能干原来两个周期的活,功耗增高百分之二十,频率降低百分之二十,实际能提升百分之五十+
https://www.phoronix.com/review/amd-zen5-avx-512-9950x Neo_Granzon 发表于 2024-8-16 05:12
不至于,AIDA64那几个CPU跑分,11900K 3.5G吊打12600K 5.2G。
实际应用里面没有都扯淡
页:
[1]