squll009 发表于 2024-8-15 18:34

avx512的疑问

现在那些应用能受益avx512,之前我只知道ps3模拟器avx512能大幅提升性能,另外avx512功耗很高,在功耗墙的限制下频率会降低多少,那么avx512带来的综合提升有多少呢?

__|__ 发表于 2024-8-15 18:40

就我们用的科学计算程序(算是对速度最敏感的一类应用了吧),大部分还都没用到AVX512,小部分上了AVX512之后速度略微变快发热暴涨,真正能把AVX512优化明白的凤毛麟角

所以说结论就是如果你不知道你的使用场景有没有提升,那就是没提升

gihu 发表于 2024-8-15 18:41

综合提升很难说,关键看多少应用能支持到avx512。但科学计算上,能支持avx512几乎是100%的IPC提升,就算频率比原来缩个20%,提升也依然可观。

tim6252 发表于 2024-8-15 18:43

有些3d渲染器会调用一部分这个

momoka 发表于 2024-8-15 18:47

本帖最后由 momoka 于 2024-8-15 23:35 编辑

140w功耗墙,高频curve负压40,max频率curve负压30的,跑r23可以5.4左右,r24甚至经常彪5.5。但是换成烤fpu,会降4.6-4.7G,电压仅1v出头,应该是迫于avx512的带来的压力。


补充:
我定频定压试了下,1.3v只能跑几秒5.4G的fpu,功耗170多,即使1.2v 5.2G也要150w。如果关闭avx512,那么可以大概1.225v跑5.5G fpu,秒变“雕”(然后发现其他测试都跑不过。。。。),差距还是非常大。但是avx512的频率比锁定功耗时候好很多。

gihu 发表于 2024-8-15 19:12

momoka 发表于 2024-8-15 18:47
140w功耗墙,高频curve负压40,max频率curve负压30的,跑r23可以5.4左右,r24甚至经常彪5.5。但是换成烤fpu ...

全核5.4G的R23能摸47000?

momoka 发表于 2024-8-15 19:16

gihu 发表于 2024-8-15 19:12
全核5.4G的R23能摸47000?

只有9700x,5.4确实有23500以上

gihu 发表于 2024-8-15 19:41

momoka 发表于 2024-8-15 19:16
只有9700x,5.4确实有23500以上

挖掘架构潜力,非摸摸卡莫属[狂笑]

Nitromethane 发表于 2024-8-15 21:23

llama.cpp可以使用AVX512的,CPU推理写7B 13B模型,速度还尚可

自由之翼 发表于 2024-8-15 21:56

gihu 发表于 2024-8-15 19:12
全核5.4G的R23能摸47000?

锁了全核测试了5.4是24200

gihu 发表于 2024-8-15 22:01

自由之翼 发表于 2024-8-15 21:56
锁了全核测试了5.4是24200

比想象的高啊[偷笑]

archyfilafs 发表于 2024-8-15 22:37

gihu 发表于 2024-8-15 19:12
全核5.4G的R23能摸47000?

全核5.4理论上应该48600左右 我9700x全核5.4是24300左右

自由之翼 发表于 2024-8-15 23:06

gihu 发表于 2024-8-15 22:01
比想象的高啊

5.5的跑分,可惜fpu跑不了5分钟就红了[生病]

inflation 发表于 2024-8-15 23:11

别说512了,就连256能用满的都不算多

darkness66201 发表于 2024-8-15 23:13

archyfilafs 发表于 2024-8-15 22:37
全核5.4理论上应该48600左右 我9700x全核5.4是24300左右

按照隔壁牙膏6.2G默认就4 500瓦锁肛的玩法,9950xR23应该能跑5万分才对

Neo_Granzon 发表于 2024-8-16 05:12

inflation 发表于 2024-8-15 23:11
别说512了,就连256能用满的都不算多

不至于,AIDA64那几个CPU跑分,11900K 3.5G吊打12600K 5.2G。

自挂东南枝 发表于 2024-8-16 07:45

llamacpp用avx512能1.37倍性能,不过内存带宽已经受限了,6核(两个ccd各开3核)和28线程性能没区别。

archyfilafs 发表于 2024-8-16 09:59

darkness66201 发表于 2024-8-15 23:13
按照隔壁牙膏6.2G默认就4 500瓦锁肛的玩法,9950xR23应该能跑5万分才对

是这么个道理 ,压缩机,特挑大雕都搞上。干冒烟跑个分,然后美其名曰基本盘[傻笑]缩不缩那是以后了,反正赢特尔了

dcl2009 发表于 2024-8-16 10:17

一个周期能干原来两个周期的活,功耗增高百分之二十,频率降低百分之二十,实际能提升百分之五十+

OstCollector 发表于 2024-8-16 10:25

https://www.phoronix.com/review/amd-zen5-avx-512-9950x

inflation 发表于 2024-8-16 11:09

Neo_Granzon 发表于 2024-8-16 05:12
不至于,AIDA64那几个CPU跑分,11900K 3.5G吊打12600K 5.2G。

实际应用里面没有都扯淡
页: [1]
查看完整版本: avx512的疑问