找回密码
 加入我们
搜索
      
查看: 4711|回复: 20

[CPU] avx512的疑问

[复制链接]
发表于 2024-8-15 18:34 | 显示全部楼层 |阅读模式
现在那些应用能受益avx512,之前我只知道ps3模拟器avx512能大幅提升性能,另外avx512功耗很高,在功耗墙的限制下频率会降低多少,那么avx512带来的综合提升有多少呢?
发表于 2024-8-15 18:40 | 显示全部楼层
就我们用的科学计算程序(算是对速度最敏感的一类应用了吧),大部分还都没用到AVX512,小部分上了AVX512之后速度略微变快发热暴涨,真正能把AVX512优化明白的凤毛麟角

所以说结论就是如果你不知道你的使用场景有没有提升,那就是没提升
发表于 2024-8-15 18:41 | 显示全部楼层
综合提升很难说,关键看多少应用能支持到avx512。但科学计算上,能支持avx512几乎是100%的IPC提升,就算频率比原来缩个20%,提升也依然可观。
发表于 2024-8-15 18:43 来自手机 | 显示全部楼层
有些3d渲染器会调用一部分这个
发表于 2024-8-15 18:47 来自手机 | 显示全部楼层
本帖最后由 momoka 于 2024-8-15 23:35 编辑

140w功耗墙,高频curve负压40,max频率curve负压30的,跑r23可以5.4左右,r24甚至经常彪5.5。但是换成烤fpu,会降4.6-4.7G,电压仅1v出头,应该是迫于avx512的带来的压力。


补充:
我定频定压试了下,1.3v只能跑几秒5.4G的fpu,功耗170多,即使1.2v 5.2G也要150w。如果关闭avx512,那么可以大概1.225v跑5.5G fpu,秒变“雕”(然后发现其他测试都跑不过。。。。),差距还是非常大。但是avx512的频率比锁定功耗时候好很多。
发表于 2024-8-15 19:12 | 显示全部楼层
momoka 发表于 2024-8-15 18:47
140w功耗墙,高频curve负压40,max频率curve负压30的,跑r23可以5.4左右,r24甚至经常彪5.5。但是换成烤fpu ...

全核5.4G的R23能摸47000?
发表于 2024-8-15 19:16 来自手机 | 显示全部楼层
gihu 发表于 2024-8-15 19:12
全核5.4G的R23能摸47000?

只有9700x,5.4确实有23500以上
发表于 2024-8-15 19:41 | 显示全部楼层
momoka 发表于 2024-8-15 19:16
只有9700x,5.4确实有23500以上

挖掘架构潜力,非摸摸卡莫属
发表于 2024-8-15 21:23 | 显示全部楼层
llama.cpp可以使用AVX512的,CPU推理写7B 13B模型,速度还尚可
发表于 2024-8-15 21:56 | 显示全部楼层
gihu 发表于 2024-8-15 19:12
全核5.4G的R23能摸47000?

锁了全核测试了5.4是24200
发表于 2024-8-15 22:01 | 显示全部楼层
自由之翼 发表于 2024-8-15 21:56
锁了全核测试了5.4是24200

比想象的高啊
发表于 2024-8-15 22:37 | 显示全部楼层
gihu 发表于 2024-8-15 19:12
全核5.4G的R23能摸47000?

全核5.4理论上应该48600左右 我9700x全核5.4是24300左右
发表于 2024-8-15 23:06 来自手机 | 显示全部楼层
gihu 发表于 2024-8-15 22:01
比想象的高啊

5.5的跑分,可惜fpu跑不了5分钟就红了
e4496013083cc2560618ac6f7ff6dfca.jpeg
发表于 2024-8-15 23:11 | 显示全部楼层
别说512了,就连256能用满的都不算多
发表于 2024-8-15 23:13 来自手机 | 显示全部楼层
archyfilafs 发表于 2024-8-15 22:37
全核5.4理论上应该48600左右 我9700x全核5.4是24300左右

按照隔壁牙膏6.2G默认就4 500瓦锁肛的玩法,9950xR23应该能跑5万分才对
发表于 2024-8-16 05:12 | 显示全部楼层
inflation 发表于 2024-8-15 23:11
别说512了,就连256能用满的都不算多

不至于,AIDA64那几个CPU跑分,11900K 3.5G吊打12600K 5.2G。
发表于 2024-8-16 07:45 | 显示全部楼层
llamacpp用avx512能1.37倍性能,不过内存带宽已经受限了,6核(两个ccd各开3核)和28线程性能没区别。
发表于 2024-8-16 09:59 | 显示全部楼层
darkness66201 发表于 2024-8-15 23:13
按照隔壁牙膏6.2G默认就4 500瓦锁肛的玩法,9950xR23应该能跑5万分才对

是这么个道理 ,压缩机,特挑大雕都搞上。干冒烟跑个分,然后美其名曰基本盘缩不缩那是以后了,反正赢特尔了
发表于 2024-8-16 10:17 | 显示全部楼层
一个周期能干原来两个周期的活,功耗增高百分之二十,频率降低百分之二十,实际能提升百分之五十+

发表于 2024-8-16 10:25 来自手机 | 显示全部楼层
https://www.phoronix.com/review/amd-zen5-avx-512-9950x
发表于 2024-8-16 11:09 | 显示全部楼层
Neo_Granzon 发表于 2024-8-16 05:12
不至于,AIDA64那几个CPU跑分,11900K 3.5G吊打12600K 5.2G。

实际应用里面没有都扯淡
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2025-4-29 17:06 , Processed in 0.014334 second(s), 6 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表