godspeed66 发表于 2023-6-13 18:53

sinopart 发表于 2023-6-13 17:10
他跑的是自己软件的测试,不是跑AVX,压力会小很多。

我的程序使用AVX512

Loading extension module cpu_adam...
Time to load cpu_adam op: 2.5269882678985596 seconds
Adam Optimizer #0 is created with AVX512 arithmetic capability.

专升本高手 发表于 2023-6-13 19:47

感谢绝活哥持续更新

IamAeon 发表于 2023-6-13 19:58

简易的功率计确实测不出瞬时波动,FCP 大魔王用的致茂 Chroma 8000 系列设备测的,不过普通玩家确实也没必要用这种专业设备。

IamAeon 发表于 2023-6-13 20:03

更正一下是“至茂”,阿里巴巴上二手的卖19万一台。

kanakoaoi 发表于 2023-6-13 20:04

godspeed66 发表于 2023-6-13 18:53
我的程序使用AVX512

Loading extension module cpu_adam...


你跑AVX512 時應該已經掉頻[偷笑]不可能在4.8G
y-cruncher

godspeed66 发表于 2023-6-13 20:35

本帖最后由 godspeed66 于 2023-6-13 20:40 编辑

kanakoaoi 发表于 2023-6-13 20:04
你跑AVX512 時應該已經掉頻不可能在4.8G
y-cruncher





正好帮我看看

zhuifeng88 发表于 2023-6-13 20:37

godspeed66 发表于 2023-6-13 20:35
正好帮我看看

优化器的avx512指令密度是非常低的

fcs15963 发表于 2023-6-13 20:42

godspeed66 发表于 2023-6-12 15:17
嗯嗯 看到了 等1600瓦的 单电源不行 再买2个电源

不同型号的电源直接并联没法有效平衡负载,瞬间的压力还是会在其中一个电源上

kanakoaoi 发表于 2023-6-13 20:42

godspeed66 发表于 2023-6-13 20:35
正好帮我看看

你跑個y-cruncher 試試

godspeed66 发表于 2023-6-13 20:43

zhuifeng88 发表于 2023-6-13 20:37
优化器的avx512指令密度是非常低的

所以这个没用AVX512?

zhuifeng88 发表于 2023-6-13 20:44

godspeed66 发表于 2023-6-13 20:43
所以这个没用AVX512?

用了, 但优化器本身不是compute bound的负载, 并且指令当中avx512指令的占比很低, 你挂vtune看看就明白了

godspeed66 发表于 2023-6-13 20:47

IamAeon 发表于 2023-6-13 19:58
简易的功率计确实测不出瞬时波动,FCP 大魔王用的致茂 Chroma 8000 系列设备测的,不过普通玩家确实也没必 ...

所以只看效果就行了

19万的设备,要不是职业用户或者极其个别的个人用户,绝大多数人是不会买的

那我们就别纠结什么瞬间功率了

买个好电源N20 2000瓦才1699雷神2 1600才4299海韵TX1600 才3999,咋买都比19万的设备便宜

godspeed66 发表于 2023-6-13 20:49

fcs15963 发表于 2023-6-13 20:42
不同型号的电源直接并联没法有效平衡负载,瞬间的压力还是会在其中一个电源上 ...

你说的好对,早点知道这个知识能节省我至少6个小时


我是测试后,根据测试结果才反应过来的

bigeblis 发表于 2023-6-13 20:51

godspeed66 发表于 2023-6-13 20:53

zhuifeng88 发表于 2023-6-13 20:44
用了, 但优化器本身不是compute bound的负载, 并且指令当中avx512指令的占比很低, 你挂vtune看看就明白了 ...

所以,说重点啊


怎么用AMX加速啊!!!!!!!!!


拿各种测试软件没意义呀

买这么好的CPU 不用AMX ,去用AVX512[吐槽]

zhuifeng88 发表于 2023-6-13 20:56

godspeed66 发表于 2023-6-13 20:53
所以,说重点啊




你的使用场景和amx的使用场景八竿子打不着边, 用不上的
amx面向的是小模型的低延迟推理和offload到cpu部分的加速

godspeed66 发表于 2023-6-13 20:57

bigeblis 发表于 2023-6-13 20:51
配置逆天
也许AX1600i可以???

感谢推荐

看测评确实很好

而且还是C14接口

但价格4999   ,我打算先尝试下1699的长城N20 2000瓦,先支持下国产,不行再换好的

godspeed66 发表于 2023-6-13 20:58

zhuifeng88 发表于 2023-6-13 20:56
你的使用场景和amx的使用场景八竿子打不着边, 用不上的
amx面向的是小模型的低延迟推理和offload到cpu部 ...

我这就是offload到 CPU了啊

offload_optimizer_device: cpu

godspeed66 发表于 2023-6-13 21:00

zhuifeng88 发表于 2023-6-13 20:56
你的使用场景和amx的使用场景八竿子打不着边, 用不上的
amx面向的是小模型的低延迟推理和offload到cpu部 ...

我都郁闷了

IPEX 貌似也没用上
ipex_config:
ipex: true


都启用了


就是看不到效果

周边又没人懂这个,只能自己摸索着玩

zhuifeng88 发表于 2023-6-13 21:04

本帖最后由 zhuifeng88 于 2023-6-13 21:06 编辑

godspeed66 发表于 2023-6-13 20:58
我这就是offload到 CPU了啊

offload_optimizer_device: cpu

deepspeed的优化器不是computebonund, offload只是减轻显存压力而已, 俩内置offload功能都是这个目的的, 和加速计算的offload说的不是一个东西
ipex的话是会用上的, 但加速的部分可能不是耗时大头(特别是在多卡的情况下), 整体上未必能看出效果

godspeed66 发表于 2023-6-13 21:13

zhuifeng88 发表于 2023-6-13 21:04
deepspeed的优化器不是computebonund, offload只是减轻显存压力而已, 俩内置offload功能都是这个目的的,...

为什么优化器里不能用AMX 或者说IPEX?

cpu_adam cuda is missing or is incompatible with installed torch, only cpu ops can be compiled!
Using /root/.cache/torch_extensions/py38_cu121 as PyTorch extensions root...
Emitting ninja build file /root/.cache/torch_extensions/py38_cu121/cpu_adam/build.ninja...
Building extension module cpu_adam...
Allowing ninja to set a default number of workers... (overridable by setting the environment variable MAX_JOBS=N)
ninja: no work to do.
Loading extension module cpu_adam...
Time to load cpu_adam op: 2.5269882678985596 seconds
Adam Optimizer #0 is created with AVX512 arithmetic capability

zhuifeng88 发表于 2023-6-13 21:17

godspeed66 发表于 2023-6-13 21:13
为什么优化器里不能用AMX 或者说IPEX?

cpu_adam cuda is missing or is incompatible with...

amx能用, 但意义不大, 在这块提供不了什么加速, 做这个的人力花别的地方多好
ipex的话, 这是pytorch的扩展, 而你用的优化器是deepspeed实现的, 邻居家的小孩关ipex啥事

godspeed66 发表于 2023-6-13 21:24

zhuifeng88 发表于 2023-6-13 21:17
amx能用, 但意义不大, 在这块提供不了什么加速, 做这个的人力花别的地方多好
ipex的话, 这是pytorch的扩 ...

我执行 python -m pip install intel_extension_for_pytorch -f https://developer.intel.com/ipex-whl-stable-cpu

import Accelerator

配置里也启用IPEX

但没效果

godspeed66 发表于 2023-6-13 21:37

莫名其妙的

白天运行没问题

晚上再运行程序,海韵TX1600 也重启了

我有点不会玩了

yin19991999 发表于 2023-6-13 21:46

godspeed66 发表于 2023-6-13 21:37
莫名其妙的

白天运行没问题


不会是cpu不稳定吧

godspeed66 发表于 2023-6-13 22:02

yin19991999 发表于 2023-6-13 21:46
不会是cpu不稳定吧

怀疑过,现在也有点怀疑

但每次都是执行程序到指定位置后再重启,而且之前CPU运行100% 好多次了,所以目前还是更怀疑电




有点晕啊

godspeed66 发表于 2023-6-13 22:06

kanakoaoi 发表于 2023-6-13 20:04
你跑AVX512 時應該已經掉頻不可能在4.8G
y-cruncher


我在想,有没有可能是我的CPU温度过高导致的问题



刚刚看到

TCASE:是Intel官方公布的,可让CPU满性能运行的温度上限,超过上限后,CPU会尝试降频工作,以降低温度,若降频工作温度仍然无法控制,则会重启主机(该功能需要主板配合)。

godspeed66 发表于 2023-6-13 22:06

zhuifeng88 发表于 2023-6-13 21:17
amx能用, 但意义不大, 在这块提供不了什么加速, 做这个的人力花别的地方多好
ipex的话, 这是pytorch的扩 ...


我在想,有没有可能是我的CPU温度过高导致的问题



刚刚看到

TCASE:是Intel官方公布的,可让CPU满性能运行的温度上限,超过上限后,CPU会尝试降频工作,以降低温度,若降频工作温度仍然无法控制,则会重启主机(该功能需要主板配合)。

blueflash 发表于 2023-6-13 22:07

godspeed66 发表于 2023-6-13 22:06
我在想,有没有可能是我的CPU温度过高导致的问题




白天开空调温度低,晚上没开空调温度高?

godspeed66 发表于 2023-6-13 22:09

blueflash 发表于 2023-6-13 22:07
白天开空调温度低,晚上没开空调温度高?

嗯嗯

我正回忆呢,确实白天有空调,晚上没空调

难道之前是1250瓦电源、1300瓦电源是功率不够

换成1600瓦电源后,是温度问题?
页: 1 2 3 4 [5] 6 7
查看完整版本: [分享]电脑重启,问题在CPU瞬间温度,CPU瞬间754瓦,电源换2000W,更新HWMonitor截图