找回密码
 加入我们
搜索
      
查看: 10381|回复: 51

[CPU] 本人使用comsol和ansys海飞丝有限元,做一些流体和机械结构分析等,处理器如何选择

[复制链接]
发表于 2023-9-30 14:49 | 显示全部楼层 |阅读模式
本人使用comsol和ansys海飞丝有限元,做一些流体和机械结构分析等,处理器如何选择,因为看到最新的第四代至强架构上市,w系列有2400和3400,在同核心数下,2400和3400三级缓存大小差异较大,不知道三级缓存大小对有限元分析会有效率提升吗,并且个人有限元分析,多核心处理器该如何选择,偶尔还做深度学习训练,不是现在大模型训练就是目标检测这一类训练,我看有些网上说4090会有CPU瓶颈,那至强的处理器可以避免4090的CPU瓶颈吗,或者说为啥4090会有CPU瓶颈啊,我一直也挺好奇的,希望各位大佬畅所欲言
发表于 2023-9-30 14:51 | 显示全部楼层
跑仿真搞个亮机卡就行了吧
发表于 2023-9-30 15:24 | 显示全部楼层
9754一颗超线程关了直接起飞
发表于 2023-9-30 16:14 | 显示全部楼层
优先考虑cpu主频和内存通道、带宽,在超算上对比过AMD epyc 7452 *2, epyc 7h12,  intel xeon platinum 9242跑comsol,相差不大。 MPI提升有限。
 楼主| 发表于 2023-9-30 16:33 | 显示全部楼层
kkksunny 发表于 2023-9-30 16:14
优先考虑cpu主频和内存通道、带宽,在超算上对比过AMD epyc 7452 *2, epyc 7h12,  intel xeon platinum 924 ...

也就是说可以选择至强w系列的处理器,相对主频比可扩展高,这样计算效率可以高不少是吧
发表于 2023-9-30 16:44 来自手机 | 显示全部楼层
ansys官网有benchmark,一水amd,这玩意显卡真有用吗
发表于 2023-9-30 17:27 来自手机 | 显示全部楼层
仿真ECC内存刚需吧,之前拿TR的3970X跑comsol仿真长时间的容易报错,回头还是用的老双路志强的工作站
 楼主| 发表于 2023-9-30 18:37 | 显示全部楼层
gladiator 发表于 2023-9-30 17:27
仿真ECC内存刚需吧,之前拿TR的3970X跑comsol仿真长时间的容易报错,回头还是用的老双路志强的工作站 ...

我现在是至强w2245处理器,就是用的是ecc,现在就是想之后升级更多核心数CPU,但是不知道怎么选择
发表于 2023-9-30 18:49 来自手机 | 显示全部楼层
服务器/工作站的低频u对4090构成的瓶颈是在线处理的瓶颈,gpu求解器都是离线运算没有瓶颈。最好的配置就是核心越多越好越新越好加4090+显卡。
发表于 2023-9-30 19:46 | 显示全部楼层
我记得 这个和你的网点/格数有关。200w(不太确定是不是这个数值了)的网点/格数以下的话,是高频率收益大,往上的话是多核心收益大。CPU内部的缓存大,必然性能更高,因为这些基本都是CPU运算,不是显卡运算,所以AMD的那个大缓存的U 7950x3d有收益加成。我现在还是的网格数量还是停留在高主频/高内存的级别。。。
发表于 2023-9-30 21:04 来自手机 | 显示全部楼层
本帖最后由 darkness66201 于 2023-9-30 22:18 编辑

Ansys的话不用想了,肯定是AMD的9004X了,96核心9684X或者32核心9384X,具体看预算了,英特尔根本都不用考虑了.......
发表于 2023-9-30 23:25 | 显示全部楼层
考虑核心数和内存带宽就好了,肯定推荐amd epic
发表于 2023-9-30 23:29 | 显示全部楼层
刚看完极客湾的最新影片有介绍EPYC,影片10分钟左右就有Ansys Cosmol的跑分测试,楼主可以看看
发表于 2023-9-30 23:40 | 显示全部楼层
gladiator 发表于 2023-9-30 17:27
仿真ECC内存刚需吧,之前拿TR的3970X跑comsol仿真长时间的容易报错,回头还是用的老双路志强的工作站 ...

ECC内存是天然的比普通内存更少出错,还是说两者出错概率差不多但是ECC内存可以纠错提高稳定性?感觉工作正常的机器上ECC计数都是0,这不就是没有纠错吗
发表于 2023-10-1 00:08 | 显示全部楼层
Coldfire1975 发表于 2023-9-30 23:29
刚看完极客湾的最新影片有介绍EPYC,影片10分钟左右就有Ansys Cosmol的跑分测试,楼主可以看看 ...

那个视频其实是有点误导的,因为ansys本身是非常依赖缓存和带宽的,所以应该是用带了3dv cache的9004X跑才能显示出巨大优势,而缩减了缓存增加核心数量的zen4c并不是太适合跑ansys........
 楼主| 发表于 2023-10-1 03:38 | 显示全部楼层
darkness66201 发表于 2023-9-30 21:04
Ansys的话不用想了,肯定是AMD的9004X了,96核心9684X或者32核心9384X,具体看预算了,英特尔根本都不用考 ...

我epic的96核这种应该不考虑,估计预算是2万的cpu,毕竟个人还是要控制一下预算的,不可能像极客湾这样搞个10w+的电脑,所以在2万的cpu预算下,我在看看到底选啥u合适
 楼主| 发表于 2023-10-1 04:20 | 显示全部楼层
TurbulenceY 发表于 2023-9-30 19:46
我记得 这个和你的网点/格数有关。200w(不太确定是不是这个数值了)的网点/格数以下的话,是高频率收益 ...

你现在用的是啥cpu啊
发表于 2023-10-1 09:20 来自手机 | 显示全部楼层
AMD yes, intel no.
发表于 2023-10-1 09:33 来自手机 | 显示全部楼层
【【硬核干货横评】用总价值17万的CPU告诉你使用流体仿真软件ANSYS Fluent选什么!-哔哩哔哩】 https://b23.tv/x9fsczo
发表于 2023-10-1 09:34 来自手机 | 显示全部楼层
【仿真CPU生产力7950X3D大战13900K测评实验FEA仿真甚至越级打3万元的英特尔服务器AMD的3D缓存鲨疯了comsol-哔哩哔哩】 https://b23.tv/BQbVzde
发表于 2023-10-1 11:31 | 显示全部楼层
huahong 发表于 2023-10-1 03:38
我epic的96核这种应该不考虑,估计预算是2万的cpu,毕竟个人还是要控制一下预算的,不可能像极客湾这样搞 ...

两万以内的话,我看了一下TB,64核的EPYC 9554和96核的9654都是两万左右,zen4架构,当然这些估计是老鼠货所以比较便宜,应该算是比较划算了。新出的32核心9384X相比同核心数的zen4,带着3dv cache能再提升50%左右性能,但是要3万,连16核心的9184X都要两万,对照了一下官网售价,估计是新出的货源所以相对来说就比较符合官网定价。当然还有一个问题是,12通道带ECC的内存也是很大一笔开销,不然带宽不够,内存容量不够,光CPU也跑不出来........
发表于 2023-10-1 11:45 | 显示全部楼层
按照经验来说,建议优选amd的。
发表于 2023-10-1 12:02 来自手机 | 显示全部楼层
https://b23.tv/x1Sxtee
AMD就是因为知道三缓不是越大越好,所以从Zen3到Zen5都给3D V Cache一个单独的X3D系列加价卖,如果是CAE仿真领域,比如abaqus,我AMD霄龙9354三缓256MB,用时才5分50秒,英特尔至强铂金要9分20秒太慢了。
 楼主| 发表于 2023-10-1 14:59 | 显示全部楼层
gou123 发表于 2023-10-1 12:02
https://b23.tv/x1Sxtee
AMD就是因为知道三缓不是越大越好,所以从Zen3到Zen5都给3D V Cache一个单独的X3D ...

那amd这个epyc是不是打游戏就不行了啊,像至强w系列打游戏还可以啊,我主要是因为个人要多少怕amd打游戏就很拉胯啊
发表于 2023-10-1 15:12 来自手机 | 显示全部楼层
huahong 发表于 2023-10-1 14:59
那amd这个epyc是不是打游戏就不行了啊,像至强w系列打游戏还可以啊,我主要是因为个人要多少怕amd打游戏 ...

你拿工作的电脑玩游戏???EPYC也不是不能玩游戏,不过主频低点,玩游戏不如线程撕裂者。
 楼主| 发表于 2023-10-1 15:46 | 显示全部楼层
gou123 发表于 2023-10-1 15:12
你拿工作的电脑玩游戏???EPYC也不是不能玩游戏,不过主频低点,玩游戏不如线程撕裂者。 ...

我的电脑是个人的,不用实验室的,个人的,这不想要稍微兼顾一下游戏嘛,实验室的电脑我动都不想动,一点也没自由,一个是随我改,包括参数啥的,系统配置啥的可以随我验证,现在就是感觉现在我自己工作站不是很强了,想着之后升级,这不是第四代至强也出了w系列的,我之前就是至强w系列的,当然amd的新一代epyc也出了,但是不知道怎么选择,主要是看到这会至强w3400和2400挤牙膏这回挤得有点多,epyc新一代也很强,然后就有选择困难症了
发表于 2023-10-1 15:53 | 显示全部楼层
huahong 发表于 2023-9-30 16:33
也就是说可以选择至强w系列的处理器,相对主频比可扩展高,这样计算效率可以高不少是吧 ...

是的,但还是看你的问题能否并行化,像瞬态时域就不太适合,但是小问题参数化扫描这种多核心还是有不错的提升
 楼主| 发表于 2023-10-1 16:15 | 显示全部楼层
kkksunny 发表于 2023-10-1 15:53
是的,但还是看你的问题能否并行化,像瞬态时域就不太适合,但是小问题参数化扫描这种多核心还是有不错的 ...

老哥怪我才疏学浅,我并不能很理解并行化,因为我是个人的工作站,就是正常的点击求解,不搞集群那种,但是comsol和ansys都会去设置多核求解的,当然也因为是个人,还是需要在主频和核心数上取个平衡
发表于 2023-10-1 17:03 | 显示全部楼层
huahong 发表于 2023-10-1 04:20
你现在用的是啥cpu啊

13900k 和 4090. 还有个 志强的 E2667 v4*2,明显13900k 比这俩志强快太多了。我的模型也不是很大,都是比较小的产品。。。而且 还能摸鱼玩个游戏什么的,哈哈哈哈。。。
发表于 2023-10-1 17:35 | 显示全部楼层
huahong 发表于 2023-10-1 14:59
那amd这个epyc是不是打游戏就不行了啊,像至强w系列打游戏还可以啊,我主要是因为个人要多少怕amd打游戏 ...


Genoa我是不知道,但是Sapphire Rapids打游戏是真的很烂。放开折腾的W790都救不回的那种
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2025-4-26 23:29 , Processed in 0.012377 second(s), 5 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表