找回密码
 加入我们
搜索
      
查看: 4830|回复: 13

[CPU] 用于深度学习的图像工作站咨询各位前辈

[复制链接]
发表于 2023-5-30 09:20 | 显示全部楼层 |阅读模式
用途:深度学习 做时间序列和NLP相关模型训练,之前一直用自己的家的小电脑3060玩玩简单的lstm和简易阉割transformer,没资源做大模型
现在实验室有资源采购工作站,不知道dell这个配置用来做训练是否合理

机箱:Precision 7960 塔式 2200W 机箱
处理器:intel 志强 w9-3495x
内存:128GB ,4*32GB ddr5 ECC
显卡:nvidia RTX6000 ADA 48GB  *2块
操作系统boot:英特尔 1-2 NVMe PCIe 固态硬盘 Front FlexBay Boot + SATA
硬盘控制器:英特尔集成控制器含 1-2 Front Flex Bay PCIe NVMe 硬盘
硬盘1:2TB m.2 PCIE nvme
硬盘2:8TB 7200RPM HDD
显示器:dell U2723qx

同时好像还是thinkstation px也是新出的工作站,看配置和整体功能类似,价格比dell偏高,但也在预算内,请问如何选择,谢谢

发表于 2023-5-30 10:04 | 显示全部楼层
这一套要多少钱呀,好口水
发表于 2023-5-30 10:11 | 显示全部楼层
建议将2块a6000 换成A800 PCIE 80GB,
钱不够就降CPU规格

你这2块卡 看着加起来显存很大,实则无法nvlink 互联,用起来也是慢
不如上单卡80GB
同时 ADA 里的RT core对DL无用
发表于 2023-5-30 10:46 | 显示全部楼层
DELL、HP、Lenovo这种国际牌子厂商,在工作站使用NV卡,大概率限制NVLink,必须使用专业卡才可以。
消费类的GeForce别指望
发表于 2023-5-30 10:50 | 显示全部楼层
奔着一辆宝马三系去了。
 楼主| 发表于 2023-5-30 15:51 | 显示全部楼层
wzy1208apk 发表于 2023-5-30 10:04
这一套要多少钱呀,好口水

20w以内吧
 楼主| 发表于 2023-5-30 15:54 | 显示全部楼层
gtv 发表于 2023-5-30 10:11
建议将2块a6000 换成A800 PCIE 80GB,
钱不够就降CPU规格

的确好像这代rtx6000没nvlink了,但是换a800 估计要大调了,要换有显示输出的板u整个机型都要调整,主要单位不让ssh远程链接吗,一旦这么连还要涉及好多安全问题基本不会ssh,都是只能在个人脚下查显示器当个人工作站使用。
还有就是不知道a800的算力和a6000ada差距有多大 训练时间会不会很长
ps:transformer此类的模型不知道双卡不做nvlink有没有并行的方法调用,这个之前没研究过
 楼主| 发表于 2023-5-30 15:55 | 显示全部楼层
myway 发表于 2023-5-30 10:46
DELL、HP、Lenovo这种国际牌子厂商,在工作站使用NV卡,大概率限制NVLink,必须使用专业卡才可以。
消费类 ...

不太明白,请问需要怎么调整配置吗
发表于 2023-5-30 16:06 | 显示全部楼层
gtv 发表于 2023-5-30 10:11
建议将2块a6000 换成A800 PCIE 80GB,
钱不够就降CPU规格

换了A800,还得加个亮机卡做显示输出吧~
发表于 2023-5-30 16:10 | 显示全部楼层
usky 发表于 2023-5-30 15:54
的确好像这代rtx6000没nvlink了,但是换a800 估计要大调了,要换有显示输出的板u整个机型都要调整,主要 ...

A800的带宽要强于A6000, DL 现在主要bottleneck是memory 访问。

A6000 最大的优势是支持fp8以及transformer engine。

如果考虑20w的预算 可以上两块A100 PCIE 40GB,支持nvlink 互联。

不用nvlink 无非走pcie通道,就是慢,也不是不能跑。

当然 加钱上H800 系列 才能两全其美.
发表于 2023-5-30 16:13 | 显示全部楼层
HEXD 发表于 2023-5-30 16:06
换了A800,还得加个亮机卡做显示输出吧~

没错,老黄精准定位
发表于 2023-5-30 16:18 | 显示全部楼层
gtv 发表于 2023-5-30 16:13
没错,老黄精准定位

也怪抠戴不加个IPMI
 楼主| 发表于 2023-5-30 16:22 | 显示全部楼层
gtv 发表于 2023-5-30 16:10
A800的带宽要强于A6000, DL 现在主要bottleneck是memory 访问。

A6000 最大的优势是支持fp8以及transfo ...

处理器:intel 志强 w5-3435x

显卡:nvidia a100 40G*2 nvlink
nvidia p4 亮机

这样合理一些吗
发表于 2023-5-30 18:21 | 显示全部楼层
usky 发表于 2023-5-30 16:22
处理器:intel 志强 w5-3435x

显卡:nvidia a100 40G*2 nvlink

合理 不过要想好这个方案加起来显存就80g 意味着只能加载llm 差不多十几B这样的模型 而且涉及到nvlink 虽然比pcie快 但依然有通信开销,不如单卡。
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2025-4-27 08:03 , Processed in 0.009854 second(s), 5 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表