找回密码
 加入我们
搜索
      
查看: 3976|回复: 39

[装机] 交互式数字人单位装机求大佬们推荐配置!!!

[复制链接]
发表于 2025-5-26 22:29 | 显示全部楼层 |阅读模式
本帖最后由 xiaotian945 于 2025-5-26 22:30 编辑

单位有个60W的项目,想搞个数字模拟人,对于这个模拟人的需求就是对话交互,可以本地以及单位服务器AI训练学习,可以精准喂数据(个性化问答内容),

同时链接DEPPSEEK

还有一个物联网管理平台服务器(智慧康养),虽然我不懂服务器的硬件,但是供货商给我提供如下配置。。。。。感觉好古董,我也是无语了

如下:

1:支撑数智人模型与 DeepSeek 交互服务器:

CPU:英特尔至强金牌 5218,16 核心 32 线程,主频 2.3GHz

内存:128GB DDR4 3200MHz

硬盘:4TB 企业级 SAS 硬盘,组建 RAID 阵列,以提供更高的数据读写性能和数据安全性

网卡:2 个千兆以太网接口支持高速数据传输,满足大量健康数据的长期存储和快速访问需求

2:智慧康养系统服务器:

CPU:英特尔至强铂金 8280,28 核心 56 线程,主频 2.7GHz 及以上

内存:128GB DDR4 3200MHz

硬盘:1TB 企业级 SAS 硬盘,组建 RAID 阵列,以提供更高的数据读写性能和数据安全性

网卡:2 个千兆以太网接口支持高速数据传输,满足大量健康数据的长期存储和快速访问需求

——————————————————————————————————————————————————

请大佬有懂行的,能推荐更新一下配置吗,服务器显卡肯定是要上的,我准备让他给上2块4090 48G,剩下的我就不懂了,求大佬给与帮助!
 楼主| 发表于 2025-5-26 22:34 | 显示全部楼层
雨季不再来 发表于 2025-5-26 22:32
现在还用SAS硬盘?供应商是在清库存吧。很明显应该上高速固态!另外,内存也太小了。 ...

是啊,整个这个配置我没一个看的上的,这些硬件加一起估计2000就搞定了,我虽然不懂服务器硬件,但是给的也太拉了
 楼主| 发表于 2025-5-26 22:36 | 显示全部楼层
银月 发表于 2025-5-26 22:35
网卡:2 个千兆以太网接口支持高速数据传输

我他妈笑死了

他们就忽悠都不懂的
 楼主| 发表于 2025-5-26 22:38 | 显示全部楼层
xy. 发表于 2025-5-26 22:37
你说这逼单子是 deepseek 拉的我都信

没有,deepseek写的比它高10个档次,但是基本写的是游戏电脑
 楼主| 发表于 2025-5-26 22:52 | 显示全部楼层
银月 发表于 2025-5-26 22:43
我之前给人推荐的G493-ZB3+双路9654+24*64g内存,显卡丰俭由人,正常二十万,gpu多点四十万也就下来了 ...

到是用不到那么好的,因为还有训练计算维护的费用,他们还要赚钱,尤其是单位这种,我感觉60W怎么也得给配2个5万的主机吧,5万的有什么推荐吗大佬
 楼主| 发表于 2025-5-26 22:56 | 显示全部楼层
a010301208 发表于 2025-5-26 22:48
60万的项目你只上2块48G?

对,因为不进行图形学习,只有语言类学习,还有他们开发软件啥的,最大的头是软件+维护,还有企事业单位的虚高报价,你懂的,能上2个4090就不错了
 楼主| 发表于 2025-5-26 23:09 | 显示全部楼层
a010301208 发表于 2025-5-26 23:00
先确认用什么模型吧,用多少参数的,是不是要微调,你这项目重点就2个,1就是显卡的支出,2那就是这项目 ...

Transformer,16/32B就行了吧,70B好像用不起
 楼主| 发表于 2025-5-26 23:12 | 显示全部楼层
YsHaNg 发表于 2025-5-26 23:09
你都接deepseek了那肯定是供应商api 本地就个rag有啥可训练的 跑个几百m嵌入模型了不得了 这意思是要存证 ...

还是要本地部署的,因为单位网不行,别回头网不行,回答不了,卡了,就不好了
 楼主| 发表于 2025-5-26 23:12 | 显示全部楼层
YsHaNg 发表于 2025-5-26 23:09
你都接deepseek了那肯定是供应商api 本地就个rag有啥可训练的 跑个几百m嵌入模型了不得了 这意思是要存证 ...

本地部署-回答单位特殊内容,deepseek-回答单位内容意外的,我是这么理解的啊
 楼主| 发表于 2025-5-26 23:19 | 显示全部楼层
YsHaNg 发表于 2025-5-26 23:18
现在主流g p t-2之后全是transformer架构的
moe模型显存大于激活参数随便跑 qwen3 235b-a22b q4量化显存+ ...

大佬能给根据需求,给一份完整的配置单吗?我好和供货商打架去,主要AI这块我是真不懂啊
 楼主| 发表于 2025-5-26 23:25 | 显示全部楼层
YsHaNg 发表于 2025-5-26 23:18
现在主流g p t-2之后全是transformer架构的
moe模型显存大于激活参数随便跑 qwen3 235b-a22b q4量化显存+ ...

我看别人给我推个这个配置

CPU:AMD EPYC 9654(96核192线程,极致并行计算)

内存:128GB DDR5 ECC(保障大模型稳定性)

存储:8TB NVMe SSD RAID阵列(高速数据吞吐)

GPU:双NVIDIA H100(80GB显存×2,支持千亿级模型微调)

推理速度:100+ Token/s(可部署70B以上参数模型,如**-4级模型)

模型支持:实时视频理解、多语言翻译、3D渲染等复杂任务
 楼主| 发表于 2025-5-26 23:36 | 显示全部楼层
YsHaNg 发表于 2025-5-26 23:31
这不挺好滴嘛 潜力大并发量足 你能搞到h100就行 不需要极端性能市面上能用的开源中号模型都能跑起来 反正 ...

这个真搞不到,也超供货商利润点了,退一步是选5880还是4090啊?
 楼主| 发表于 2025-5-27 09:43 | 显示全部楼层
lookbey 发表于 2025-5-27 08:29
私聊吧 ,我之前也是做智慧康养的,和楼主很类似的项目,可以给你推一下具体的。 ...

大佬,感谢指导,V:rockstar_79
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2025-10-11 03:25 , Processed in 0.009898 second(s), 6 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表