找回密码
 加入我们
搜索
      
楼主: 港城钢铁侠

[装机] 来交个国庆期间的作业,DIY 4U显卡扩展柜助力个人AI大模型部署,刷入P2P破解内核

[复制链接]
 楼主| 发表于 2025-10-17 20:24 来自手机 | 显示全部楼层
zhuifeng88 发表于 2025-10-17 20:21
两个7B12每个numa4张, 要是switch方案怎么会全跑4.0x8

PLX方案非常需要P2P,因为上行带宽共享的。你这种直连CPU的影响小很多
发表于 2025-10-17 20:25 | 显示全部楼层
港城钢铁侠 发表于 2025-10-17 20:23
Switch方案可以全部4.0x8的,PEX88096甚至可以10卡4.0x8,只不过上行只有x16。

我是想说要是switch方案的话就两级全16了, 怎么会跑x8
 楼主| 发表于 2025-10-17 20:28 来自手机 | 显示全部楼层
zhuifeng88 发表于 2025-10-17 20:25
我是想说要是switch方案的话就两级全16了, 怎么会跑x8

也是,我感觉我目前这个PLX板子是那个intel arc pro B60双芯卡先天圣体,让卖家把4个x16搞成x8+x8模式,4张双芯卡显存192G
发表于 2025-10-17 21:38 | 显示全部楼层
港城钢铁侠 发表于 2025-10-17 20:28
也是,我感觉我目前这个PLX板子是那个intel arc pro B60双芯卡先天圣体,让卖家把4个x16搞成x8+x8模式,4 ...

Intel ARC Pro B60 这个我一直在关注,现在还没有看到有实体卡或者零售,功能价格都非常齐全的一张卡
发表于 2025-10-17 21:43 | 显示全部楼层
请教大佬,整套下来是多少钱呢?
 楼主| 发表于 2025-10-17 21:49 来自手机 | 显示全部楼层
vct00 发表于 2025-10-17 21:43
请教大佬,整套下来是多少钱呢?

4张显卡1w3,PLX板子2230,机箱500,别的都是之前有的没花钱
发表于 2025-10-17 21:57 | 显示全部楼层
港城钢铁侠 发表于 2025-10-17 21:49
4张显卡1w3,PLX板子2230,机箱500,别的都是之前有的没花钱

谢谢大佬,我再仔细看看
发表于 2025-10-17 23:05 | 显示全部楼层
老哥好厉害,
 楼主| 发表于 2025-10-17 23:36 来自手机 | 显示全部楼层
michael80 发表于 2025-10-17 23:05
老哥好厉害,

全靠折腾
发表于 2025-10-18 11:42 | 显示全部楼层

主要是想复现一些具身智能大模型,需要本地推理,本来计划是2080ti 22G,**推荐我整3090  24G
 楼主| 发表于 2025-10-18 12:24 | 显示全部楼层
star_liu 发表于 2025-10-18 11:42
主要是想复现一些具身智能大模型,需要本地推理,本来计划是2080ti 22G,**推荐我整3090  24G ...

搞本地推理确实推荐30系起步
发表于 2025-10-18 16:16 | 显示全部楼层
港城钢铁侠 发表于 2025-10-17 17:47
我记得4090 48G P2P开不起来的原因不是memory最大识别就是32G么?刷vbios可以解决这个问题? ...

你看tinygard那个repo issue里有个帖子有人可以了,你可以试试,我问了贴图的人他是国内的应该属实,可能部分测试通不过但是实际推理应该还是可以
发表于 2025-10-18 16:19 | 显示全部楼层
l泰然处之01 发表于 2025-10-17 18:44
大佬细说,48G 的卡有新 BIOS 了吗,能解决 32G Bar1 的限制了吗

可以看一下我上面的说明,翻一下issue看,我没有两张4090 48g还没测试过
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2025-10-21 03:37 , Processed in 0.196027 second(s), 5 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表