来交个国庆期间的作业，DIY 4U显卡扩展柜助力个人AI大模型部署，刷入P2P破解内核

港城钢铁侠 · 发表于 2025-10-17 20:24

zhuifeng88 发表于 2025-10-17 20:21
两个7B12每个numa4张, 要是switch方案怎么会全跑4.0x8

PLX方案非常需要P2P，因为上行带宽共享的。你这种直连CPU的影响小很多

zhuifeng88 · 发表于 2025-10-17 20:25

港城钢铁侠发表于 2025-10-17 20:23
Switch方案可以全部4.0x8的，PEX88096甚至可以10卡4.0x8，只不过上行只有x16。

我是想说要是switch方案的话就两级全16了, 怎么会跑x8

港城钢铁侠 · 发表于 2025-10-17 20:28

zhuifeng88 发表于 2025-10-17 20:25
我是想说要是switch方案的话就两级全16了, 怎么会跑x8

也是，我感觉我目前这个PLX板子是那个intel arc pro B60双芯卡先天圣体，让卖家把4个x16搞成x8+x8模式，4张双芯卡显存192G

l泰然处之01 · 发表于 2025-10-17 21:38

港城钢铁侠发表于 2025-10-17 20:28
也是，我感觉我目前这个PLX板子是那个intel arc pro B60双芯卡先天圣体，让卖家把4个x16搞成x8+x8模式，4 ...

Intel ARC Pro B60 这个我一直在关注，现在还没有看到有实体卡或者零售，功能价格都非常齐全的一张卡

vct00 · 发表于 2025-10-17 21:43

请教大佬，整套下来是多少钱呢？

港城钢铁侠 · 发表于 2025-10-17 21:49

vct00 发表于 2025-10-17 21:43
请教大佬，整套下来是多少钱呢？

4张显卡1w3，PLX板子2230，机箱500，别的都是之前有的没花钱

vct00 · 发表于 2025-10-17 21:57

港城钢铁侠发表于 2025-10-17 21:49
4张显卡1w3，PLX板子2230，机箱500，别的都是之前有的没花钱

谢谢大佬，我再仔细看看

michael80 · 发表于 2025-10-17 23:05

老哥好厉害，

港城钢铁侠 · 发表于 2025-10-17 23:36

michael80 发表于 2025-10-17 23:05
老哥好厉害，

全靠折腾

star_liu · 发表于 2025-10-18 11:42

港城钢铁侠发表于 2025-10-17 18:36
那你用api就行了

主要是想复现一些具身智能大模型，需要本地推理，本来计划是2080ti 22G，**推荐我整3090 24G

港城钢铁侠 · 发表于 2025-10-18 12:24

star_liu 发表于 2025-10-18 11:42
主要是想复现一些具身智能大模型，需要本地推理，本来计划是2080ti 22G，**推荐我整3090 24G ...

搞本地推理确实推荐30系起步

q3again0605 · 发表于 2025-10-18 16:16

港城钢铁侠发表于 2025-10-17 17:47
我记得4090 48G P2P开不起来的原因不是memory最大识别就是32G么？刷vbios可以解决这个问题？ ...

你看tinygard那个repo issue里有个帖子有人可以了，你可以试试，我问了贴图的人他是国内的应该属实，可能部分测试通不过但是实际推理应该还是可以

q3again0605 · 发表于 2025-10-18 16:19

l泰然处之01 发表于 2025-10-17 18:44
大佬细说，48G 的卡有新 BIOS 了吗，能解决 32G Bar1 的限制了吗

可以看一下我上面的说明，翻一下issue看，我没有两张4090 48g还没测试过

v62pmonr · 发表于 2025-10-21 19:18

以前折腾nas网卡之类的的就看了楼主不少好帖，现在弄llm还准备猛抄一波作业，可64G显存文本还行，vl的模型有点跑不起来，弄两块4090 48G又有点舍不得下手。

港城钢铁侠 · 发表于 2025-10-21 20:28

v62pmonr 发表于 2025-10-21 19:18
以前折腾nas网卡之类的的就看了楼主不少好帖，现在弄llm还准备猛抄一波作业，可64G显存文本还行，vl的模型 ...

vl模型应该能跑吧，我记得不是30B的么，就算比纯text模型大，NVFP4量化64G显存肯定是够的

l泰然处之01 · 发表于 2025-10-21 22:43

港城钢铁侠发表于 2025-10-21 20:28
vl模型应该能跑吧，我记得不是30B的么，就算比纯text模型大，NVFP4量化64G显存肯定是够的 ...

实际推理的时候可能会 OOM，取决于输入的东西，推图片没啥问题

账号		自动登录	找回密码
密码			加入我们

[装机] 来交个国庆期间的作业，DIY 4U显卡扩展柜助力个人AI大模型部署，刷入P2P破解内核