kingofgu 发表于 2025-4-2 16:53
推理确实有很多方案
nv主要卡的还是训练
StevenG 发表于 2025-4-2 16:57
这套平台也得30万了。。。要是96g版4090存在,还真说不好同等性能(多套提供服务),哪边便宜。。。 ...
awpak78 发表于 2025-4-2 17:05
用上12通道8800 MRDIMM才这个速度,4090D究竟是在加速还是减速?
搞不好vllm+ipex纯CPU跑都有这个速度了 ...
KimmyGLM 发表于 2025-4-2 18:17
显然不可能,b站搜视频9005纯cpu满带宽跑q5才5token/s……
我自己的4060ti 16g+768g跑kt q4 10.5token;
...
os39000 发表于 2025-4-2 21:31
大佬什么cpu?768 是 96*8?还是64*12?
KimmyGLM 发表于 2025-4-2 18:17
显然不可能,b站搜视频9005纯cpu满带宽跑q5才5token/s……
我自己的4060ti 16g+768g跑kt q4 10.5token;
...
KimmyGLM 发表于 2025-4-2 18:17
显然不可能,b站搜视频9005纯cpu满带宽跑q5才5token/s……
我自己的4060ti 16g+768g跑kt q4 10.5token;
...
望月 发表于 2025-4-3 11:13
大佬真心请教下,如果我手里有32G甚至48G的显卡,KT多分几层任务到显卡上,搭配8*64G共512G内存,Q4能达 ...
望月 发表于 2025-4-3 11:13
大佬真心请教下,如果我手里有32G甚至48G的显卡,KT多分几层任务到显卡上,搭配8*64G共512G内存,Q4能达 ...
望月 发表于 2025-4-3 11:13
大佬真心请教下,如果我手里有32G甚至48G的显卡,KT多分几层任务到显卡上,搭配8*64G共512G内存,Q4能达 ...
endlessbest 发表于 2025-4-2 22:11
大佬,求 4060ti 16g + 768g硬件方案
KimmyGLM 发表于 2025-4-3 12:55
这是目前官方自己统计的跑通明细表,可以参考;
多卡并发从群里讨论来看,是可以提高decode速度的,而且 ...
望月 发表于 2025-4-7 10:57
嗯,工作环境原因,我这边不是成本考虑,更多是从平台架构上摸索,我能摸到现在I家和A家的桌面和工作站, ...
KimmyGLM 发表于 2025-4-7 11:01
你要预算足够,上Tr Pro,线撕7995wx,八通道D5带宽300G+,兼顾家用和游戏,足够强悍了
显卡就你说的,看 ...
KimmyGLM 发表于 2025-4-7 11:01
你要预算足够,上Tr Pro,线撕7995wx,八通道D5带宽300G+,兼顾家用和游戏,足够强悍了
显卡就你说的,看 ...
LNT 发表于 2025-4-7 16:18
7995不超内存的话就只有270GB/s, 游戏由于核心数太多也比较差,绝大多数情况下不如64核的7985wx,跑ktra ...
港城钢铁侠 发表于 2025-4-7 17:00
Xeon6+MRDIMM 8800+双路才跑到这个速度的,这套平台里内存带宽都赶上显存带宽了,成本太高 ...
欢迎光临 Chiphell - 分享与交流用户体验 (https://www.chiphell.com/) | Powered by Discuz! X3.5 |