Miner 发表于 2025-2-6 16:12
m2 ultra 192GB run 70B 都很慢,因为目前 npu 利用不上,纯靠 GPU,上下文大的时候就更慢。推理模型输出量 ...
海口天空 发表于 2025-2-6 16:19
这么垃圾,看来软件适配还是不如cuda。英伟达又太贵,吸血啊
海口天空 发表于 2025-2-6 16:19
这么垃圾,看来软件适配还是不如cuda。英伟达又太贵,吸血啊
欢迎光临 Chiphell - 分享与交流用户体验 (https://www.chiphell.com/) | Powered by Discuz! X3.5 |