找回密码
 加入我们
搜索
      
查看: 7599|回复: 53

[显卡] 黄皮Nvidia Spark五月份出AI迷你“personal AI supercomputer”机

[复制链接]
发表于 2025-1-7 12:22 | 显示全部楼层 |阅读模式
本帖最后由 simplex 于 2025-3-19 17:48 编辑

我希望,但是不太相信会成真。但黄皮在CES发布会上说五月左右上市
ndig3.jpg
ndig2.jpg
ndig1.jpg
media_GmWOFZ-aYAAz6u9.png
发表于 2025-1-7 12:22 | 显示全部楼层
dgx 同款配色啊。。。
发表于 2025-1-7 12:42 | 显示全部楼层
不懂就问:这是啥东东?能替代Mac Mini 4 pro么?
发表于 2025-1-7 12:43 | 显示全部楼层
想起那个传闻,今年NVIDIA会出WOA的产品。
发表于 2025-1-7 12:44 来自手机 | 显示全部楼层
老黄:i have a dream,干死Intel和AMD~
发表于 2025-1-7 12:47 来自手机 | 显示全部楼层
出了搞一台,就为这外形
发表于 2025-1-7 12:48 | 显示全部楼层
StevenG 发表于 2025-1-7 12:47
出了搞一台,就为这外形

3000刀起步, 其中一半价格给了400g网卡, 核心性能持平5070, 内存带宽还拉了个大垮
发表于 2025-1-7 13:09 | 显示全部楼层
arm20核心 128g统一内存,1P FP4算力
发表于 2025-1-7 13:10 | 显示全部楼层
这配色抽象
发表于 2025-1-7 13:12 来自手机 | 显示全部楼层
AMD那边的AI max才是真AI迷你机吧,四通道超大内存+40cu,就看AMD能不能把他弄成类似AI工作站之类的东西了
 楼主| 发表于 2025-1-7 13:55 | 显示全部楼层
本帖最后由 simplex 于 2025-1-7 13:57 编辑
zhuifeng88 发表于 2025-1-7 12:48
3000刀起步, 其中一半价格给了400g网卡, 核心性能持平5070, 内存带宽还拉了个大垮 ...


就看价格了。内存要大很多,而且可以两台合着用。起码也有256bit吧?

不考虑x64,应该可以杀strix halo
发表于 2025-1-7 13:59 | 显示全部楼层
simplex 发表于 2025-1-7 13:55
就看价格了。内存要大很多,而且可以两台合着用。起码也有256bit吧?

不考虑x64,应该可以杀strix halo ...

目标是干halo那倒是没什么问题...
发表于 2025-1-7 14:01 来自手机 | 显示全部楼层
可以做电视盒子
发表于 2025-1-7 14:08 | 显示全部楼层
oppoig 发表于 2025-1-7 12:43
想起那个传闻,今年NVIDIA会出WOA的产品。

不用传闻,是真的
发表于 2025-1-7 14:15 来自手机 | 显示全部楼层
nApoleon 发表于 2025-1-7 12:44
老黄:i have a dream,干死Intel和AMD~

为啥不是干死 winsows?
发表于 2025-1-7 14:17 来自手机 | 显示全部楼层
某 ithome


Windows 95彻底改变了计算机行业,它使多媒体服务成为可能,对应用程序的开发方式影响深远。然而,这个计算模型对人工智能来说并不完美。我们的目标是,在未来,让人工智能成为你的助手。
人工智能是在云端构建的,我们的愿景是将它带到任何地方,当然也可以在你的公司中进行部署。英伟达最希望的是将其集成到个人电脑中。因此,如果我们能找到一种方法,使 Windows PC 成为世界级的人工智能平台,那将是非常令人兴奋的。
事实证明,实现这一目标的答案是 Windows WSL 2。WSL 2 将 Windows 和 Linux 无缝结合,运行效果出色,为开发者量身打造。你可以直接访问裸机资源,并且 WSL 2 已经针对云原生应用程序进行了优化,能够实现开箱即用的效果。只要你的计算机能够支持它,而你能够适应这种模式,我们就能提供多种适合的模型,无论是视觉模型、语言模型还是动画、数字人类或人类模型等各种类型的AI模型,都非常适合在你的电脑上运行。你可以轻松下载并使用它们。
因此,我们的重点是将 Windows WSL 2 和 Windows PC 打造成理想的一流平台,并将在未来持续支持和维护这一平台。
发表于 2025-1-7 14:18 来自手机 | 显示全部楼层
allensakura 发表于 2025-1-7 14:08
不用传闻,是真的

那基本就这个形态换发哥上就是了
发表于 2025-1-7 14:25 | 显示全部楼层
wikieden 发表于 2025-1-7 14:01
可以做电视盒子

3000刀的电视盒子,太富了
 楼主| 发表于 2025-1-7 15:03 | 显示全部楼层

黄皮Nvidia五月份出AI迷你“Super”机

zhengxinhn 发表于 2025-1-7 14:25
3000刀的电视盒子,太富了

3000刀是乱说

记得lunar lake两块lpddr5x就128bit了,那么这个就可有512bit,可以干过5070。黄皮称之为“Super”
mpv-shot0038.jpg
mpv-shot0037.jpg
mpv-shot0035.jpg
发表于 2025-1-7 15:08 | 显示全部楼层
simplex 发表于 2025-1-7 15:03
3000刀是乱说

记得lunar lake两块lpddr5x就128bit了,那么这个就可有512bit,可以干过5070。黄皮称之为 ...

是啊,跟M4 max一样8块内存,M4 max就是512bit。128g+4T这个配置如果按苹果的尿性3000刀都算便宜了
发表于 2025-1-7 15:09 | 显示全部楼层
不是x86的 没啥意义
发表于 2025-1-7 15:42 | 显示全部楼层
老黄每过几年就想在CPU上试试水
 楼主| 发表于 2025-1-7 16:00 | 显示全部楼层
本帖最后由 simplex 于 2025-1-7 16:20 编辑

还真的是$3,000起价:Press release: NVIDIA Puts Grace Blackwell on Every Desk and at Every AI Developer's Fingertips
发表于 2025-1-7 16:02 | 显示全部楼层
这玩意儿看起来可以叠叠乐,叠双机可以叠到256G显存,配个专门的swicth叠4层就有512G显存,想想就好玩
发表于 2025-1-9 10:15 来自手机 | 显示全部楼层
zhuifeng88 发表于 2025-1-7 12:48
3000刀起步, 其中一半价格给了400g网卡, 核心性能持平5070, 内存带宽还拉了个大垮 ...

两台就能运行/微调405b规模的大模型,同样配置比两台mbp并联便宜不少,而且并联的网络是双200g,带宽也高于mbp
发表于 2025-1-9 10:35 | 显示全部楼层
simplex 发表于 2025-1-7 13:55
就看价格了。内存要大很多,而且可以两台合着用。起码也有256bit吧?

不考虑x64,应该可以杀strix halo ...

。。。2X的价格  你这是用多少倍的成本 杀strix halo....
发表于 2025-1-9 11:44 | 显示全部楼层
本帖最后由 zhuifeng88 于 2025-1-9 12:01 编辑
StevenG 发表于 2025-1-9 10:15
两台就能运行/微调405b规模的大模型,同样配置比两台mbp并联便宜不少,而且并联的网络是双200g,带宽也高 ...


哪怕抛开速度不谈, 微调两台内存大小也远远不够的, 你不算激活参数, compute buffer, 优化器参数的占用的吗, qlora一般说的"差不多等于模型参数量"的显存占用只是极端粗略的估算, 你实际跑个能用的context length哪怕4096的微调看看比那个估算值高多少倍吧...

而且要是可以抛开速度不谈, 那CPU也可以3000刀这么干, 4/5/6代xeon是真的可以微调, 软件框架不如cuda但也差不多是饭喂到嘴上的程度了, 还比这个更快...

这个东西就纯粹的实验平台不指望实际跑任何东西的, 定位更像是上集群跑之前拿这玩意调通代码, 不用占用贵死人的集群 (或者给不差钱的玩玩, 毕竟m4 max都有人买来顶着那几乎没法用的prefill速度跑推理, 这玩意至少prefill没拉垮到果硅那种程度)
发表于 2025-1-9 13:46 来自手机 | 显示全部楼层
zhuifeng88 发表于 2025-1-9 11:44
哪怕抛开速度不谈, 微调两台内存大小也远远不够的, 你不算激活参数, compute buffer, 优化器参数的占用的 ...

这玩意的优势不就是既能用cuda还能做些实验性的调试嘛,价格还比mbp低,体积轻便,做点小项目还能带到现场显示成果。真正的生产集群跑一次都是w刀起步的成本,这3000刀的投入还不值嘛。。。
发表于 2025-1-9 13:48 来自手机 | 显示全部楼层
pytorch有arm版么
发表于 2025-1-9 13:52 来自手机 | 显示全部楼层
zhuifeng88 发表于 2025-1-7 12:48
3000刀起步, 其中一半价格给了400g网卡, 核心性能持平5070, 内存带宽还拉了个大垮 ...

这个里面塞的是400g nic吗
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2025-4-26 10:21 , Processed in 0.012871 second(s), 6 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表