找回密码
 加入我们
搜索
      
查看: 20112|回复: 82

[显卡] 英伟达的AI芯片有壁垒吗?

[复制链接]
发表于 2023-5-25 13:32 | 显示全部楼层 |阅读模式
amd和intel能不能很容易的追赶上?
发表于 2023-5-25 13:36 来自手机 | 显示全部楼层
你看看ROCm和PVC是什么逼样不就知道AI都追不上吗
发表于 2023-5-25 13:38 来自手机 | 显示全部楼层
没壁垒,大公司自己造tpu,自己写算法,比如Google fb amazon。只是nv目前提供的硬件算力领先,并且容易采购,行业也以它的硬件进行优化。
通用计算这一块都是开源的,从业者手上最容易拿到的工具是nv显卡,没必要重复造轮子而已

评分

参与人数 2邪恶指数 +10 收起 理由
skanlife + 5
烨庆 + 5 非常赞同

查看全部评分

发表于 2023-5-25 13:56 | 显示全部楼层
壁垒有几种,一是资金,二是市场,三是技术。新入企业更多的障碍是前2个,即市场可不可行,项目能不能持续。
发表于 2023-5-25 14:09 | 显示全部楼层
T.JOHN 发表于 2023-5-25 13:38
没壁垒,大公司自己造tpu,自己写算法,比如Google fb amazon。只是nv目前提供的硬件算力领先,并且容易采 ...

我没记错的话一直延期的Aurora超算,好像是纯i的,目标2 ExaFlops
然后Aurora超算的试验机【Polaris】是AMD EPYC + NVIDIA A100组合体

反观ARM天花板Fugaku,只有第一名Frontier的一半,位列第二
如果把试验机Polaris加进去可能只有第三名

intel有雄心壮志要一口气超越AMD、NVIDIA,但是感觉路还很漫长...
发表于 2023-5-25 14:35 | 显示全部楼层
ljy1414 发表于 2023-5-25 14:09
我没记错的话一直延期的Aurora超算,好像是纯i的,目标2 ExaFlops
然后Aurora超算的试验机【Polaris】是A ...

Aurora 进度拖太久了,目前交付的节点数也不多
https://www.tomshardware.com/new ... inst-nvidia-and-amd
发表于 2023-5-25 14:39 | 显示全部楼层
gtv 发表于 2023-5-25 14:35
Aurora 进度拖太久了,目前交付的节点数也不多
https://www.tomshardware.com/news/intel-delivers-10000- ...

这是我看到的新闻
https://jctechspace.com/index.ph ... or-over-2-exaflops/


Intel 和阿贡国家实验室强调 Aurora 的安装进度、系统规格和早期性能结果:

    Intel 已完成超过 10,000 块刀片的 Aurora 超级电脑的实体交付。
    Aurora 的完整系统使用 HPE Cray EX 超级电脑建造,将有 63,744 颗显示卡和 21,248 颗处理器以及 1,024 个 DAOS 储存节点,并且将利用 HPE Slingshot 高性能以太网网路。
    早期结果显示在实际科学和工程工作负载上的领先性能,与 AMD MI250 显示卡相比,性能提升高达 2 倍,QMPACK 量子机械应用上比 H100 提高 20%,并且近乎线性扩展到数百个节点。
    预计 Aurora 在今年推出时,将提供超过 2 Exaflops 的峰值双精度计算性能。

对于记忆体,Aurora 超级电脑配备了 10.9 PB 的 DDR5 系统 DRAM,藉由处理器达到 1.36 PB HBM 容量,以及 8.16 PB 通过显示卡的 HBM 容量。系统 DRAM 达到峰值频宽为 5.95 PB/s,处理器的 HBM 达到峰值频宽为 30.5 PB/s,而显示卡的 HBM 达到峰值频宽为 208.9 PB/s。对于储存,该系统配备了运行在峰值频宽为 31 TB/s 的 230 PB DAOS 容量,并配置在总共 1024 个节点。
发表于 2023-5-25 14:48 来自手机 | 显示全部楼层
软实力竞争优势。
发表于 2023-5-25 14:51 | 显示全部楼层
T.JOHN 发表于 2023-5-25 13:38
没壁垒,大公司自己造tpu,自己写算法,比如Google fb amazon。只是nv目前提供的硬件算力领先,并且容易采 ...

国内拿不到nvdia显卡可以自己造专门的计算卡吗,
 楼主| 发表于 2023-5-25 14:52 | 显示全部楼层

说具体点,什么软实力,别人做不到吗
发表于 2023-5-25 14:54 来自手机 | 显示全部楼层
marcobai 发表于 2023-5-25 14:52
说具体点,什么软实力,别人做不到吗

社区。只能算竞争优势,不能算壁垒。
发表于 2023-5-25 22:50 | 显示全部楼层
你说技术壁垒的话是没有的。大厂比如亚马逊,谷歌,阿里啥的可以选择自研AI芯片,因为需求量大,自研芯片配合自家算法表现或价格可能更优。
nv的gpu是通用计算芯片,对于没有自研实力中小企业,那就是AI芯片的唯一选择了。
发表于 2023-5-25 23:15 | 显示全部楼层
本帖最后由 赫敏 于 2023-5-25 10:16 编辑
chuxuanax 发表于 2023-5-25 01:51
国内拿不到nvdia显卡可以自己造专门的计算卡吗,


国内计算卡很多的,AI火起来之前就有。但AI算法需要的基本算力迭代也很快的,你看黄卡从10到30这几代增加算力的数据类型就知道了,每代都增加几种精度。一般小公司吃不消这个迭代速度
发表于 2023-5-26 00:14 | 显示全部楼层
你们是真的懂,我一个搞recommend system的都没你们懂

发表于 2023-5-26 01:08 来自手机 | 显示全部楼层
本帖最后由 ysc3839 于 2023-5-26 01:09 编辑

其实很多企业(尤其是中小企业)买NV的卡买的是配套的社区,很多东西AMD的ROCm也能跑,但是配套的东西不足,需要自己实现,但中小企业没这个能力实现,只能选NV。
最近发布的最新一期超算TOP500,排第一和第三的用的都是AMD的计算卡,起码说明AMD是能用的。

不过Intel估计是很难赶上了,主流AI框架,除了CUDA基本就只支持ROCm了。
发表于 2023-5-26 01:45 来自手机 | 显示全部楼层
garfield0018 发表于 2023-5-25 22:50
你说技术壁垒的话是没有的。大厂比如亚马逊,谷歌,阿里啥的可以选择自研AI芯片,因为需求量大,自研芯片配 ...

所以我不明白那么人吹捧nv,每个大厂都有自己的计算卡,热点无非是chat**用了nv的集群而已,对于大厂来说架构和硬件会很快更新,只不过是自用格式无法通用而已,至于效率和准确性就是另外说了,nv提供了中小厂商通用版本。其实看Google和fc和微软和亚马逊是否将计算集群全换成nv计算卡就知道了。这永远不会发生的。。。
发表于 2023-5-26 01:59 | 显示全部楼层
芝士雪豹 发表于 2023-5-26 00:14
你们是真的懂,我一个搞recommend system的都没你们懂

我都不知道他们在说什么 我身边的所有实验组清一水用nv卡做ai相关项目 猜猜这帮博士研究生毕业以后工作用啥卡
发表于 2023-5-26 02:00 来自手机 | 显示全部楼层
nv的生态久经考验,pytorch下面几乎所有模型都是用nv的显卡开发的。那么请问有人要学dl,应该买什么卡?只有个别google的模型是用tpu,只能上google cloud。

但另一方面,现在nv的高价意味着下一代人工智能很可能不会在nv的生态上开发。但等开发出来,老黄可能早就百年以后了。
发表于 2023-5-26 02:11 来自手机 | 显示全部楼层
另外提一句,国内的计算卡多架构多类型的各种构型卡非常多,不说华为阿里腾讯和百度这些了。省级各种智算库。。。有很多类型的在跑的,中国几个超亿亿的超算的计算机就是全自研的。。由于制裁不公开而已。国内的计算卡在超多的智能赛道上奔驰呢。如果说美国智能赛道有50条。兔子现在运行的各种不同赛道的起码3-400条。因为有超大的用户数据来训练,就是制程落后几代,慢点,耗电量高,但通过架构和调优,计算卡在和nv比,差距不算大。就是吃了制程的亏,那相应的流片也便宜很多,如果不是制裁,早就井喷了。
发表于 2023-5-26 05:42 | 显示全部楼层
你们找投资人可以这么吹吹,没啥技术壁垒,都可以做出来的。

投资芯片投资算力,不投资"人"么?
发表于 2023-5-26 05:54 | 显示全部楼层
其他先不说,国内海光的DCU用肯定能用,就是好不好用的问题。

至于说学校研究用NV所以人毕业了到产业上也会用NV,这就很不可能了。曾经NV在自动驾驶领域具有霸主地位,特斯拉都使用NV的解决方案,但现在呢?
发表于 2023-5-26 06:14 | 显示全部楼层
ljy1414 发表于 2023-5-25 14:09
我没记错的话一直延期的Aurora超算,好像是纯i的,目标2 ExaFlops
然后Aurora超算的试验机【Polaris】是A ...

Aurora 超算已经研制成功了,是 200亿亿次运算。
发表于 2023-5-26 08:38 | 显示全部楼层
SupremeMiner 发表于 2023-5-26 01:59
我都不知道他们在说什么 我身边的所有实验组清一水用nv卡做ai相关项目 猜猜这帮博士研究生毕业以后工作用 ...

明白人,理论上可以重复造轮子,实际上根本没那个经费和时间。粗大生态十多年的巨额投入,就是真正的壁垒。
发表于 2023-5-26 08:41 | 显示全部楼层
用户 发表于 2023-5-26 02:00
nv的生态久经考验,pytorch下面几乎所有模型都是用nv的显卡开发的。那么请问有人要学dl,应该买什么卡?只 ...

NV能卖高价,恰恰说明这个东西有壁垒。当然这个壁垒假以时日可能会被削弱。
发表于 2023-5-26 08:42 | 显示全部楼层
要是没有壁垒,怕是不能一晚上涨出一个intel来。

只是这么大个蛋糕,愿意发力的人开始冒头了,看看未来会怎么样吧,不管是游戏还是专业应用,不希望NV一家独大。
发表于 2023-5-26 08:52 | 显示全部楼层
苹果就一个臭手机的,有啥壁垒啊,谁都能造啊,国内一大堆手机厂。
最重要的生态啊,生态啊!这个搞不来啊。
英伟达也一样啊。
发表于 2023-5-26 09:02 | 显示全部楼层
本帖最后由 SupremeMiner 于 2023-5-26 09:28 编辑
Neo_Granzon 发表于 2023-5-26 08:38
明白人,理论上可以重复造轮子,实际上根本没那个经费和时间。粗大生态十多年的巨额投入,就是真正的壁垒 ...


真的有人对ai一知半解就天天指点江山 虽然我做的是机器人 但身边做ml的都是一水的n卡 论文用的也是n卡 开源也是针对n卡 同样的model n卡上来就跑 别的调半天也跑不了 这都不是壁垒 我不知道啥是壁垒 真以为实验室的会写轮子啊 为了不写轮子 我这台跑机器人的电脑现在还在用ubuntu 20.04

最后补充一下 我做机器人的用的也是n卡 没办法 n卡对ubuntu和机器人simulator的兼容就是最好的

(叠个甲 虽然我是做机器人的博士 但是我也没办法洞悉整个ai行业 只能从自己专业的角度给出观点)
发表于 2023-5-26 09:19 | 显示全部楼层
liu3yang3715 发表于 2023-5-26 08:42
要是没有壁垒,怕是不能一晚上涨出一个intel来。

只是这么大个蛋糕,愿意发力的人开始冒头了,看看未来会 ...

INTEL总市值1143亿,NV 25日涨了25%,市值增长差不多2000亿。。。。
不但一个晚上涨了一个INTEL出来,还多长了快1个。。。
发表于 2023-5-26 09:37 | 显示全部楼层
chuxuanax 发表于 2023-5-25 14:51
国内拿不到nvdia显卡可以自己造专门的计算卡吗,

壁仞科技BR100,公司2019年成立,2022年发布的BR100等同于NV A100/H100。公司“内斗”结果是不做GPU,只做GPGPU,否则你有可能看到4090级别的国产显卡了

华尔街日报报道:https://www.wsj.com/video/china/ ... D-7DB78E07AE65.html
公司“内斗”报道:https://tech.ifeng.com/c/8OUYniYarIh

评分

参与人数 1邪恶指数 +10 收起 理由
solder + 10 真相比任何人的嘴炮都有价值

查看全部评分

发表于 2023-5-26 09:53 | 显示全部楼层
NV的先发优势和软件生态优势非常大。
尤其大学学AI的  大部分都是N卡。

您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2025-4-27 08:30 , Processed in 0.015631 second(s), 10 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表