找回密码
 加入我们
搜索
      
查看: 4871|回复: 26

[显卡] 鸡贼的黄又一次改变了ai算力基准

[复制链接]
发表于 2025-1-7 19:04 | 显示全部楼层 |阅读模式
今天老黄的50系,拼凑了一下规格
因为众所周知的原因,以日文版为基础,添加了特别版
1.jpg

50系的计算标准应该又变了
爬了一下老黄的nvidia-ada-gpu-architecture.pdf,拼凑了一张老图
根据上面4090和3090ti 的算力,摘取了符合数字的项目
2.jpg

两张图结合看
3090ti 的ai算力,应该是Peak FP16 Tensor TFLOPS with FP16 Accumulate
4090的ai算力,应该是Peak FP8 Tensor TFLOPS with FP16 Accumulate
而3090ti和4090都支持INT4/8,而且算力超出了nv规格,故确定这2个算力并不是老黄的标准
所以50系看上去翻倍多的ai 算力,推测就是Peak FP4 Tensor TFLOPS with FP16 Accumulate

如果只是FP8或者FP16,则5090和5090D只有4090的127%和90%
 楼主| 发表于 2025-1-7 19:07 | 显示全部楼层
还有,从这张规格表看,nvdec更新了,不知道支不支持vvc了
发表于 2025-1-7 19:10 | 显示全部楼层
臭打游戏的只关心光栅性能会有多少提升
 楼主| 发表于 2025-1-7 19:14 | 显示全部楼层
灵乌路空 发表于 2025-1-7 19:10
臭打游戏的只关心光栅性能会有多少提升


127%

就是+27%
发表于 2025-1-7 20:23 | 显示全部楼层
aibo 发表于 2025-1-7 19:07
还有,从这张规格表看,nvdec更新了,不知道支不支持vvc了

应该是只升级了H265 10bit 4:2:2的编解码,不过cuda的数量计数标准不是也改过
发表于 2025-1-7 20:33 | 显示全部楼层


5090跑4090的频率不难吧,实际能120t
发表于 2025-1-7 20:36 | 显示全部楼层
本帖最后由 atiufo 于 2025-1-7 20:39 编辑

黄氏标准、黄氏对比、黄氏定价三板斧,就问你服不服吧
发表于 2025-1-7 21:26 | 显示全部楼层
atiufo 发表于 2025-1-7 20:36
黄氏标准、黄氏对比、黄氏定价三板斧,就问你服不服吧

那只能祝黄伟达早日玩成intel,他现在的操作越来越像万年4C时代的intel了。
发表于 2025-1-7 21:36 | 显示全部楼层
以前标注算力都是fp32,fp16,现在倒好,int8,int4都来了。
发表于 2025-1-7 21:39 来自手机 | 显示全部楼层
桌面游戏卡,建议把算力砍到底
工作室去买专业卡,别跟臭打游戏的抢玩具

评分

参与人数 1邪恶指数 +5 收起 理由
老湿真辛苦 + 5 +10086

查看全部评分

 楼主| 发表于 2025-1-7 21:45 | 显示全部楼层
PolyMorph 发表于 2025-1-7 20:33
5090跑4090的频率不难吧,实际能120t

老黄的这些算力都是基于标准boost频率的
所以纯算力,差不多就是30%的样子

但是毕竟5090的带宽大很多,高分辨率下会越战越勇的
发表于 2025-1-7 21:46 | 显示全部楼层
solder 发表于 2025-1-7 21:39
桌面游戏卡,建议把算力砍到底
工作室去买专业卡,别跟臭打游戏的抢玩具
...

红脖子论坛在问怎么买便宜的东大5090D了
 楼主| 发表于 2025-1-7 21:46 | 显示全部楼层
Mratom 发表于 2025-1-7 20:23
应该是只升级了H265 10bit 4:2:2的编解码,不过cuda的数量计数标准不是也改过

wc,如果真的支持422,那倒是意外之喜了

现在无反高质量视频除了raw都是422的,只有牙膏能硬件支持
发表于 2025-1-7 21:50 | 显示全部楼层
atiufo 发表于 2025-1-7 20:36
黄氏标准、黄氏对比、黄氏定价三板斧,就问你服不服吧

我只服黄氏股价,5年23倍
发表于 2025-1-7 21:52 来自手机 | 显示全部楼层
fighte97 发表于 2025-1-7 21:46
红脖子论坛在问怎么买便宜的东大5090D了

好家伙倒反天罡
发表于 2025-1-8 17:07 | 显示全部楼层
T.JOHN 发表于 2025-1-7 21:50
我只服黄氏股价,5年23倍

在考虑落袋为安了,但是人类能诞生5万亿 甚至10万亿美金市值公司 在资本疯狂推动下 不是不可能。犹豫中 还是贪
发表于 2025-1-9 09:15 | 显示全部楼层
腿毛飘飘 发表于 2025-1-7 21:36
以前标注算力都是fp32,fp16,现在倒好,int8,int4都来了。

以前是科学计算,FP32和 FP64 用的多一些。
发表于 2025-1-9 09:31 | 显示全部楼层
本帖最后由 PolyMorph 于 2025-1-9 09:33 编辑

ai还是处于人无我有就能收割韭菜阶段,旧款不支持fp4应用场景就少了,新款才有卖点,40系还是挤牙膏了
60系肯定有独占特性
发表于 2025-1-9 09:34 | 显示全部楼层
5090是FP4,4090是FP8,下面有写的
发表于 2025-1-10 02:15 | 显示全部楼层
PolyMorph 发表于 2025-1-9 09:31
ai还是处于人无我有就能收割韭菜阶段,旧款不支持fp4应用场景就少了,新款才有卖点,40系还是挤牙膏了
60系 ...

你要想想pytorch的fp8加速都没达到100%提速的效果现在就推行fp4
发表于 2025-1-10 02:33 | 显示全部楼层
本帖最后由 厌夜 于 2025-1-10 02:34 编辑

你这啥显卡?geforce,臭打游戏用的。
而精度越低、速度越快就有利于游戏,因为游戏图像根本就不需要精确,要的是速度,只要没有大的错误,小的误差你肉眼根本识别不了。

咋了,想拿来生产力啊?交钱。
发表于 2025-1-10 02:34 | 显示全部楼层
prin 发表于 2025-1-7 08:26
那只能祝黄伟达早日玩成intel,他现在的操作越来越像万年4C时代的intel了。 ...

2年憋出个基本同工艺且能耗比没有提升的芯片,有点那味了
发表于 2025-1-10 02:35 | 显示全部楼层
solder 发表于 2025-1-7 08:39
桌面游戏卡,建议把算力砍到底
工作室去买专业卡,别跟臭打游戏的抢玩具
...

砍了算力没有dlss4那真一点都没有能吹的了
发表于 2025-1-10 02:42 | 显示全部楼层
看这个表格,唯一的感想就是,5070也太tm辣了。5070ti其实70,5080其实是70ti,5070只能算5060
发表于 2025-1-10 03:28 | 显示全部楼层
厌夜 发表于 2025-1-10 02:33
你这啥显卡?geforce,臭打游戏用的。
而精度越低、速度越快就有利于游戏,因为游戏图像根本就不需要精确, ...

AI才需要低精度,游戏渲染自古以来都是fp32。
发表于 2025-1-10 06:01 | 显示全部楼层
本帖最后由 Wieso 于 2025-1-9 23:03 编辑

是这样的。我游戏/生产力8/2开,已经在认真在考虑二手4090了,只要价格合适。下面链接文章也是在解析黄氏算力,意思也差不多

https://linux.do/t/topic/331364
发表于 2025-1-10 07:03 来自手机 | 显示全部楼层
ai入门起码int8  单精度整数运算算力吧。
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2025-4-26 17:52 , Processed in 0.015091 second(s), 7 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表