鸡贼的黄又一次改变了ai算力基准
今天老黄的50系,拼凑了一下规格因为众所周知的原因,以日文版为基础,添加了特别版
50系的计算标准应该又变了
爬了一下老黄的nvidia-ada-gpu-architecture.pdf,拼凑了一张老图
根据上面4090和3090ti 的算力,摘取了符合数字的项目
两张图结合看
3090ti 的ai算力,应该是Peak FP16 Tensor TFLOPS with FP16 Accumulate
4090的ai算力,应该是Peak FP8 Tensor TFLOPS with FP16 Accumulate
而3090ti和4090都支持INT4/8,而且算力超出了nv规格,故确定这2个算力并不是老黄的标准
所以50系看上去翻倍多的ai 算力,推测就是Peak FP4 Tensor TFLOPS with FP16 Accumulate
如果只是FP8或者FP16,则5090和5090D只有4090的127%和90% 还有,从这张规格表看,nvdec更新了,不知道支不支持vvc了 臭打游戏的只关心光栅性能会有多少提升 灵乌路空 发表于 2025-1-7 19:10
臭打游戏的只关心光栅性能会有多少提升
127%[偷笑]
就是+27% aibo 发表于 2025-1-7 19:07
还有,从这张规格表看,nvdec更新了,不知道支不支持vvc了
应该是只升级了H265 10bit 4:2:2的编解码,不过cuda的数量计数标准不是也改过 aibo 发表于 2025-1-7 19:14
127%
就是+27%
5090跑4090的频率不难吧,实际能120t 本帖最后由 atiufo 于 2025-1-7 20:39 编辑
黄氏标准、黄氏对比、黄氏定价三板斧,就问你服不服吧[恶魔] atiufo 发表于 2025-1-7 20:36
黄氏标准、黄氏对比、黄氏定价三板斧,就问你服不服吧
那只能祝黄伟达早日玩成intel,他现在的操作越来越像万年4C时代的intel了。 以前标注算力都是fp32,fp16,现在倒好,int8,int4都来了。 桌面游戏卡,建议把算力砍到底
工作室去买专业卡,别跟臭打游戏的抢玩具
PolyMorph 发表于 2025-1-7 20:33
5090跑4090的频率不难吧,实际能120t
老黄的这些算力都是基于标准boost频率的
所以纯算力,差不多就是30%的样子
但是毕竟5090的带宽大很多,高分辨率下会越战越勇的 solder 发表于 2025-1-7 21:39
桌面游戏卡,建议把算力砍到底
工作室去买专业卡,别跟臭打游戏的抢玩具
...
红脖子论坛在问怎么买便宜的东大5090D了[晕倒] Mratom 发表于 2025-1-7 20:23
应该是只升级了H265 10bit 4:2:2的编解码,不过cuda的数量计数标准不是也改过
wc,如果真的支持422,那倒是意外之喜了
现在无反高质量视频除了raw都是422的,只有牙膏能硬件支持 atiufo 发表于 2025-1-7 20:36
黄氏标准、黄氏对比、黄氏定价三板斧,就问你服不服吧
我只服黄氏股价,5年23倍[再见]
https://p.sda1.dev/21/aa50fc9ff79fbc0fdadd1dd0a0b124f9/image.png fighte97 发表于 2025-1-7 21:46
红脖子论坛在问怎么买便宜的东大5090D了
好家伙倒反天罡 T.JOHN 发表于 2025-1-7 21:50
我只服黄氏股价,5年23倍
在考虑落袋为安了,但是人类能诞生5万亿 甚至10万亿美金市值公司 在资本疯狂推动下 不是不可能。犹豫中 还是贪 腿毛飘飘 发表于 2025-1-7 21:36
以前标注算力都是fp32,fp16,现在倒好,int8,int4都来了。
以前是科学计算,FP32和 FP64 用的多一些。 本帖最后由 PolyMorph 于 2025-1-9 09:33 编辑
ai还是处于人无我有就能收割韭菜阶段,旧款不支持fp4应用场景就少了,新款才有卖点,40系还是挤牙膏了
60系肯定有独占特性 5090是FP4,4090是FP8,下面有写的 PolyMorph 发表于 2025-1-9 09:31
ai还是处于人无我有就能收割韭菜阶段,旧款不支持fp4应用场景就少了,新款才有卖点,40系还是挤牙膏了
60系 ...
你要想想pytorch的fp8加速都没达到100%提速的效果[困惑]现在就推行fp4 本帖最后由 厌夜 于 2025-1-10 02:34 编辑
你这啥显卡?geforce,臭打游戏用的。
而精度越低、速度越快就有利于游戏,因为游戏图像根本就不需要精确,要的是速度,只要没有大的错误,小的误差你肉眼根本识别不了。
咋了,想拿来生产力啊?交钱。 prin 发表于 2025-1-7 08:26
那只能祝黄伟达早日玩成intel,他现在的操作越来越像万年4C时代的intel了。 ...
2年憋出个基本同工艺且能耗比没有提升的芯片,有点那味了 solder 发表于 2025-1-7 08:39
桌面游戏卡,建议把算力砍到底
工作室去买专业卡,别跟臭打游戏的抢玩具
...
砍了算力没有dlss4那真一点都没有能吹的了 看这个表格,唯一的感想就是,5070也太tm辣了。5070ti其实70,5080其实是70ti,5070只能算5060 厌夜 发表于 2025-1-10 02:33
你这啥显卡?geforce,臭打游戏用的。
而精度越低、速度越快就有利于游戏,因为游戏图像根本就不需要精确, ...
AI才需要低精度,游戏渲染自古以来都是fp32。 本帖最后由 Wieso 于 2025-1-9 23:03 编辑
是这样的。我游戏/生产力8/2开,已经在认真在考虑二手4090了,只要价格合适。下面链接文章也是在解析黄氏算力,意思也差不多
https://linux.do/t/topic/331364 ai入门起码int8单精度整数运算算力吧。
页:
[1]