找回密码
 加入我们
搜索
      
查看: 6327|回复: 57

[显卡] 读了下blackwell白皮书,一句话dlss mfg战未来,6080可能干不过4090

[复制链接]
发表于 2025-2-1 21:33 | 显示全部楼层 |阅读模式
本帖最后由 T.JOHN 于 2025-2-2 19:10 编辑

微联动 《没制程红利,硬堆规模,功耗换性能,难道就光靠DLSS?》,不幸言中,老黄是真想着靠dlss mfg战未来。只不过这次把"重构"+"补帧"这两个后处理ai化后,他准备把前处理"着色"+"光追"也ai化。当然别人也是有理论依据和技术支持的,我给大家来个白话文版本。

第5,6页,介绍key feature中,最重要的也是第一个是New SM features built for Neural Shading,后面我也只介绍这个大饼怎么回事。

其他我先一笔带过
key feautre4. 5th tensor core支持FP4大家已经知道了。但除此之外还支持FP6和第二代FP8,FP6还是有点用的,有6bit量化的模型。
key feature5. dlss4支持mfg和tranformer大家也已经知道了。

一句话总结:以后是AI的世界,我不堆传统性能了,我就堆AI帧生成性能。怎么做?参考如下
1. 把FP32单元改成INT32/FP32,直接统一所有单元,目的增强神经着色器,同时传统性能0提升。以下原文
Ada SM was designed & optimized for standard shaders. Blackwell SM was designed & optimized for neural shaders.

2. 我黄这里开始回顾历史,科普技术,创造未来了

    1. 2000s之前,GF2及其之前,不可编程着色器
    2. 2000s,DX8.0 GF3引入可编程着色器
    3. 2000s早期,DX9.0 HLSL允许像素着色器
    4. 2006,DX10统一着色构架
    5. 2006,DX10引入几何着色器
    6. 2009,DX11引入计算着色器
    7. 2018-2020,DX12U/Vulkan引入原始和网格着色器
    8. 2018,DXR 使用BVH提供光追功能,然后进行着色
    9. 2025,神经着色器(统一人工智能和传统着色器)

现在我们拿着blackwell,走进新时代。原文如下
随着 Blackwell 的发布,我们迎来了开发人员创建神经着色器的时代,其中一些神经着色器也可以在上一代 GPU 上运行。神经着色器是可编程着色的下一个演进步骤。开发人员不需要编写复杂的着色器代码来描述这些功能,而是训练人工智能模型来接近着色器代码计算出的结果。神经着色器将成为游戏中最主要的着色器形式,未来所有游戏都将使用人工智能技术进行渲染。

评论:你直接说将mfg进行到底就行了,不用说那么多
3. tensor core将不仅限于支持dlss,并且开始支持RTX光追技术,即RTX 神经材质、神经焕彩缓存、RTX 皮肤和 RTX 神经面孔等其他技术( RTX Neural Materials, Neural Radiance Cache, RTX Skin, and RTX Neural Faces)。
评论:现在RTX也能AI生成了,你满意了吗?

重点补丁:
The potential applications for neural shaders are not yet fully explored, which means more exciting features for faster and more realistic (or stylized) real-time rendering lie ahead.

神经着色器的潜在应用尚未得到充分开发,这意味着更快、更逼真(或风格化)的实时渲染功能还在前方
AI graphics with neural filtering features and AI models including generative AI can be run concurrently in next-generation games.

具有神经过滤功能的人工智能图形和包括生成式人工智能在内的人工智能模型可在下一代游戏中同时运行。

我黄自20系后再次开创新赛道。请跟我学,大声喊出来:NVIDIA,神经着色战未来!ENjoy

  • 现在压力给到游戏厂商了,如果你们以后支持不好netural shading,我黄卡卖不动,为你们试问!
  • 2026年,6080的8倍MFG板上定钉,那么6080传统性能恐不及4090亦大有可能


补充下23楼PPT


忘了补上原文链接:https://images.nvidia.com/aem-da ... pu-architecture.pdf
发表于 2025-2-3 17:58 来自手机 | 显示全部楼层
wjm47196 发表于 2025-2-3 17:04
吊起来打?还好我没失忆,同档次的卡老黄哪个dx12和vulkan吊起来打按摩店的?
按摩店作为芯片供应商除了 ...

另外哥们,我没记错的话,xb1是2013.11.22发售,dx12是2014q3发布,按照正常开发流程2年可别说2011年开发者就拿到馒头和dx12咯哦,事实上第一款xb1的dx12游戏星战前线是在gdc2016上才宣布的……可别说之前都是拿馒头开发的哦
发表于 2025-2-3 17:47 来自手机 | 显示全部楼层
wjm47196 发表于 2025-2-3 17:04
吊起来打?还好我没失忆,同档次的卡老黄哪个dx12和vulkan吊起来打按摩店的?
按摩店作为芯片供应商除了 ...

啊,第一代纯dx12架构大funnyx被980ti揍的跟孙子似的不说了嘛,转总为这事被喷了好几年呢……之后vega64 交朋友7哪代不是被按着打?rdna1干脆就没胆子出旗舰卡,也间接造成20系跟50系一样拉胯(也许50系更拉胯一点)总不能自家旗舰跟对面老二老三打的有来有回也算赢吧……
发表于 2025-2-3 17:04 来自手机 | 显示全部楼层
本帖最后由 wjm47196 于 2025-2-3 17:07 编辑
pingji 发表于 2025-2-3 17:00
结果竞争对手同期跑这个标准把你吊起来打对吧……这不更证明这项目彻底失败了嘛……另外巨硬大法用AMD的 ...


吊起来打?还好我没失忆,同档次的卡老黄哪个dx12和vulkan吊起来打按摩店的?
按摩店作为芯片供应商除了便宜还要开发软件的,没有mantle主机厂再便宜也不会要,只不过按摩店把api拿来丢pc上了,后面形成了事实上dx12和vulkan的标准,就跟switch用老黄芯片老黄也得开发个nvapi给任地狱用。
发表于 2025-2-3 17:00 来自手机 | 显示全部楼层
wjm47196 发表于 2025-2-3 16:55
你真的幽默,dx12和vulkan不是事实上的标准?没有标准巨硬大法会持续打钱买按摩店芯片? ...

结果竞争对手同期跑这个标准把你吊起来打对吧……这不更证明这项目彻底失败了嘛……另外巨硬大法用AMD的唯一理由真就是因为amd便宜……又不是没跟nv谈过,黄皮子要价太高根本就谈不拢,莫非你想让他们去用价格更贵的牢英?
发表于 2025-2-3 16:55 | 显示全部楼层
pingji 发表于 2025-2-3 16:51
开发馒头的人力物力又不是天上掉下来的,最后对于a卡无论是销量还是市占率有过什么正面影响吗?甚至在号 ...

你真的幽默,dx12和vulkan不是事实上的标准?没有标准巨硬大法会持续打钱买按摩店芯片?
发表于 2025-2-3 16:51 来自手机 | 显示全部楼层
wjm47196 发表于 2025-2-3 16:44
哪里亏了一大票?真的幽默

开发馒头的人力物力又不是天上掉下来的,最后对于a卡无论是销量还是市占率有过什么正面影响吗?甚至在号称全面吸收了馒头的vulcan和dx12上都没胜过n卡,所以花这个钱到底在干什么……商业公司的项目投入大于产出不是2b是啥
发表于 2025-2-3 16:44 | 显示全部楼层
pingji 发表于 2025-2-3 16:35
开源不是2b,但是作为商业公司做的这个事那就是2b,投入不仅没产出还亏了一大票 ...

哪里亏了一大票?真的幽默
发表于 2025-2-3 16:35 来自手机 | 显示全部楼层
wjm47196 发表于 2025-2-3 13:39
你的意思是开源都是2b?

开源不是2b,但是作为商业公司做的这个事那就是2b,投入不仅没产出还亏了一大票
发表于 2025-2-3 15:50 来自手机 | 显示全部楼层
让世界拥抱新技术。成了就是黄神,没成就是路边一条黄狗
发表于 2025-2-3 15:27 | 显示全部楼层
本帖最后由 声色茶马 于 2025-2-3 15:28 编辑

有几个想法:
1. 是不是明说:臭打游戏的们凑合凑合得了,以后力量主要用在AI计算那边儿,的意思?
2. AI那边会不会也是:追随Deepseek思路,在现有水平上进行深度优化,而不继续力大砖飞?
3. 以上是不是本质上都是因为:某积电真撑不住了。一顿ppt猛如虎,一顿设计恶似狼,但制程不革命终归还是小绵羊。
发表于 2025-2-3 13:53 | 显示全部楼层
terryhux 发表于 2025-2-2 13:20
以后不用DLSS和FG的高玩们,就告别3A大作和8K分辨率了

NVLINK SLI
发表于 2025-2-3 13:39 来自手机 | 显示全部楼层
pingji 发表于 2025-2-2 22:45
然后馒头投入人力物力自己没了,对对手也没什么优势……这不2b嘛

你的意思是开源都是2b?
发表于 2025-2-3 13:19 | 显示全部楼层
其实逻辑也好理解...就像现在DS 一样,如果受众能接受当前的结果,我就蒸馏大模型而不去堆算力了。毕竟对cup来说,制程和物理极限在这,堆规模也好还是工艺提升也好,收益太低了,有现成的便宜,即使明眼人都明白真光追一定更好,最终还是这种便宜的次好要成为主流。目前看来未来还是拼夕夕(思路)的世界
发表于 2025-2-3 12:36 | 显示全部楼层
SkyGZO 发表于 2025-2-2 00:10
那你知道CPU的分支预测用了多少年了么。。。

胡言乱语。cpu的投机执行有rollback的,ai渲染来个rollback看看
发表于 2025-2-2 22:47 来自手机 | 显示全部楼层
ts02147823 发表于 2025-2-2 19:04
说一堆废话

就问你8年前想过intel现在要卖大楼了吗

哥们8年耶,有人1937年想过1945对小日本的全面胜利嘛
发表于 2025-2-2 22:45 来自手机 | 显示全部楼层
wjm47196 发表于 2025-2-2 00:59
有mantle才有dx12和vulkan好吧

然后馒头投入人力物力自己没了,对对手也没什么优势……这不2b嘛
发表于 2025-2-2 21:16 来自手机 | 显示全部楼层
感觉nerf这种渲染模式还行啊
发表于 2025-2-2 20:00 | 显示全部楼层
ts02147823 发表于 2025-2-2 19:04
说一堆废话

就问你8年前想过intel现在要卖大楼了吗

8年还不长啊?
pcdiy一共才几个8年啊就这么狂
更何况死的几位行业大哥基本上都是自己作死的有问题吗?
我说“突然有一家企业发力偷袭老黄,老黄会死的很难看”这句话不现实还不如指望老黄自爆
有问题吗?
8年前amd都会堆规模找平差距怎么现在大家都不会堆规模打赢老黄了啊?
这行业就没有什么突然的说法。
发表于 2025-2-2 19:04 | 显示全部楼层
fgfdhgg 发表于 2025-2-2 18:45
那你要不要看看zen系列真正翻盘用了多久?
从1000到现在都八年了。
这还是英特尔自己被自己卡了脖子,到 ...

说一堆废话

就问你8年前想过intel现在要卖大楼了吗

发表于 2025-2-2 18:58 | 显示全部楼层
SkyGZO 发表于 2025-2-2 00:10
那你知道CPU的分支预测用了多少年了么。。。

分支预测原则上只影响效率不影响结果。
发表于 2025-2-2 18:45 | 显示全部楼层
zhaofire 发表于 2025-2-2 18:23
AMD还在推土机的时候,intel的4核8线牙膏碾压对手的时候,一堆人也和你一样的想法 ...

那你要不要看看zen系列真正翻盘用了多久?
从1000到现在都八年了。
这还是英特尔自己被自己卡了脖子,到现在intel大楼倒塌的主要贡献者到底是AMD还是intel自己还不好说呢。
英特尔被制程卡脖子的时候amd可没被卡过。
老黄等被制程卡脖子的时候amd也得憋着。
拼制程拼不过,堆规模堆不过,搞软件搞不过。
指望有人横空出世还是指望老黄自己自爆吧
发表于 2025-2-2 18:23 | 显示全部楼层
fgfdhgg 发表于 2025-2-2 17:47
有能力偷袭的不就A和I?你看这俩长得像能偷袭的吗?
AMD连起名都要硬蹭友商的玩意信他不如信我是秦始皇。 ...

AMD还在推土机的时候,intel的4核8线牙膏碾压对手的时候,一堆人也和你一样的想法
发表于 2025-2-2 17:47 | 显示全部楼层
zhaofire 发表于 2025-2-2 14:46
解释下意思就是,老黄的硬件技术已经到了瓶颈。
如果这个时候某个友商(就像deepseek一样)突然发力来个偷 ...

有能力偷袭的不就A和I?你看这俩长得像能偷袭的吗?
AMD连起名都要硬蹭友商的玩意信他不如信我是秦始皇。
Intel那就更搞笑了,先把命保住再说吧。
其他的公司?有大把赚钱的生意不去,跑到一个红海小众市场抢生意,那是真有钱没地方花了。
Deepseek公开迭代还有好几代呢
发表于 2025-2-2 17:41 | 显示全部楼层
Penguindad 发表于 2025-2-2 17:25
不反对dlss mfg,但是50系作为第一个吃螃蟹的,可能会面临20系的窘境,首发既要顶着新技术的高溢价又缺游戏 ...

另外微软已经官宣DX即将支持cooperative vectors,为Tensor Core加速Neural Rendering,DX跟自家的XBOX之间的图形技术联动就不必多说了,下一代XBOX说不定也会支持
发表于 2025-2-2 17:34 | 显示全部楼层
Penguindad 发表于 2025-2-2 17:25
不反对dlss mfg,但是50系作为第一个吃螃蟹的,可能会面临20系的窘境,首发既要顶着新技术的高溢价又缺游戏 ...

你忘记PS半代更新的惯例了么,从PS5支持RT到PS5 Pro支持PSSR,那么PS6大概率支持更好的PSSR+帧生成,PS6 Pro支持Neural Rendering也不是什么稀奇事
发表于 2025-2-2 17:25 | 显示全部楼层
不反对dlss mfg,但是50系作为第一个吃螃蟹的,可能会面临20系的窘境,首发既要顶着新技术的高溢价又缺游戏,等大家都支持了已经更新过好几代了。另外这个点已有传言PS6芯片年底流片,搞不好赶不上这个神经着色,一旦错过意味着下个世代整整8年里神经着色都没办法成为主流,那就要等10年后再见了
发表于 2025-2-2 14:52 来自手机 | 显示全部楼层
本帖最后由 zhuifeng88 于 2025-2-2 15:00 编辑
fdhfdhd 发表于 2025-2-1 23:10
我脑袋里贫瘠的图形学知识只能让我理解顶点着色和像素着色是让哪里根据什么条件显示什么颜色
这神经着色器 ...


要是传统流是完美的那能这么说 但是传统流本来就是做了很多取舍的东西,你色散呢,你衍射呢
ai蒙的这方面也许不对但也可以不是完全没有

不至于拿充斥着错误的传统流五十步笑百步...
发表于 2025-2-2 14:50 | 显示全部楼层
N3B/P加上新架构4年磨一剑,,6080还打不过4090,就地入土吧
发表于 2025-2-2 14:46 | 显示全部楼层
解释下意思就是,老黄的硬件技术已经到了瓶颈。
如果这个时候某个友商(就像deepseek一样)突然发力来个偷袭,老黄将死得非常难看。
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2025-4-26 09:39 , Processed in 0.014068 second(s), 6 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表