Chiphell - 分享与交流用户体验 › 首页 ›评测› 显卡 › 查看内容

ASUS GTX 680 评测

2012-3-29 16:23| 发布者: nApoleon| 查看: 176395| 评论: 264|原作者: nApoleon|来自: www.chiphell.com

摘要: 在AMD HD7970发布三个月之后,NVIDIA终于拿出了自己基于TSMC 28nm工艺制程的首款桌面新GPU GK104 (研发代号),对于用户而言,HD7970幅度并不大的性能提升以及上市后高高在上零售价格让绝大部分的用户并没有立刻想要更新 ...

GK104架构解析

GTX680的心脏采用了开普勒架构,其设计目标自然是要在前代费米架构的基础上提升性能和性耗比.开普勒架构或多或少的保持了费米架构的基本组件阶层体系,强调快速与并行化的组件负载.如果把这个阶层体系比喻成一个弁当饭盒的话,那么在最上层的则是PCI-E 3.0接口,256-bit位宽的显存接口及一个高度优化的NVIDIA GigaThread引擎.

GK104规格图:

GK104芯片图:

这个GigaThread引擎下面有四个图形处理簇(GPC).每一个GPC都是一个自成体系的GPU次级单位,包含了几乎一切作为一个GPU独立运作所需的组件.每个GPC拥有一个共享资源和两个专有资源.其共享资源是一个光栅引擎,用来处理诸如边缘设置,Z消隐一类的光栅操作;而其专有资源则是两个得到了高度优化的"新一代流处理器X"(SMX),这就是GPU用来做数字运算的资源了,其高度并行化的设计用以满足现今各种大型3D应用的高负荷.

GK104架构图:

GPC规模图:

"SMX"规模图:

每一个SMX也进一步拥有自己的共享资源和专有资源.其共享资源“新一代PolyMorph 2.0引擎”用于处理诸如顶点获取,曲面细分,视角变换,属性设置之类的底层光栅操作.而专有资源则是进行数字运算的地方.四个Warp调度程序用来在192个CUDA核心之间调度指令和数据.每个SMX含有16个被缓存的纹理内存单元.Warp调度程序采用了更为高效的软件预解码算法而提升了发布指令的速度.在着色器的编译阶段,NVIDIA驱动里的着色点编译器就会评估指令流,按需求对指令进行重新排序,并且为硬件提供附加信息.

NVIDIA这次亦带来了另一个创新概念——无绑定纹理.在经典GPU模型里,对于纹理的引用,GPU必须在一个固定尺寸的映射表里面为其分配空间,所以每个着色器在同一时间所能访问的纹理数是有限的,例如在前代费米架构中每个着色器只能同时访问128个纹理.而开普勒架构则是去掉了这个绑定步骤,现在着色器可以直接在内存中引用纹理了,不再需要传统的映射表,因此理论上来说能引用的纹理数不再受限.这样一来,渲染如上图所示的精致场景也成为轻而易举的事情.

NVIDIA这次还引入了一个新的抗锯齿算法叫做TXAA.过去的几年里诞生的一些较新的抗锯齿算法诸如FXAA,SMAA,SRAA之流,都是在提升画质的同时力图降低对性能造成的损耗.这次的TXAA则是更进一步——超越8X MSAA的画质,优于4X MSAA的性能损耗.TXAA结合了硬件多重取样,临时抗锯齿以及定制化抗锯齿.TXAA一共分为两档:TXAA 1拥有8X MSAA的画质和2X MSAA的性能损耗,而TXAA 2则拥有超越了8X MSAA的画质,其性能损耗可比肩4X MSAA.由于低级别的MSAA对于现今的GPU而言已经比较便当,并不会带来太大的性能损失,今次的TXAA可以说是在画质上轻松胜出.不过应用程序和游戏也必须要做专门的优化才能够从TXAA获益,所以NVIDIA的公关部请继续给力吧.我们期待未来的游戏越来越多的支持TXAA.

NVIDIA亦在其驱动控制面板里加入了FXAA的选项,可以在所有游戏中启用,而无需依赖游戏开发者去集成它.

开普勒三大特色的最后一项则是“适应性垂直同步”.此项新功能可以动态的调整帧率上限的锁定,用来保证更加平滑流畅的游戏体验.传统的垂直同步仅仅是在屏幕每次刷新后把每一帧的数据传输过去,这么一来如果GPU对某一帧的渲染耗时超过了屏幕两次刷新时间,那么之前的那一帧画面则会连续停留在屏幕上,相当于瞬时帧率降减半甚至更多,造成所谓的“卡顿”现象.而适应性垂直同步的做法则是动态的调节帧率上线的锁定,用于平滑帧率,减缓卡顿现象.

架构解析翻译自"www.techpowerup.com"基于GTX 680的评测文章,感谢版主voidshatter提供翻译工作.

123 4 5 6 7 8 9 10 / 10 页下一页

本文导航

收藏邀请

发表评论

账号		自动登录	找回密码
密码			加入我们

ASUS GTX 680 评测

本文导航

最新评论

相关分类