找回密码
 加入我们
搜索
      

ASUS GTX 680 评测

2012-3-29 16:23| 发布者: nApoleon| 查看: 176395| 评论: 264|原作者: nApoleon|来自: www.chiphell.com

摘要: 在AMD HD7970发布三个月之后,NVIDIA终于拿出了自己基于TSMC 28nm工艺制程的首款桌面新GPU GK104 (研发代号),对于用户而言,HD7970幅度并不大的性能提升以及上市后高高在上零售价格让绝大部分的用户并没有立刻想要更新 ...
GK104架构解析

        GTX680的心脏采用了开普勒架构,其设计目标自然是要在前代费米架构的基础上提升性能和性耗比.开普勒架构或多或少的保持了费米架构的基本组件阶层体系,强调快速与并行化的组件负载.如果把这个阶层体系比喻成一个弁当饭盒的话,那么在最上层的则是PCI-E 3.0接口,256-bit位宽的显存接口及一个高度优化的NVIDIA GigaThread引擎.


GK104规格图:


GK104芯片图:


        这个GigaThread引擎下面有四个图形处理簇(GPC).每一个GPC都是一个自成体系的GPU次级单位,包含了几乎一切作为一个GPU独立运作所需的组件.每个GPC拥有一个共享资源和两个专有资源.其共享资源是一个光栅引擎,用来处理诸如边缘设置,Z消隐一类的光栅操作;而其专有资源则是两个得到了高度优化的"新一代流处理器X"(SMX),这就是GPU用来做数字运算的资源了,其高度并行化的设计用以满足现今各种大型3D应用的高负荷.


GK104架构图:


GPC规模图:


"SMX"规模图:


        每一个SMX也进一步拥有自己的共享资源和专有资源.其共享资源“新一代PolyMorph 2.0引擎”用于处理诸如顶点获取,曲面细分,视角变换,属性设置之类的底层光栅操作.而专有资源则是进行数字运算的地方.四个Warp调度程序用来在192个CUDA核心之间调度指令和数据.每个SMX含有16个被缓存的纹理内存单元.Warp调度程序采用了更为高效的软件预解码算法而提升了发布指令的速度.在着色器的编译阶段,NVIDIA驱动里的着色点编译器就会评估指令流,按需求对指令进行重新排序,并且为硬件提供附加信息.



        NVIDIA这次亦带来了另一个创新概念——无绑定纹理.在经典GPU模型里,对于纹理的引用,GPU必须在一个固定尺寸的映射表里面为其分配空间,所以每个着色器在同一时间所能访问的纹理数是有限的,例如在前代费米架构中每个着色器只能同时访问128个纹理.而开普勒架构则是去掉了这个绑定步骤,现在着色器可以直接在内存中引用纹理了,不再需要传统的映射表,因此理论上来说能引用的纹理数不再受限.这样一来,渲染如上图所示的精致场景也成为轻而易举的事情.




        NVIDIA这次还引入了一个新的抗锯齿算法叫做TXAA.过去的几年里诞生的一些较新的抗锯齿算法诸如FXAA,SMAA,SRAA之流,都是在提升画质的同时力图降低对性能造成的损耗.这次的TXAA则是更进一步——超越8X MSAA的画质,优于4X MSAA的性能损耗.TXAA结合了硬件多重取样,临时抗锯齿以及定制化抗锯齿.TXAA一共分为两档:TXAA 1拥有8X MSAA的画质和2X MSAA的性能损耗,而TXAA 2则拥有超越了8X MSAA的画质,其性能损耗可比肩4X MSAA.由于低级别的MSAA对于现今的GPU而言已经比较便当,并不会带来太大的性能损失,今次的TXAA可以说是在画质上轻松胜出.不过应用程序和游戏也必须要做专门的优化才能够从TXAA获益,所以NVIDIA的公关部请继续给力吧.我们期待未来的游戏越来越多的支持TXAA.




        NVIDIA亦在其驱动控制面板里加入了FXAA的选项,可以在所有游戏中启用,而无需依赖游戏开发者去集成它.


        开普勒三大特色的最后一项则是“适应性垂直同步”.此项新功能可以动态的调整帧率上限的锁定,用来保证更加平滑流畅的游戏体验.传统的垂直同步仅仅是在屏幕每次刷新后把每一帧的数据传输过去,这么一来如果GPU对某一帧的渲染耗时超过了屏幕两次刷新时间,那么之前的那一帧画面则会连续停留在屏幕上,相当于瞬时帧率降减半甚至更多,造成所谓的“卡顿”现象.而适应性垂直同步的做法则是动态的调节帧率上线的锁定,用于平滑帧率,减缓卡顿现象.




架构解析翻译自"www.techpowerup.com"基于GTX 680的评测文章,感谢版主voidshatter提供翻译工作.

发表评论

最新评论

引用 Chhsimon 2013-1-4 23:17
明白。谢谢仑大的分析!
引用 jjyygsm 2012-8-8 01:53
华硕还是不错的
引用 天堂农民 2012-6-2 23:02
能不能不计算全面战争的分值,然后统计一个比分出来啊?
引用 新生无产者 2012-4-24 16:36
chendi83: 性能完全就死不够,680强不到哪去!一块1700左右的卡卖到4K,真是够坑爹! 看看跑地铁2033就知道680什么性能了,游戏根本是毫无提升!地铁2033能上60帧的卡再说 ...
我们可以逞口舌之快,A枪也可以找到黑NV的地方,但是NV这次用小核心就干了AMD的旗舰.而上一代580已经领先6970很多,这次直接是甜点级芯片赢了旗舰,我们大可以骂NV,大可以不买680,但是NV的策略明显成功的!低成本,高利润,,爽的是NV自己,即便我们再怎么看不顺眼,NV还是NV.
引用 KKND9 2012-4-21 10:08
chendi83: 性能完全就死不够,680强不到哪去!一块1700左右的卡卖到4K,真是够坑爹! 看看跑地铁2033就知道680什么性能了,游戏根本是毫无提升!地铁2033能上60帧的卡再说 ...
哈哈,照你这说法680,7970在你眼里都是垃圾了,问题是你拿个优化有问题的游戏来做衡量标准没有任何意义,因为优化有问题可能5年后的显卡都没法满60帧跑,照你这说法5年后的显卡都是“性能没提升”,都是垃圾了

而且如果680是1700左右的卡,那比680差的7970岂不是应该只要1000-1500左右了
引用 luanl1394 2012-4-18 13:48
”相信下一次AMD的裁员就不只是10%的全球市场部那么简单了.“下次可以裁10%的A饭了。
引用 Hakupenda 2012-4-17 16:21
chendi83: 性能完全就死不够,680强不到哪去!一块1700左右的卡卖到4K,真是够坑爹! 看看跑地铁2033就知道680什么性能了,游戏根本是毫无提升!地铁2033能上60帧的卡再说 ...
顶一个!
引用 鲁鲁修杰罗 2012-4-14 10:08
chendi83: 性能完全就死不够,680强不到哪去!一块1700左右的卡卖到4K,真是够坑爹! 看看跑地铁2033就知道680什么性能了,游戏根本是毫无提升!地铁2033能上60帧的卡再说 ...
我举双手双脚赞同!
引用 天依 2012-4-4 14:04
综合性能对比空了
引用 chendi83 2012-4-3 23:27
性能完全就死不够,680强不到哪去!一块1700左右的卡卖到4K,真是够坑爹!
看看跑地铁2033就知道680什么性能了,游戏根本是毫无提升!地铁2033能上60帧的卡再说性能有提升吧!680性能根本就是没提升,谁买谁2
引用 metapost 2012-4-1 10:17
赫敏: 功耗差距怎么这么大?62w!
AMD CCC设置了Power Control settings +20%
不然的话差不多吧
引用 夜带西瓜刀 2012-4-1 00:18
ASUA MSI GIGABYTE 这三大厂出了最低也有限价的吧?
引用 onelove1991 2012-3-31 22:36
看惯了红黑配色,黑绿这配色也还挺不错
引用 清风闲云 2012-3-31 21:03
显卡满载不到500W??!!!
引用 hadex 2012-3-31 16:13
Intel 笑看显卡风云。嘎嘎
引用 pjj778 2012-3-31 15:50
农企离破产又近了一步
引用 wtuysp 2012-3-31 13:16
这个真不错
引用 风一样的哥哥 2012-3-31 12:44
性能够了,快降价才是真的好,而不是谁性能高就牛X
引用 lottols 2012-3-31 08:59
外观一般 不够帅气 中高端吧
引用 davicom 2012-3-31 08:08
看来两家有必要继续推出7990和690来最终决定这一轮较量的胜负了~

查看全部评论(264)

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2024-4-19 15:53 , Processed in 0.009537 second(s), 8 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

返回顶部