Chiphell - 分享与交流用户体验

 找回密码
 加入我们
搜索
      
查看: 4638|回复: 18

[PC硬件] AMD下一代GPU架构HD7000 —— 舍弃VLIW,乱序

[复制链接]
发表于 2011-6-15 12:20 | 显示全部楼层 |阅读模式
本帖最后由 Sakray 于 2011-6-15 17:00 编辑

http://www.pcper.com/news/Editor ... mmit-2011-Live-Blog

In brief:

* Ditch the VLIW instruction format and move to SIMD wide-vector execution
* L1 and L2 read/write caching
* Out of order resource allocation
* ECC data protection on SRAMs and global memory
* Parallel primitive setup

********************
http://www.realworldtech.com/forums/index.cfm?action=detail&id=120411&threadid=120411&roomid=2

A few highlights from the talk:Multiple primitive pipelines for setup, etc.
Real caching in L1, L2, separate color/z caches for graphics and atomics
Concurrent tasks
Out of order resource allocation
ECC on srams and drams
Shaders
No vliw, just multiple issue simd
Branch, scalar, vector, vector memory,  export units
4x16 wide vector ALUs



评分

1

查看全部评分

发表于 2011-6-15 12:44 | 显示全部楼层
为了gpgpu?
发表于 2011-6-15 12:44 | 显示全部楼层
不懂, 求大神解释.
发表于 2011-6-15 12:51 | 显示全部楼层
求解释
 楼主| 发表于 2011-6-15 12:52 | 显示全部楼层
shi 发表于 2011-6-15 12:44
不懂, 求大神解释.

丢弃VLIW   转为SIMD  意味着:
simd engine(Cayman)里的16路*16bit VLIW core 分类为4路*64bit的simd  流处理器数量估计可以保持不变
发表于 2011-6-15 12:58 | 显示全部楼层
Sakray 发表于 2011-6-15 12:52
丢弃VLIW   转为SIMD  意味着:
simd engine(Cayman)里的16路*16bit VLIW core 分类为4路*64bit的simd   ...

依然不懂啊, 说普通话么? 打个比方呗? 然后为什么amd要这么做呢?

是不是就是说把现在vliw4里面的每个小的单元分拆出来组成4个异构的模组?
发表于 2011-6-15 16:03 | 显示全部楼层
回复 Sakray 的帖子

类似NV?
发表于 2011-6-15 16:15 | 显示全部楼层
奶奶的 6950 就是 amd 的试验品 不幸被我购买了。
发表于 2011-6-15 16:17 | 显示全部楼层
hszz88 发表于 2011-6-15 16:03
回复 Sakray 的帖子

类似NV?

我猜不是类似于nv的东西……
更接近cpu的东西?(彻底胡乱猜的)
发表于 2011-6-15 16:19 | 显示全部楼层
SIMD啊
貌似还是没有N社MIMD激进。
发表于 2011-6-15 18:37 | 显示全部楼层
就像是,原来有一个人有四条腿,现在变成四个人每人一条腿*/-91
发表于 2011-6-15 18:54 | 显示全部楼层
aibo 发表于 2011-6-15 16:19
SIMD啊
貌似还是没有N社MIMD激进。

N设那其实也是SIMD, 毕竟是GPU, 都是更偏向SIMD的架构.
发表于 2011-6-15 18:57 | 显示全部楼层
本帖最后由 PTMD 于 2011-6-15 19:00 编辑
shi 发表于 2011-6-15 12:58
依然不懂啊, 说普通话么? 打个比方呗? 然后为什么amd要这么做呢?

是不是就是说把现在vliw4里面的每个小 ...

VLIW-4 架构的Compute Unit 的工作方式是16 个VLIW 单元在同一周期里接收同样的VLIW 指令,然后在四个周期里完成执行,而这些VLIW 单元是4-way 的,可以执行四条不同的指令 (VLIW 指令就由这些指令所组成),也支援执行指定的相依性指令(eg dot products)。

GC Next 的Compute Unit 工作方式是4 个512-bit 的SIMD 单元在同一周期内接收来自四个Wavefront 的指令。由于Wavefront Size 还是 64 work-item,所以还是在四个周期内完成执行,相依性指令会以什么方式支援是个问号,但是双精度性能可以比Cayman 更高,由1/4 再提升至1/ 2 of Single Precision。

灰字未确认

评分

1

查看全部评分

发表于 2011-6-15 18:59 | 显示全部楼层
aibo 发表于 2011-6-15 16:19
SIMD啊
貌似还是没有N社MIMD激进。

其实GPU 本身就是MIMD 混上SIMD,别被忽悠了。
发表于 2011-6-15 19:24 | 显示全部楼层
不懂,学习ing

要到年底才上市了吧
发表于 2011-6-15 19:38 | 显示全部楼层
不懂。。。。。。。。。。。。
发表于 2011-6-16 07:33 | 显示全部楼层
aibo 发表于 2011-6-15 16:19
SIMD啊
貌似还是没有N社MIMD激进。

啥MIMD的玩意啊,本身就是SIMD
发表于 2011-6-16 10:39 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
发表于 2011-6-17 15:18 | 显示全部楼层
aibo 发表于 2011-6-15 16:19
SIMD啊
貌似还是没有N社MIMD激进。

就GPGPU现在的用途来说,对于大部分的并行运算
SIMD就够了
个人感觉更大的Shadow memory感觉更有用处
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

小黑屋|手机版|Archiver|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806

GMT+8, 2020-2-22 06:35 , Processed in 0.013529 second(s), 20 queries , Gzip On, Redis On.

Powered by Discuz! X3.1

© 2007-2019 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表