Chiphell - 分享与交流用户体验

 找回密码
 加入我们
搜索
      
12
返回列表 发新帖
楼主: tomsmith

关于G300 的计算题。

[复制链接]
发表于 2009-9-25 22:30 | 显示全部楼层
我只是来围观女王的
发表于 2009-9-25 22:38 | 显示全部楼层
*/-42每次看到这类纯技术贴都感觉很头大。。努力想懂。。但是真的蛮难懂
发表于 2009-9-25 22:39 | 显示全部楼层
那會不會是民用版448bit,專業版512bit?
发表于 2009-9-25 22:47 | 显示全部楼层
17# savage  
Larrabee 的CORE 是X86+512bit SIMD。
tomsmith 发表于 2009-9-25 12:02


那512bit SIMD实际上是16个1D scalar alu组成的。你是想说G300里面有像LRB一样的spu?即便多了个spu,对最终的flops也没多大贡献啊。
发表于 2009-9-25 22:48 | 显示全部楼层
ECC在耗费容量和耗费运算周期的折中点一般是每64位数据需要8位校验位。
所以如果是448位宽,加上ECC的话是504位……
发表于 2009-9-25 22:50 | 显示全部楼层
*/-42每次看到这类纯技术贴都感觉很头大。。努力想懂。。但是真的蛮难懂
seamen0622 发表于 2009-9-25 22:38


有啥不懂你就问啊,当然要是你每个地方都不懂,那得自己下去补补课了*/-34
发表于 2009-9-25 22:51 | 显示全部楼层
那會不會是民用版448bit,專業版512bit?
allensakura 发表于 2009-9-25 22:39


Impossible。任何一家公司都还没强悍到可以如此随意的增减MC的位宽
 楼主| 发表于 2009-9-25 23:00 | 显示全部楼层
34# savage
不是,Larrabee 的结构是8 16 24 32 个Core 构成,每个Core 是一个传统的P54C 核心,不过SSE 的宽度是512bit,不是什么16个SP。
发表于 2009-9-25 23:18 | 显示全部楼层
本帖最后由 savage 于 2009-9-25 23:19 编辑
34# savage  
不是,Larrabee 的结构是8 16 24 32 个Core 构成,每个Core 是一个传统的P54C 核心,不过SSE 的宽度是512bit,不是什么16个SP。
tomsmith 发表于 2009-9-25 23:00


每个core的scalar核心是一个传统的P54C,搭配一个宽度为512bit的SIMD单元,该单元里面ALU的安排方式是类似NV的1D scalar sp。LRB的论文里有明确提到这一点。所以可以把它看成是16个SP
发表于 2009-9-25 23:31 | 显示全部楼层
ECC在耗费容量和耗费运算周期的折中点一般是每64位数据需要8位校验位。
所以如果是448位宽,加上ECC的话是504位……
AFXIF 发表于 2009-9-25 22:48

效验时存的的是数据,与带宽位数无关吧。

其实没必要单独分出ECC DRAM来,就像RAID5那样,将效验数据分散于各个DRAM,MC的设计上也不会有太多压力
 楼主| 发表于 2009-9-25 23:33 | 显示全部楼层
39# savage
不是,你恐怕误会了,SSE AVX 和Larrabee 这个SIMD 是一种结构,1D SP 的特点是可以同时以不同的计算指令工作,而SIMD 则是同一条指令,对16个Float 做同样操作。
1D SP 的想法是可以独立工作,不需要批量工作,SIMD 则不然,无论如何,都是一条路线运转。
发表于 2009-9-25 23:39 | 显示全部楼层
效验时存的的是数据,与带宽位数无关吧。

其实没必要单独分出ECC DRAM来,就像RAID5那样,将效验数据分散于各个DRAM,MC的设计上也不会有太多压力
大死人花 发表于 2009-9-25 23:31

ECC是放在内存控制器用固定线路实现校检的,所以原来的64bit的MC,实际上要变成72bit的。
发表于 2009-9-25 23:41 | 显示全部楼层
本帖最后由 savage 于 2009-9-25 23:44 编辑

这个要看你从什么角度理解,我觉得站在一个非常high level的层次上泛泛而谈并行处理器,无非就是SIMD还是MIMD,SIMD宽度多少,alu的组织方式……

要往细了说,即便R600这种典型的SIMD,同一个simd上每一个sp同一个时钟周期执行的指令也是不同的
 楼主| 发表于 2009-9-25 23:50 | 显示全部楼层
43# savage
R600 是非对称SIMD,但是仍然是SIMD。
G80 提的是SPMD,意图是最终实现独立SP 独立PC,独立I,那么就是MIMD。
Larrabee 而言,就独立核心和普通的X86 核心一样,有标量ALU 向量ALU 两部分。向量ALU 就是个512bit 的SIMD,单精度16路宽,双精度8路宽。
发表于 2009-9-26 00:11 | 显示全部楼层
SPMD的P是Program……

I是一条指令的话,P就是完整一整串指令
同一段程序(P),处理大量的数据(D)
就是SPMD

这也是R520以来的ATI GPU,也都是这样的,本没什么可以特别提的。
发表于 2009-9-26 00:25 | 显示全部楼层
有啥不懂你就问啊,当然要是你每个地方都不懂,那得自己下去补补课了*/-34
savage 发表于 2009-9-25 22:50

全都不怎么懂的爬过..........*/-21
发表于 2009-9-26 01:42 | 显示全部楼层
G300很神秘,也许像RV770那样给人带来惊喜*/-12
发表于 2009-9-26 12:14 | 显示全部楼层
43# savage  
R600 是非对称SIMD,但是仍然是SIMD。
G80 提的是SPMD,意图是最终实现独立SP 独立PC,独立I,那么就是MIMD。
Larrabee 而言,就独立核心和普通的X86 核心一样,有标量ALU 向量ALU 两部分。向量ALU ...
tomsmith 发表于 2009-9-25 23:50


GT200难道不是独立sp独立pc吗?

其实我不太清楚这些和你最初的问题有啥联系,为啥引入类似LRB的的向量处理器就能解释峰值问题了。你是指现在的标量处理器会向量化?我认为这相当不可能。
 楼主| 发表于 2009-9-26 12:59 | 显示全部楼层
48# savage
向量ALU 的单位性能/晶体管数比例最高。
GT200 是以SM 为组织的,目前还做不到完全独立,不过有逐步独立的趋势。
发表于 2009-9-26 21:11 | 显示全部楼层
Impossible。任何一家公司都还没强悍到可以如此随意的增减MC的位宽
savage 发表于 2009-9-25 22:51

fc,NV显卡的带宽都是砍来砍去得。
发表于 2009-9-27 00:12 | 显示全部楼层
那512bit SIMD实际上是16个1D scalar alu组成的。你是想说G300里面有像LRB一样的spu?即便多了个spu,对最终的flops也没多大贡献啊。
savage 发表于 2009-9-25 22:47

那就能省下不少晶体管了~
发表于 2009-9-27 00:17 | 显示全部楼层
问问达人,G200的1dsp是分了几大组?几个共享一个texture和cache?
发表于 2009-9-27 00:35 | 显示全部楼层
52# Alexander

没有比这张图更合适回答的了
发表于 2009-9-27 09:47 | 显示全部楼层
本帖最后由 savage 于 2009-9-27 09:51 编辑
48# savage  
向量ALU 的单位性能/晶体管数比例最高。
GT200 是以SM 为组织的,目前还做不到完全独立,不过有逐步独立的趋势。
tomsmith 发表于 2009-9-26 12:59


我印象中每个sp都有自己的pc。没错,GT200是以warp为调度的最小粒度。其实,程序开发人员只需要关注比较high level的programing model这一层面的东西。在我看来,从770开始,A和N的gpu编程模型没什么差别。N说的SIMT可以隐藏simd width,让程序员不用关心硬件细节,程序在不同配置的硬件下有很好的兼容性。但是很多时候不是这样,就拿cuda sdk的prefix-sum这个sample来说,如果不考虑simd-width,那算法根本就不能正确实现。

到目前为止,我还是不能理解你怎么用LRB的向量单元来解释GT300的峰值flops
发表于 2009-9-27 09:49 | 显示全部楼层
fc,NV显卡的带宽都是砍来砍去得。
redens 发表于 2009-9-26 21:11


你有见过一代高端卡出两个规格的mc吗?你以为增减带宽跟你把512 bits写成448 bits一样简单啊?
发表于 2009-9-27 15:43 | 显示全部楼层
你有见过一代高端卡出两个规格的mc吗?你以为增减带宽跟你把512 bits写成448 bits一样简单啊?
savage 发表于 2009-9-27 09:49

参见260, 260+, 280,  295,同样的芯片,不同的MC带宽
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

小黑屋|手机版|Archiver|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2021-1-23 10:18 , Processed in 0.011774 second(s), 20 queries , Gzip On, Redis On.

Powered by Discuz! X3.2

© 2007-2020 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表