Chiphell - 分享与交流用户体验

 找回密码
 加入我们
搜索
      
查看: 6024|回复: 55

关于G300 的计算题。

[复制链接]
发表于 2009-9-25 09:46 | 显示全部楼层 |阅读模式
据说G300 的情况是这样的512SP,每SP 每周期一个FMAD,那么其理论峰值性能是1024*SP 频率,也就是说,达到2.4TFlops 需要2.4G 的SP 频率,这是很诡异的,目前来看,可能性不大。
有人说G300中引入了类似Larrabee 的向量SP,其实也就是SIMD,如果属实,那么倒可以解释峰值性能的问题,但是新问题就严重了,对CUDA 来说,硬件架构变化了。
所以,现在很困惑,有人有料吗?
发表于 2009-9-25 09:49 | 显示全部楼层
神神秘秘
发表于 2009-9-25 09:53 | 显示全部楼层
这个不懂,等高手解答
发表于 2009-9-25 09:54 | 显示全部楼层
这个不懂,等高手解答
发表于 2009-9-25 10:21 | 显示全部楼层
偶也不懂,不过为什么每周期一个FMAD,就要按照2×512×频率来算呢?偶记得G200的时候是按照3×240×频率算滴,否则285哪来的1T+ FLOPS?
发表于 2009-9-25 10:28 | 显示全部楼层
x 3 是因为考虑到了 co-issue 的那个 MUL 单元。这样峰值就是 1 cycle  1 FMAD + 1 MUL 也就是 两乘一加了
发表于 2009-9-25 10:30 | 显示全部楼层
不可能没有的,LZ 公式有问题
发表于 2009-9-25 10:35 | 显示全部楼层
本帖最后由 harley 于 2009-9-25 10:36 编辑

G300好像也有Dual-Issue吧?而且好像有传闻G300对于大部分浮点指令,可以dual-issue……

如果是可以FMAD+FMAD的话,MS要算峰值每时钟4个FLOPS?这样算下来的话,SP频率只要4×512×1.175G就可以达到2.4T FLOPS了……
 楼主| 发表于 2009-9-25 10:37 | 显示全部楼层
传说而已,传说为了简化SP 塞下512 SP,简化成了一个FMAD
发表于 2009-9-25 10:38 | 显示全部楼层
PS:如果还是按照每周期3FLOPS算的话,那么需要1.56G……似乎很危险,G300那么大的芯片……
发表于 2009-9-25 10:40 | 显示全部楼层
*/-91晶體管密度達到1DIE:1SP麼?
发表于 2009-9-25 10:43 | 显示全部楼层
本帖最后由 arnew 于 2009-9-25 10:44 编辑
据说G300 的情况是这样的512SP,每SP 每周期一个FMAD,那么其理论峰值性能是1024*SP 频率,也就是说,达到2.4TFlops 需要2.4G 的SP 频率,这是很诡异的,目前来看,可能性不大。
有人说G300中引入了类似Larrabee 的 ...
tomsmith 发表于 2009-9-25 09:46


听过NV的鸟人隐隐约约说过很多地方变化,啥地方变化又不说…………他捏捏的…………

有传言MIPD…………
发表于 2009-9-25 10:45 | 显示全部楼层
传说而已,传说为了简化SP 塞下512 SP,简化成了一个FMAD
tomsmith 发表于 2009-9-25 10:37


呃,难道真的要2.4G的SP频率?所以只有个位数的良率?
 楼主| 发表于 2009-9-25 10:47 | 显示全部楼层
13# harley
良率有两种,达到预定频率也是一种标准。
发表于 2009-9-25 10:53 | 显示全部楼层
13# harley  
良率有两种,达到预定频率也是一种标准。
tomsmith 发表于 2009-9-25 10:47


我的意思就是能达到预定频率的只有个位数……

不过还是很奇怪……NV又不是第一天做芯片……G80/G200都是1.4G上下的SP频率,有可能到了G300突然说频率要上2.4G么?就算SP精简了,加上新制程,容易提高频率,一提就是1G……

相对来说我还是比较容易接受沿用FMAD+MUL这种3FLOPS的可能……然后1.56G也不容易,所以还是个位数的良率……*/-12
发表于 2009-9-25 11:45 | 显示全部楼层
我的意思就是能达到预定频率的只有个位数……

不过还是很奇怪……NV又不是第一天做芯片……G80/G200都是1.4G上下的SP频率,有可能到了G300突然说频率要上2.4G么?就算SP精简了,加上新制程,容易提高频率,一 ...
harley 发表于 2009-9-25 10:53


SP肯定不会上那么高,这发热谁受得了。这良率估计在改进gpgpu的某些方面时遇到了问题。
发表于 2009-9-25 11:51 | 显示全部楼层
据说G300 的情况是这样的512SP,每SP 每周期一个FMAD,那么其理论峰值性能是1024*SP 频率,也就是说,达到2.4TFlops 需要2.4G 的SP 频率,这是很诡异的,目前来看,可能性不大。
有人说G300中引入了类似Larrabee 的 ...
tomsmith 发表于 2009-9-25 09:46


什么叫向量SP?LRB的sp也是1D scalar的。
 楼主| 发表于 2009-9-25 12:02 | 显示全部楼层
17# savage
Larrabee 的CORE 是X86+512bit SIMD。
发表于 2009-9-25 12:44 | 显示全部楼层
2.4ghz的sp频率就太恐怖了
发表于 2009-9-25 12:58 | 显示全部楼层
不太看的懂。
发表于 2009-9-25 13:12 | 显示全部楼层
17# savage  
Larrabee 的CORE 是X86+512bit SIMD。
tomsmith 发表于 2009-9-25 12:02

那么NV的G80/G200架构应该可以看作是比Intel宽,但是比AMD窄的SIMD
发表于 2009-9-25 13:21 | 显示全部楼层
看来显卡和CUDA兼容一起发展是有大问题的。
无法两都兼顾,特别是NV想学InTEL之后。
发表于 2009-9-25 14:00 | 显示全部楼层
虽然我过去猜测是可以达到2.8Ghz的……但现在来看似乎是1.7Ghz啦,比1.4Ghz高,比2.4Ghz低。
单mad的sp运行在1.7Ghz的话是1.7Gflops,单看纸面的话是不算高的。
发表于 2009-9-25 18:30 | 显示全部楼层
這次G300這麼神秘,這麼低調,感覺有陰謀的味道
发表于 2009-9-25 18:35 | 显示全部楼层
虽然我过去猜测是可以达到2.8Ghz的……但现在来看似乎是1.7Ghz啦,比1.4Ghz高,比2.4Ghz低。
单mad的sp运行在1.7Ghz的话是1.7Gflops,单看纸面的话是不算高的。
AFXIF 发表于 2009-9-25 14:00


已经基本不可能上1.7G,预估在1.3G到1.5G之间。
发表于 2009-9-25 19:35 | 显示全部楼层
不太看的懂
发表于 2009-9-25 22:08 | 显示全部楼层
512SP据说已经渐行渐远了
发表于 2009-9-25 22:09 | 显示全部楼层
512SP据说已经渐行渐远了
cfcnc 发表于 2009-9-25 22:08


据说512bit显存位宽也渐行渐远了
发表于 2009-9-25 22:13 | 显示全部楼层
512SP据说已经渐行渐远了
cfcnc 发表于 2009-9-25 22:08

那会是少?缩到384?
发表于 2009-9-25 22:18 | 显示全部楼层
考虑到G300会支持ECC
实现512bit显存实际上就需要576bit的位宽
怎么说呢……确实有些夸张了,当然民用卡那些线可以不接出来。
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

小黑屋|手机版|Archiver|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2020-11-30 06:54 , Processed in 0.012087 second(s), 20 queries , Gzip On, Redis On.

Powered by Discuz! X3.2

© 2007-2020 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表