找回密码
 加入我们
搜索
      
查看: 1249|回复: 26

[显卡] 关于A卡 gddr6 显存温度与寿命的计算

[复制链接]
发表于 2025-5-20 15:07 | 显示全部楼层 |阅读模式
a卡破发对消费者是好事啊,可喜可贺。然后就看到更多大家分享关于显存温度的一些测试,其中有找到海力士显存规格书的网友,那就继续查一下资料,研究一下这个温度更准确的理解。

叠个甲:本人没有温度焦虑,单纯就是好奇。也不讨论测温准确性这些带有猜测的内容。信息是网上查到的信息,也请专业人士讨论指正。

g61.PNG
首先是规格书的温度:查到这个规格书里面写的那个85度是消费电子标准的环境温度。相比于软显的芯片内部温度,更接近测温枪测试的封装外部温度。然后这个温度范围也不是说超过了就要失效或者不保修,只是规定了产品在这个环境温度范围内,性能会满足规格书内的参数。换句话说,就是工作环境不满足这个范围,公司就不保证性能达到规格书内的参数。

个人感觉规格书这些参数不该是面向消费者的,消费者关注最终商品的评价足够了。各种消费券各种补贴凑单什么的已经够费脑子了,挑个商品还要研究内部元件的规格书就真是太累人了。但进来这个论坛的相比也是不愿止步于此,于是就有了下面的研究。

影响使用寿命的温度:半导体影响寿命的是结温Tj,更接近软显得芯片内部测温而不是测温枪测封装的温度。这里的使用寿命是半导体电子迁移等导致的性能偏移或者失效,虚焊或者pcb弯曲这些就不在这个计算之内。

结温对于使用寿命的影响可以通过加速系数(Acceleration Factor)来估计,由阿伦尼乌斯公式给出。
arrhenius.png

查到一般测试是125度结温1000小时老化来等效85度结温9年的目标使用寿命。
结合之前AMD公版卡110度显存都是合理范围的信息带入公式得:
AF.png

AF=4.4,寿命缩短到2年,然后a卡保修2年。也就是说7x24小时让显存跑到110度大概率在保修期内还能正常工作。
先不论现在的电子产品在设计上“计划性报废”合理不合理吧,至少感觉AMD的这个回复和设计是经过计算的,专业的。

以上应该是足够客观的事实,当然有不准确的或者疑惑的就欢迎指正和讨论。剩下的该不该有温度焦虑,该不该“计划性报废”,买这么贵的显卡该不该让消费者传家这些观点大家就求同存异吧。
发表于 2025-5-20 15:08 来自手机 | 显示全部楼层
a卡保修都3年了。。。
 楼主| 发表于 2025-5-20 15:19 | 显示全部楼层
forfans 发表于 2025-5-20 15:08
a卡保修都3年了。。。

那个“A卡保修2年”和“110度显存都是合理范围”这两个信息是统一出自同是gddr6的公版7900XTX。用这个单纯就是为了取一个可靠的数据算一算厂商对温度和寿命的判断。

至于别的不同设计的显卡,有不同的温度,愿意给出不同的保修,当然也就是可能的呀。
发表于 2025-5-20 15:45 | 显示全部楼层
我想知道kuang 卡是属于长寿吗?
发表于 2025-5-20 15:49 | 显示全部楼层
xzzfft 发表于 2025-5-20 15:45
我想知道kuang 卡是属于长寿吗?


我有一张3070Ti矿(2023年购于PDD), 显存温度常年90度左右。  直到去年年底才换显存散热,今年3月换了9070XT一直服役。 丽台的3070Ti生命电竞。

感觉显存温度高毛病就是风扇也会转的快有噪音,考虑到3年质保。 我觉得也不太担心,现在30系很多存货啊, 二手比比皆是。 毕竟30系得提升是最近几代中最大得。

发表于 2025-5-20 16:02 | 显示全部楼层
前两天不是有个帖子说是有用外置传感器重测的么,看不管是海力士还是三丧都是实测最高60多,好像是单纯软显问题
发表于 2025-5-20 16:09 来自手机 | 显示全部楼层
去ATI吧看看有人实测两种显存的温度差异。
发表于 2025-5-20 16:18 | 显示全部楼层
AF这个主要是温度循环老化试验使用的...
 楼主| 发表于 2025-5-20 16:29 | 显示全部楼层
hen8899 发表于 2025-5-20 16:02
前两天不是有个帖子说是有用外置传感器重测的么,看不管是海力士还是三丧都是实测最高60多,好像是单纯软显 ...

这个帖子吗?
封装温度好像还是有些差距,但具体散热条件这些细节就不知道了
 楼主| 发表于 2025-5-20 16:30 | 显示全部楼层
meibi 发表于 2025-5-20 16:09
去ATI吧看看有人实测两种显存的温度差异。

好像有人搬过来了,不影响我们对显存温度和寿命的讨论呀
 楼主| 发表于 2025-5-20 16:33 | 显示全部楼层
Timothy21 发表于 2025-5-20 16:18
AF这个主要是温度循环老化试验使用的...

这里用的是HTOL里,计算温度影响因子的AFt
发表于 2025-5-20 16:48 来自手机 | 显示全部楼层
MolaMola 发表于 2025-5-20 16:30
好像有人搬过来了,不影响我们对显存温度和寿命的讨论呀

我是觉得不是专业从事相关专业的,拿着正确的公式也不一定得出正确的结果,容易陷入片面。
 楼主| 发表于 2025-5-20 16:52 | 显示全部楼层
meibi 发表于 2025-5-20 16:48
我是觉得不是专业从事相关专业的,拿着正确的公式也不一定得出正确的结果,容易陷入片面。 ...

确实是这样的,需要很准确对于各个变量的理解才能代进去正确的数字
所以公版7900xtx的那组相互印证的数据才那么珍贵
也希望有更专业纠正一下对数据的理解
发表于 2025-5-20 16:55 来自手机 | 显示全部楼层
或者换种思路,在保修期内产品生产者考虑的是避免返修率的增大,而我不认为这世界上有人能做到大批量产品的卡点计划报废,反而产品设计者往往需要提供一定的裕度来避免发生问题,这些都是额外成本。
发表于 2025-5-20 17:09 | 显示全部楼层
hen8899 发表于 2025-5-20 16:02
前两天不是有个帖子说是有用外置传感器重测的么,看不管是海力士还是三丧都是实测最高60多,好像是单纯软显 ...

不是软显的问题,软显是结温,电热偶是封装表面
过切认为测的结果都没有问题,数据是对的,那只能说明海力士的封装没有三星的好,导致积热
发表于 2025-5-20 17:11 | 显示全部楼层
hen8899 发表于 2025-5-20 16:02
前两天不是有个帖子说是有用外置传感器重测的么,看不管是海力士还是三丧都是实测最高60多,好像是单纯软显 ...

一个67度和一个57度能叫实测最高60多吗?这还没传到三人就成虎了
 楼主| 发表于 2025-5-20 17:13 | 显示全部楼层
本帖最后由 MolaMola 于 2025-5-20 17:18 编辑
meibi 发表于 2025-5-20 16:55
或者换种思路,在保修期内产品生产者考虑的是避免返修率的增大,而我不认为这世界上有人能做到大批量产品的 ...


7x24小时110度能满足保修期,感觉裕度足够吧
也正是算出来这个数太过于合理的,像学生做题答案刚好等于1或0这种,所以反而有点怀疑
发表于 2025-5-20 17:15 | 显示全部楼层
毛茸茸 发表于 2025-5-20 17:11
一个67度和一个57度能叫实测最高60多吗?这还没传到三人就成虎了

就随便瞅了两眼,这咋还认真上了,又不是考试呢;况且实测连70都没,别担心了
发表于 2025-5-20 17:21 来自手机 | 显示全部楼层
tiantian80 发表于 2025-5-20 17:09
不是软显的问题,软显是结温,电热偶是封装表面
过切认为测的结果都没有问题,数据是对的,那只能说明海 ...

也无法完全说明吧,两家的测温方法一致么,测温器件的测量位置一样么,有啥换默认的换算公式么,比如多个采样的温度加权,当然也有可能你说的封装问题。
所以我的态度是只要厂家质保在,一般人其实没必要在意了。除非有专业的大佬来实际拆测评比。
发表于 2025-5-20 17:27 来自手机 | 显示全部楼层
MolaMola 发表于 2025-5-20 17:13
7x24小时110度能满足保修期,感觉裕度足够吧
也正是算出来这个数太过于合理的,像学生做题答案刚好等于1 ...

那从用户角度来说,能让显存持续长时间跑满的场景有多少?我能想到的就挖矿了。又或者散热器不失效的情况下,这个极端温度现实么?
发表于 2025-5-20 17:29 | 显示全部楼层
7x24小时让显存跑到110度大概能用两年。普通人就算每天玩4小时大型游戏的也很少了。这么看能用12年?
 楼主| 发表于 2025-5-20 20:38 | 显示全部楼层
meibi 发表于 2025-5-20 17:27
那从用户角度来说,能让显存持续长时间跑满的场景有多少?我能想到的就挖矿了。又或者散热器不失效的情况 ...

没多少这样的场景的,所以官方算到极限也敢保两年,更不担心普通用户会因为这个显存温度产生些什么质量问题。
然后就是,没太看懂你这几个问题想论证的点是什么
 楼主| 发表于 2025-5-20 20:40 | 显示全部楼层
hanson1258 发表于 2025-5-20 17:29
7x24小时让显存跑到110度大概能用两年。普通人就算每天玩4小时大型游戏的也很少了。这么看能用12年? ...

这里只讨论显存这单一元件的电气性能,那确实是能用12年了,所以更说明厂家在散热设计上根本不担心显存温度
发表于 2025-5-20 20:43 | 显示全部楼层
不是相关业者,为什么同样是显存N卡的显存温度低那么多。是不是架构不同,显存的负载不一样。还是优化问题。不解。
发表于 2025-5-20 21:44 来自手机 | 显示全部楼层
MolaMola 发表于 2025-5-20 20:38
没多少这样的场景的,所以官方算到极限也敢保两年,更不担心普通用户会因为这个显存温度产生些什么质量问 ...

就是上面表述的,普通人没必要在意。
我上面回了其他人自己对于温度的看法,温度测定这个可能因素有很多,是单纯根据电流电压计算,还是有测温元件,有几个测温元件,测温元件位置,加权算法,每个公司想法和做法都可能不一样,因此单纯的比对在我看来意义有限。
以上都只是我个人外行的猜测,看看就好。总之就是姑且相信板卡厂商不会搬石头砸自己。
发表于 2025-5-20 22:27 | 显示全部楼层
MolaMola 发表于 2025-5-20 16:33
这里用的是HTOL里,计算温度影响因子的AFt

AF是TC/HAST/HTOL/HTSL都会用的参数,现在半导体行业现在看可靠性一般很少用HTOL,基本用TC/HAST去看产品的wearout寿命
 楼主| 发表于 2025-5-21 09:14 | 显示全部楼层
Timothy21 发表于 2025-5-20 22:27
AF是TC/HAST/HTOL/HTSL都会用的参数,现在半导体行业现在看可靠性一般很少用HTOL,基本用TC/HAST去看产品 ...

明白,不过这些都是为了更快速全面测试不同方面可靠性而设计出来的测试标准,加速老化本身的原理都是通用的(查了一下HAST的AFt,跟HTOL的是一样的),所以感觉用来估算工作温度对使用寿命的影响很合理
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2025-5-21 17:52 , Processed in 0.013081 second(s), 6 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表