AMD确认EPYC Rome CPU存在BUG，需要每隔34个月重启

525165 发表于 2023-6-6 00:18

无修复计划~

原文：“https://www.techpowerup.com/309589/bug-in-amd-epyc-rome-processors-puts-them-to-sleep-after-34-months-of-uptime”

“AMD 最近发布了基于 Zen 2 的第二代 EPYC 处理器的勘误表，其中指出，“在上次系统重置后大约 1044 天后，内核将无法退出 CC6。” 1044 天大约是 34 个月，或者说只有不到 3 年的总正常运行时间，根据 Reddit 和 Twitter 上的一些系统管理员侦探进行数学计算并发现实际时间是 1042 天 12 小时，这实际上是一个高估。出现问题是因为 CPU REFCLK 在 54 位带符号整数中计算 10ns 滴答，如果您计算这些滴答中的 9 千万亿次以上，您会在 1042.4999 天得到溢出。一旦发生这种溢出，内核将永远处于僵尸状态，并且不会接受任何外部中断请求。好吧，直到你关闭电源开关然后再打开，这将重置计数器。

发现这个问题确实令人印象深刻，因为它表明不止一个系统已经连续运行了将近三年而没有重新启动。尽管这确实使 EPYC“罗马”无法获得运行时间最长的系统的任何可能奖项，但它可以提醒人们启动系统更新或修补自那一代处理器问世以来四年内发现的其他漏洞。首次推出。AMD 不打算发布任何针对 CC6 错误的修复程序，而是建议管理员禁用 CC6 以避免内核进入僵尸化状态，或者干脆在时限到期前每隔一段时间启动一次重启。”

HZJ 发表于 2023-6-6 01:57

意料之中，AMD就像一个资本捧起来的小鲜肉流量明星，就看看它的股票泡沫还能持续多久。

ioko 发表于 2023-6-6 02:02

HZJ 发表于 2023-6-6 01:57
意料之中，AMD就像一个资本捧起来的小鲜肉流量明星，就看看它的股票泡沫还能持续多久。 ...

amd虽然只是千年老二，但从你的回复中看到了另外的解读: 酸

panzerlied 发表于 2023-6-6 02:04

苏川剑 发表于 2023-6-6 02:15

HZJ 发表于 2023-6-6 01:57
意料之中，AMD就像一个资本捧起来的小鲜肉流量明星，就看看它的股票泡沫还能持续多久。 ...

呵呵[偷笑]

Juzi丶 发表于 2023-6-6 02:40

[偷笑] 网友们的解读越来越牛逼了

uufaelaef01 发表于 2023-6-6 08:38

CHH贴吧化[偷笑]

ljy1414 发表于 2023-6-6 08:41

本帖最后由 ljy1414 于 2023-6-6 08:42 编辑

HZJ 发表于 2023-6-6 01:57
意料之中，AMD就像一个资本捧起来的小鲜肉流量明星，就看看它的股票泡沫还能持续多久。 ...

对，你清高，你家intel直接提前CPU暴毙，连重启的机会都没有
也不撒泡尿照照镜子，穿着一身白娘子装，露处一脸恶心人的笑容
恶心人就算了，也不动动脑子翻翻帖子，眼瞎吗?

https://www.hkepc.com/18366/

https://cdn.jsdelivr.net/gh/master-of-forums/master-of-forums/public/images/patch.gif

ljy1414 发表于 2023-6-6 08:44

我就是敢祖安你2F，你TM 2F玻璃心碎麻烦你去举报，出门右拐不送客，滚!!https://cdn.jsdelivr.net/gh/master-of-forums/master-of-forums/public/images/patch.gif

amike 发表于 2023-6-6 09:06

所以amd把二楼怎么了？还是说他股票抛早了？
意料之中也没见发个预言贴啊，马后炮谁不会[偷笑]

gbawrc 发表于 2023-6-6 09:07

kiteee 发表于 2023-6-6 09:08

[偷笑]楼里好多纠察队呀，果然是流量明细

dmaonb 发表于 2023-6-6 09:16

2F发言过于逆天

tancen1983 发表于 2023-6-6 09:17

有点BUG啥的不是很正常么。。。哪家能说自己100%完美

PPXG 发表于 2023-6-6 09:27

2L欢乐[偷笑]

专升本高手 发表于 2023-6-6 09:30

夏天快到了活是越来越密了给我整笑了

叶子烟 发表于 2023-6-6 09:34

举手问一下，一般服务器需要重启吗？
我就知道打的网游服务器一般需要重启

63047838 发表于 2023-6-6 10:09

台湾基佬越来越暴躁了[偷笑]，但是骂的真爽[恶魔]

bxhaai 发表于 2023-6-6 10:14

[偷笑]好歹也稳定运行34个月，不然这BUG都发现不了

qiu95 发表于 2023-6-6 10:14

真有机房服务器能连续跑三年不升级不重启么[吃惊]

禁止梭哈 发表于 2023-6-6 10:18

qiu95 发表于 2023-6-6 10:14
真有机房服务器能连续跑三年不升级不重启么

HPE有出rome架构的存储[偷笑]

londbell 发表于 2023-6-6 10:25

ljy1414 发表于 2023-6-6 08:41
对，你清高，你家intel直接提前CPU暴毙，连重启的机会都没有
也不撒泡尿照照镜子，穿着一身白娘子装，露 ...

DSM和QNAP对这个问题作出回应，说不会影响他们产品，但是一查也有不少暴毙

londbell 发表于 2023-6-6 10:27

ljy1414 发表于 2023-6-6 08:44
我就是敢祖安你2F，你TM 2F玻璃心碎麻烦你去举报，出门右拐不送客，滚!!

伊万科涅夫 发表于 2023-6-6 10:29

禁止梭哈发表于 2023-6-6 10:18
HPE有出rome架构的存储

HPE存储炸盘都已经两次了，这个比系统死机严重多了。

企业级SSD硬盘可靠性要求很高，只不过万一遇到事也没法了。HPE（惠普企业，也叫惠与）公司的多款SAS硬盘就遭遇了这样的麻烦，运行40000小时之后硬盘会挂掉，数据也会丢失。

更麻烦的是，这已经是HPE的企业级硬盘第二次出现类似的bug了。去年11月份，HPE的SAS硬盘出现为了奇怪的bug，通电时间累计达到32768小时（3年零270天8小时）后直接挂掉，导致数据丢失。

当时HPE方面没有明确原因，但外界猜测与16位计算系统的整数溢出有关，32768是这套系统能处理的最大负整数，32767是最大正整数。

之后HPE发布了新的HPD8固件，解决了掉盘问题。没想到的是，在运行40000小时时这个问题又回来了，也是掉盘+数据丢失。

该问题影响HPE 800GB/1.6TB 12G SAS SSD、HPE ProLiant、Synergy、Apollo 4200及Synergy Storage Modules、D3000 Storage Enclosure和StoreEasy 1000 Storage服务器、存储阵列上的SAS WI-1/MU-1 SFF SC SSD硬盘。

ljy1414 发表于 2023-6-6 10:31

londbell 发表于 2023-6-6 10:25
DSM和QNAP对这个问题作出回应，说不会影响他们产品，但是一查也有不少暴毙 ...

我记得有不少人买华擎的主板上了黑裙吧?
不知道那些华擎主板是否还安好...https://cdn.jsdelivr.net/gh/master-of-forums/master-of-forums/public/images/patch.gif

slymitec 发表于 2023-6-6 10:34

tengyun 发表于 2023-6-6 10:42

slymitec 发表于 2023-6-6 10:34
我比较关心Zen3、Zen4是否也有这样的问题，毕竟1000多天，哪怕Zen3目前也还体现不出来。 ...

[震惊]
家用机很少有人2 3年不重启吧
以前玩网游维护不也是1周1次嘛= =

fluttershy 发表于 2023-6-6 10:43

[偷笑]话说服务器维保是几年？

chnjyxz 发表于 2023-6-6 10:48

一坤年重启一次。

禁止梭哈 发表于 2023-6-6 10:49

伊万科涅夫发表于 2023-6-6 10:29
HPE存储炸盘都已经两次了，这个比系统死机严重多了。

企业级SSD硬盘可靠性要求很高，只不过万一遇到事也 ...

HPE我只接触过小型机，3par，nimble和带库，只修过这些玩意[偷笑]，存储整机宕了和坏盘还是有区别的。如果是到了那个时间统一会宕没时间差的话[偷笑]

页: [1] 2

Chiphell - 分享与交流用户体验's Archiver

AMD确认EPYC Rome CPU存在BUG，需要每隔34个月重启