Prime95 至强2代E5-2600v2在(RAM >80GB)+特定FFT出现Error
本帖最后由 testcb00 于 2022-9-12 02:23 编辑原标题 Prime95 特定FFT出现Segmentation fault (core dumped)
执垃圾砌了个旧服务器
运行Prime95烧机出现以下错误
Segmentation fault (core dumped)
一番折腾后发现这个Segmentation fault只出现在FFT=224K, 240K
如果用Smallest FFTs / Small FFTs / Large FFTs选项就没这个问题
因为这三个选项不包括FFT=224K, 240K
请问过不到FFT=224K, 240K是什么原因?
----------------------------------------------------------------
更新
现标题 Prime95 至强2代E5-2600v2在(RAM >80GB)+特定FFT出现Error
借了8条16GB DDR3-1600 RDIMM和4条8GB DDR3-1600 RDIMM
经过一轮测试发现了一个奇怪的现象
只要RAM>80GB Prime95 AVX FFT 224K/240K就会出Error
请问有没坛友有用至强E5-2600v2 C602/C606平台+88GB RAM或以上能协助测试一下?
以下是测试的组合
Prime95 AVX FFT 224K/240K
Pass
LRDIMM
1条64GB DDR3-1600 LRDIMM
RDIMM
4条8GB DDR3-1600 RDIMM
4条16GB DDR3-1600 RDIMM
5条16GB DDR3-1600 RDIMM
4条16GB DDR3-1600 RDIMM+2条8GB DDR3-1600 RDIMM
Fail
LRDIMM
2条64GB DDR3-1600 LRDIMM
3条64GB DDR3-1600 LRDIMM
4条64GB DDR3-1600 LRDIMM
RDIMM
6条16GB DDR3-1600 RDIMM
7条16GB DDR3-1600 RDIMM
8条16GB DDR3-1600 RDIMM
4条16GB DDR3-1600 RDIMM+3条8GB DDR3-1600 RDIMM
4条16GB DDR3-1600 RDIMM+4条8GB DDR3-1600 RDIMM
https://www.mersenneforum.org/
官方论坛欢迎你
FFT 长度的意义连官方论坛回帖的人也没几个懂的,CHH 就更少了 lgblee 发表于 2022-9-4 17:41
https://www.mersenneforum.org/
官方论坛欢迎你
差不多同时间在那发了帖 不知道有没人回就是了 直接提问不如搜索一下
https://www.cnblogs.com/wpgraceii/p/10622582.htmlhttps://cdn.jsdelivr.net/gh/master-of-forums/master-of-forums/public/images/patch.gif T.JOHN 发表于 2022-9-4 18:56
直接提问不如搜索一下
https://www.cnblogs.com/wpgraceii/p/10622582.html
当然有看啊 我也搜索了不少
有人说是程序BUG
有人说是系统负载过大导致指向错误/损毁
testcb00 发表于 2022-9-4 19:09
当然有看啊 我也搜索了不少
有人说是程序BUG
有人说是系统负载过大导致指向错误/损毁
不是很清楚了么?
它会出现在当程序企图访问CPU无法定址的存储器区块时。当错误发生时,硬件会通知操作系统产生了存储器访问权限冲突的状况。操作系统通常会产生核心转储(core dump)以方便程序员进行调试。通常该错误是由于调用一个地址,而该地址为空(NULL)所造成的,例如链表中调用一个未分配地址的空链表单元的元素。数组访问越界也可能产生这个错误。
要么是你权限问题,要么就是内存超频过度出错了https://cdn.jsdelivr.net/gh/master-of-forums/master-of-forums/public/images/patch.gif T.JOHN 发表于 2022-9-4 19:12
不是很清楚了么?
要么是你权限问题,要么就是内存超频过度出错了
那些解释不了为何只有FFT=224K, 240K出问题啊
我内存也没超频 如果是权限问题也不会只有FFT=224K, 240K 出问题
testcb00 发表于 2022-9-4 19:17
那些解释不了为何只有FFT=224K, 240K出问题啊
我内存也没超频 如果是权限问题也不会只有FFT=224K, 240K ...
现在系统报这个错给你,只是表明问题。你想分析具体原因,就和那位博主一样,开日志,写一段C语言,找内存地址,自己debug。https://cdn.jsdelivr.net/gh/master-of-forums/master-of-forums/public/images/patch.gif 本帖最后由 12f23eddde 于 2022-9-5 20:59 编辑
Segmentation fault是内存访问错误,觉得有两种可能:1. p95出bug了,访问了不应该访问的内存地址 2. 你的内存写入的数据出错,导致程序访问了错误地址 Segmentation Fault 这个错误在我之前在调试程序时经常遇到,因为程序采用的是 C++ 指针操作,无一例外的都是指针越界或 NULL testcb00 发表于 2022-9-4 19:17
那些解释不了为何只有FFT=224K, 240K出问题啊
我内存也没超频 如果是权限问题也不会只有FFT=224K, 240K ...
之前遇到过内存某块颗粒损毁的情况 要不跑个memtest试试? Prime95理论上应该没有这bug,这么明显的bug要是有早就发现修复了,大概率还是硬件哪儿出问题了 之前各行了memtest86和memtest86+ 2天也没问题
感觉是LRDIMM的data buffer对这两个test有问题
又或者单条8 Rank的问题
之前用这底板试了4x 8GB DDR3-1600 RDIMM
memtest86/memtest86+/Prime95也没问题
P95拷机没啥用,就算能过。生产力时候该死机还是死机 应该还是内存不稳。
之前内存超频之后编译jvm也是会在特定的文件报地址错误。(日常使用确实没出现能感知到的问题)
调回xmp就能成功。 借了8条16GB DDR3-1600 RDIMM和4条8GB DDR3-1600 RDIMM
经过一轮测试发现了一个奇怪的现象
只要RAM>80GB Prime95 AVX FFT 224K/240K就会出Error
请问有没坛友有用至强E5-2600v2 C602/C606平台+88GB RAM或以上能协助测试一下?
以下是测试的组合
Prime95 AVX FFT 224K/240K
Pass
LRDIMM
1条64GB DDR3-1600 LRDIMM
RDIMM
4条8GB DDR3-1600 RDIMM
4条16GB DDR3-1600 RDIMM
5条16GB DDR3-1600 RDIMM
4条16GB DDR3-1600 RDIMM+2条8GB DDR3-1600 RDIMM
Fail
LRDIMM
2条64GB DDR3-1600 LRDIMM
3条64GB DDR3-1600 LRDIMM
4条64GB DDR3-1600 LRDIMM
RDIMM
6条16GB DDR3-1600 RDIMM
7条16GB DDR3-1600 RDIMM
8条16GB DDR3-1600 RDIMM
4条16GB DDR3-1600 RDIMM+3条8GB DDR3-1600 RDIMM
4条16GB DDR3-1600 RDIMM+4条8GB DDR3-1600 RDIMM 更进一步测试发现
8条16GB DDR3-1600 RDIMM (128GB)
在Prime95 AVX FFT 224K/240K选择测试81.5GB是可以Pass
再上就Fail
请问有没坛友有用至强E5-2600v2 C602/C606平台+88GB RAM或以上能协助测试一下?
页:
[1]