sinopart 发表于 2025-2-4 09:23

似乎发现了3DMark 测试项目SteelNomad存在一定的问题

本帖最后由 sinopart 于 2025-2-4 09:24 编辑

在依据论坛里的帖子:[清算统计]哪家的主板纸面支持PCIe5.0而面对blackwell需要降级 - 电脑讨论(新) - Chiphell - 分享与交流用户体验,验证自己的主板和显卡PCIE通信是否稳定时,发现自己的系统的PCIE出现了BAD_TLP报文:


一开始怀疑是插槽没接好,但是思来想去,觉得先排查驱动因素比较好。毕竟572.16NV官方承认有很多问题,而目前国内外5080出故障的案例并不少见,他们自然都是使用572.16这个首发驱动,于是降级到566.36。结果发现报文消失。本来想立刻发帖分享,但留了个心眼,跑了一次572.16相同的VulkanAPI下的测试:
这是DX12下的报文,由于前面跑了几次Vulkan下的测试,所以有BAD_TLP计数:

这是Vulkan下的纪录,可以发现BAD_TLP计数上升:

我似乎找到了Vulkan下的SteelNomad的一个潜藏性问题?

后续仔细排查,为了验证是否是系统硬件依然不稳定,而Vulkan下PCIE压力更大才引起这种现象,我跑了对PCIE读写压力最大的光追测试(光追非常吃显存,可涉及频繁的PCIE和显存数据交换),结果是没有增加BAD_TLP计数:
(截图的时候预先跑了一次VULKAN STEELNOMAD,所以有23的计数)


希望有更多坛友加入这个验证中,测试一下自己的系统在跑Vulkan下的steel nomad有没有这种故障。

sinopart 发表于 2025-2-4 09:38

补充一个PCIE带宽测试项目的结果,在高压传输下也没有出现BAD_TLP报文:
页: [1]
查看完整版本: 似乎发现了3DMark 测试项目SteelNomad存在一定的问题