找回密码
 加入我们
搜索
      
查看: 875|回复: 14

[软件] 一个开源的算力和显存带宽测试工具

[复制链接]
发表于 2025-6-9 07:46 | 显示全部楼层 |阅读模式
本帖最后由 privater 于 2025-6-8 17:36 编辑

https://github.com/ProjectPhysX/OpenCL-Benchmark

直接下载页面:https://github.com/ProjectPhysX/ ... k/releases/tag/v1.8

点开即用,几秒的时间可以快速测试下显存带宽,不过下面的 PCIe 带宽测试似乎不太准

Screenshot 2025-05-17 223130.png
发表于 2025-6-9 07:55 | 显示全部楼层
pro 6000
发表于 2025-6-9 09:08 | 显示全部楼层
有空试试。
发表于 2025-6-9 09:17 | 显示全部楼层
本贴其实是炫耀贴
发表于 2025-6-9 09:20 | 显示全部楼层
不是exe啊,杂用呢
 楼主| 发表于 2025-6-9 09:24 | 显示全部楼层
发表于 2025-6-9 09:28 | 显示全部楼层
如果显存有暗病,是不是也能测出来?
发表于 2025-6-9 09:29 | 显示全部楼层
感谢分享!
 楼主| 发表于 2025-6-9 09:36 | 显示全部楼层
archxm 发表于 2025-6-8 17:28
如果显存有暗病,是不是也能测出来?

不能,测显存建议这个开源工具,也很简单 :

https://github.com/GpuZelenograd/memtest_vulkan
发表于 2025-6-9 09:43 | 显示全部楼层
多谢分享,晚点试试看
发表于 2025-6-9 10:04 | 显示全部楼层
-----------------------------------------------------------------------------.
|----------------.------------------------------------------------------------|
| Device ID    0 | AMD Radeon RX 9070 XT                                      |
| Device ID    1 | AMD Radeon(TM) Graphics                                    |
|----------------'------------------------------------------------------------|
|----------------.------------------------------------------------------------|
| Device ID      | 0                                                          |
| Device Name    | AMD Radeon RX 9070 XT                                      |
| Device Vendor  | Advanced Micro Devices, Inc.                               |
| Device Driver  | 3652.0 (PAL,LC) (Windows)                                  |
| OpenCL Version | OpenCL C 2.0                                               |
| Compute Units  | 32 at 2400 MHz (2048 cores, 9.830 TFLOPs/s)                |
| Memory, Cache  | 16304 MB VRAM, 16 KB global / 64 KB local                  |
| Buffer Limits  | 16304 MB global, 16695296 KB constant                      |
|----------------'------------------------------------------------------------|
| Info: OpenCL C code successfully compiled.                                  |
| FP64  compute                                         0.821 TFLOPs/s (1/12) |
| FP32  compute                                        24.636 TFLOPs/s ( 2x ) |
| FP16  compute                                        47.295 TFLOPs/s ( 4x ) |
| INT64 compute                                         3.121  TIOPs/s (1/3 ) |
| INT32 compute                                         5.206  TIOPs/s (1/2 ) |
| INT16 compute                                        22.734  TIOPs/s ( 2x ) |
| INT8  compute                                        10.408  TIOPs/s ( 1x ) |
| Memory Bandwidth ( coalesced read      )                        590.97 GB/s |
| Memory Bandwidth ( coalesced      write)                        610.22 GB/s |
| Memory Bandwidth (misaligned read      )                        588.92 GB/s |
| Memory Bandwidth (misaligned      write)                        610.60 GB/s |
| PCIe   Bandwidth (send                 )                         28.00 GB/s |
| PCIe   Bandwidth (   receive           )                         28.61 GB/s |
| PCIe   Bandwidth (        bidirectional)            (Gen4 x16)   28.46 GB/s |
|-----------------------------------------------------------------------------|
|----------------.------------------------------------------------------------|
| Device ID      | 1                                                          |
| Device Name    | AMD Radeon(TM) Graphics                                    |
| Device Vendor  | Advanced Micro Devices, Inc.                               |
| Device Driver  | 3652.0 (PAL,LC) (Windows)                                  |
| OpenCL Version | OpenCL C 2.0                                               |
| Compute Units  | 1 at 2200 MHz (128 cores, 0.563 TFLOPs/s)                  |
| Memory, Cache  | 25721 MB RAM, 16 KB global / 64 KB local                   |
| Buffer Limits  | 23673 MB global, 24241584 KB constant                      |
|----------------'------------------------------------------------------------|
| Info: OpenCL C code successfully compiled.                                  |
| FP64  compute                                         0.035 TFLOPs/s (1/16) |
| FP32  compute                                         0.557 TFLOPs/s ( 1x ) |
| Benchmarking ...                                                            |

发表于 2025-6-9 12:12 | 显示全部楼层
  1. .-----------------------------------------------------------------------------.
  2. |----------------.------------------------------------------------------------|
  3. | Device ID    0 | Intel(R) UHD Graphics 770                                  |
  4. | Device ID    1 | NVIDIA GeForce RTX 3070 Laptop GPU                         |
  5. |----------------'------------------------------------------------------------|
  6. |----------------.------------------------------------------------------------|
  7. | Device ID      | 0                                                          |
  8. | Device Name    | Intel(R) UHD Graphics 770                                  |
  9. | Device Vendor  | Intel(R) Corporation                                       |
  10. | Device Driver  | 32.0.101.6325 (Windows)                                    |
  11. | OpenCL Version | OpenCL C 3.0                                               |
  12. | Compute Units  | 32 at 1550 MHz (256 cores, 0.794 TFLOPs/s)                 |
  13. | Memory, Cache  | 60999 MB RAM, 1920 KB global / 64 KB local                 |
  14. | Buffer Limits  | 4095 MB global, 4194296 KB constant                        |
  15. |----------------'------------------------------------------------------------|
  16. | Info: OpenCL C code successfully compiled.                                  |
  17. | FP64  compute                                          not supported        |
  18. | FP32  compute                                         0.664 TFLOPs/s ( 1x ) |
  19. | FP16  compute                                         1.229 TFLOPs/s ( 2x ) |
  20. | INT64 compute                                         0.058  TIOPs/s (1/12) |
  21. | INT32 compute                                         0.239  TIOPs/s (1/3 ) |
  22. | INT16 compute                                         2.776  TIOPs/s ( 4x ) |
  23. | INT8  compute                                         2.809  TIOPs/s ( 4x ) |
  24. | Memory Bandwidth ( coalesced read      )                         39.26 GB/s |
  25. | Memory Bandwidth ( coalesced      write)                         36.18 GB/s |
  26. | Memory Bandwidth (misaligned read      )                         32.13 GB/s |
  27. | Memory Bandwidth (misaligned      write)                         17.96 GB/s |
  28. |-----------------------------------------------------------------------------|
  29. |----------------.------------------------------------------------------------|
  30. | Device ID      | 1                                                          |
  31. | Device Name    | NVIDIA GeForce RTX 3070 Laptop GPU                         |
  32. | Device Vendor  | NVIDIA Corporation                                         |
  33. | Device Driver  | 528.24 (Windows)                                           |
  34. | OpenCL Version | OpenCL C 3.0                                               |
  35. | Compute Units  | 40 at 1560 MHz (5120 cores, 15.974 TFLOPs/s)               |
  36. | Memory, Cache  | 16383 MB VRAM, 1120 KB global / 48 KB local                |
  37. | Buffer Limits  | 4095 MB global, 64 KB constant                             |
  38. |----------------'------------------------------------------------------------|
  39. | Info: OpenCL C code successfully compiled.                                  |
  40. | FP64  compute                                         0.305 TFLOPs/s (1/64) |
  41. | FP32  compute                                        18.509 TFLOPs/s ( 1x ) |
  42. | FP16  compute                                        19.447 TFLOPs/s ( 1x ) |
  43. | INT64 compute                                         2.742  TIOPs/s (1/8 ) |
  44. | INT32 compute                                         9.826  TIOPs/s (2/3 ) |
  45. | INT16 compute                                         8.364  TIOPs/s (1/2 ) |
  46. | INT8  compute                                        35.291  TIOPs/s ( 2x ) |
  47. | Memory Bandwidth ( coalesced read      )                        424.47 GB/s |
  48. | Memory Bandwidth ( coalesced      write)                        430.51 GB/s |
  49. | Memory Bandwidth (misaligned read      )                        424.67 GB/s |
  50. | Memory Bandwidth (misaligned      write)                        103.33 GB/s |
  51. | PCIe   Bandwidth (send                 )                          9.73 GB/s |
  52. | PCIe   Bandwidth (   receive           )                          7.15 GB/s |
  53. | PCIe   Bandwidth (        bidirectional)            (Gen4 x16)    8.15 GB/s |
  54. |-----------------------------------------------------------------------------|
  55. |-----------------------------------------------------------------------------|
复制代码
发表于 2025-6-9 23:40 | 显示全部楼层
这区别不是很大,一个3070,一个5060又行了

3070.JPG

5060.JPG

发表于 2025-6-9 23:45 | 显示全部楼层
.-----------------------------------------------------------------------------.
|----------------.------------------------------------------------------------|
| Device ID    0 | NVIDIA GeForce RTX 5070 Ti                                 |
| Device ID    1 | NVIDIA GeForce RTX 5070 Ti                                 |
| Device ID    2 | Microsoft Basic Render Driver                              |
|----------------'------------------------------------------------------------|
|----------------.------------------------------------------------------------|
| Device ID      | 0                                                          |
| Device Name    | NVIDIA GeForce RTX 5070 Ti                                 |
| Device Vendor  | NVIDIA Corporation                                         |
| Device Driver  | 576.40 (Windows)                                           |
| OpenCL Version | OpenCL C 3.0                                               |
| Compute Units  | 70 at 2467 MHz (8960 cores, 44.209 TFLOPs/s)               |
| Memory, Cache  | 16302 MB VRAM, 2240 KB global / 48 KB local                |
| Buffer Limits  | 4075 MB global, 64 KB constant                             |
|----------------'------------------------------------------------------------|
| Info: OpenCL C code successfully compiled.                                  |
| FP64  compute                                         0.857 TFLOPs/s (1/64) |
| FP32  compute                                        52.434 TFLOPs/s ( 1x ) |
| FP16  compute                                        54.609 TFLOPs/s ( 1x ) |
| INT64 compute                                         4.201  TIOPs/s (1/12) |
| INT32 compute                                        27.350  TIOPs/s (2/3 ) |
| INT16 compute                                        24.283  TIOPs/s (1/2 ) |
| INT8  compute                                        99.825  TIOPs/s ( 2x ) |
| Memory Bandwidth ( coalesced read      )                        819.18 GB/s |
| Memory Bandwidth ( coalesced      write)                        851.16 GB/s |
| Memory Bandwidth (misaligned read      )                        890.07 GB/s |
| Memory Bandwidth (misaligned      write)                        217.68 GB/s |
| PCIe   Bandwidth (send                 )                         14.85 GB/s |
| PCIe   Bandwidth (   receive           )                         14.47 GB/s |
| PCIe   Bandwidth (        bidirectional)            (Gen4 x16)   14.65 GB/s |
|-----------------------------------------------------------------------------|
|----------------.------------------------------------------------------------|
| Device ID      | 1                                                          |
| Device Name    | NVIDIA GeForce RTX 5070 Ti                                 |
| Device Vendor  | Microsoft                                                  |
| Device Driver  | 1.1.0 (Windows)                                            |
| OpenCL Version | OpenCL C 3.0                                               |
| Compute Units  | 1 at 12 MHz (128 cores, 0.003 TFLOPs/s)                    |
| Memory, Cache  | 15907 MB VRAM, 0 KB global / 32 KB local                   |
| Buffer Limits  | 1024 MB global, 64 KB constant                             |
|----------------'------------------------------------------------------------|
发表于 2025-6-9 23:55 | 显示全部楼层
PCIE确实不太准。另一个是NV的工具
1f92fa399d8e89773849d784e489027.png
1749484502006.jpg
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2025-6-10 05:47 , Processed in 0.017109 second(s), 6 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表