找回密码
 加入我们
搜索
      
查看: 2153|回复: 18

[软件] 一个开源的算力和显存带宽测试工具

[复制链接]
发表于 2025-6-9 12:12 | 显示全部楼层
  1. .-----------------------------------------------------------------------------.
  2. |----------------.------------------------------------------------------------|
  3. | Device ID    0 | Intel(R) UHD Graphics 770                                  |
  4. | Device ID    1 | NVIDIA GeForce RTX 3070 Laptop GPU                         |
  5. |----------------'------------------------------------------------------------|
  6. |----------------.------------------------------------------------------------|
  7. | Device ID      | 0                                                          |
  8. | Device Name    | Intel(R) UHD Graphics 770                                  |
  9. | Device Vendor  | Intel(R) Corporation                                       |
  10. | Device Driver  | 32.0.101.6325 (Windows)                                    |
  11. | OpenCL Version | OpenCL C 3.0                                               |
  12. | Compute Units  | 32 at 1550 MHz (256 cores, 0.794 TFLOPs/s)                 |
  13. | Memory, Cache  | 60999 MB RAM, 1920 KB global / 64 KB local                 |
  14. | Buffer Limits  | 4095 MB global, 4194296 KB constant                        |
  15. |----------------'------------------------------------------------------------|
  16. | Info: OpenCL C code successfully compiled.                                  |
  17. | FP64  compute                                          not supported        |
  18. | FP32  compute                                         0.664 TFLOPs/s ( 1x ) |
  19. | FP16  compute                                         1.229 TFLOPs/s ( 2x ) |
  20. | INT64 compute                                         0.058  TIOPs/s (1/12) |
  21. | INT32 compute                                         0.239  TIOPs/s (1/3 ) |
  22. | INT16 compute                                         2.776  TIOPs/s ( 4x ) |
  23. | INT8  compute                                         2.809  TIOPs/s ( 4x ) |
  24. | Memory Bandwidth ( coalesced read      )                         39.26 GB/s |
  25. | Memory Bandwidth ( coalesced      write)                         36.18 GB/s |
  26. | Memory Bandwidth (misaligned read      )                         32.13 GB/s |
  27. | Memory Bandwidth (misaligned      write)                         17.96 GB/s |
  28. |-----------------------------------------------------------------------------|
  29. |----------------.------------------------------------------------------------|
  30. | Device ID      | 1                                                          |
  31. | Device Name    | NVIDIA GeForce RTX 3070 Laptop GPU                         |
  32. | Device Vendor  | NVIDIA Corporation                                         |
  33. | Device Driver  | 528.24 (Windows)                                           |
  34. | OpenCL Version | OpenCL C 3.0                                               |
  35. | Compute Units  | 40 at 1560 MHz (5120 cores, 15.974 TFLOPs/s)               |
  36. | Memory, Cache  | 16383 MB VRAM, 1120 KB global / 48 KB local                |
  37. | Buffer Limits  | 4095 MB global, 64 KB constant                             |
  38. |----------------'------------------------------------------------------------|
  39. | Info: OpenCL C code successfully compiled.                                  |
  40. | FP64  compute                                         0.305 TFLOPs/s (1/64) |
  41. | FP32  compute                                        18.509 TFLOPs/s ( 1x ) |
  42. | FP16  compute                                        19.447 TFLOPs/s ( 1x ) |
  43. | INT64 compute                                         2.742  TIOPs/s (1/8 ) |
  44. | INT32 compute                                         9.826  TIOPs/s (2/3 ) |
  45. | INT16 compute                                         8.364  TIOPs/s (1/2 ) |
  46. | INT8  compute                                        35.291  TIOPs/s ( 2x ) |
  47. | Memory Bandwidth ( coalesced read      )                        424.47 GB/s |
  48. | Memory Bandwidth ( coalesced      write)                        430.51 GB/s |
  49. | Memory Bandwidth (misaligned read      )                        424.67 GB/s |
  50. | Memory Bandwidth (misaligned      write)                        103.33 GB/s |
  51. | PCIe   Bandwidth (send                 )                          9.73 GB/s |
  52. | PCIe   Bandwidth (   receive           )                          7.15 GB/s |
  53. | PCIe   Bandwidth (        bidirectional)            (Gen4 x16)    8.15 GB/s |
  54. |-----------------------------------------------------------------------------|
  55. |-----------------------------------------------------------------------------|
复制代码
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2025-6-22 12:52 , Processed in 0.007926 second(s), 5 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表