找回密码
 加入我们
搜索
      

Linux下的NFS和SMB(RDMA)文件拷贝性能的迷思和讨论

查看数: 5388 | 评论数: 23 | 收藏 5
关灯 | 提示:支持键盘翻页<-左 右->
    组图打开中,请稍候......
发布时间: 2024-9-12 16:26

正文摘要:

本帖最后由 oldnetdog 于 2024-9-13 17:32 编辑 问题:Linux下NFS(RDMA启用)挂载,大文件拷贝速度上不去 环境描述: 1、服务端,物理机 基本硬件:EPYC 7282,内存128G,PCIe Gen4 操作系统:Debian 12.6,Ker ...

回复

oldnetdog 发表于 2024-9-14 11:53
summerq 发表于 2024-9-13 13:39
哈哈 没错 其实我就是想说 rdma导致4k拉垮

我这几块MemBlaze 6530 都没有做过稳态处理,全盘都还没写完过一次,进入稳态后,4K性能应该是有提升空间的。
Dolfin 发表于 2024-9-14 09:49
summerq 发表于 2024-9-13 13:03
主机debian kernel 6.10,ext4,ksmbd,单盘u2 H3200,网卡connectx6-dx 25g
客户端win server 2022, 网卡 ...

这盘4K Q1还挺漂亮的
summerq 发表于 2024-9-13 13:39
oldnetdog 发表于 2024-9-13 13:35
我这里XFS比Ext4性能好不少,4K都不太行,SMBDirect检查过了是启用的。

哈哈 没错 其实我就是想说 rdma导致4k拉垮
summerq 发表于 2024-9-13 13:03
主机debian kernel 6.10,ext4,ksmbd,单盘u2 H3200,网卡connectx6-dx 25g
客户端win server 2022, 网卡也是cx6,windows拷贝速度如下图
1.jpg

chopin1998 发表于 2024-9-13 12:12
oldnetdog 发表于 2024-9-13 11:50
32个,因为服务器是16核32线程的。

那应该是足够, 奇怪.....
oldnetdog 发表于 2024-9-13 11:50
chopin1998 发表于 2024-9-13 11:11
看着链路是ok的。。

你开了几个nfs server进程? 要么你cp的时候, top看一下 ...

32个,因为服务器是16核32线程的。
chopin1998 发表于 2024-9-13 11:11
oldnetdog 发表于 2024-9-13 10:50
在/run/shm试了下,测试了10GB文件,远程服务器采用XFS性能比Ext4好,SMBDirect比NFSoRDMA好。
仍然没有 ...

看着链路是ok的。。

你开了几个nfs server进程? 要么你cp的时候, top看一下
chopin1998 发表于 2024-9-13 10:27
LexarARES_4T/ DAPUSTOR R5100

都是 pcie4的, 不过对于2.xGB/s 只要是nvme的都没问题吧。。

你要是怕本地的盘速度影响, 可以先复制到 /run/shm/ 里
oldnetdog 发表于 2024-9-13 10:18
chopin1998 发表于 2024-9-13 10:09
有,
mount -t nfs -o rdma,port=20049,rsize=1048576,wsize=1048576,noatime  xxxx xxxxx

mount参数都差不多。
除了处理器,你本地和远程的硬盘是什么规格的,操作系统内核版本呢?
chopin1998 发表于 2024-9-13 10:09
oldnetdog 发表于 2024-9-13 10:05
启用了NFSoRDMA了么?

有,
mount -t nfs -o rdma,port=20049,rsize=1048576,wsize=1048576,noatime  xxxx xxxxx

但是估计影响不会太大, 最多是降低一点点cpu, 毕竟只有25G, cpu硬刚都能跑满。

100G可能对单核要求就比较高
oldnetdog 发表于 2024-9-13 10:05
chopin1998 发表于 2024-9-13 10:00
25G cx4-l 互联,

nfs server 是 一台epyc7002, client是 13700k

启用了NFSoRDMA了么?
chopin1998 发表于 2024-9-13 10:00

25G cx4-l 互联,

nfs server 是 一台epyc7002, client是 13700k

100G的太高级没用过, 但是25G 的nfs 单cp进程就能跑满呀
放个图, 你看一下?


1.jpg
oldnetdog 发表于 2024-9-13 09:43
Dolfin 发表于 2024-9-13 04:03
一些探讨:
1.对NFS不怎么熟悉,不好回答你的疑问,仅有的测试中,NFS使用NFSoRDMA,local_lock=none,asyn ...

感谢,简单测试了下
1、Linux客户机1下,fio吞吐测试,bs=1M,基本可以打满100Gb网卡。NFS稳定测试通过,SMB报错失败,ksmbd还是不太稳定。
2、Windows下fastcopy,远程SMB目录,如果是XFS,速度最高4GB/s,Ext4反而比较慢,大概1GB/s。

我服务器处理器性能一般,和你EPYC Gen4差很多。
Dolfin 发表于 2024-9-13 04:03
本帖最后由 Dolfin 于 2024-9-13 04:16 编辑

一些探讨:
1.对NFS不怎么熟悉,不好回答你的疑问,仅有的测试中,NFS使用NFSoRDMA,local_lock=none,async,rsize wsize 1M,内核参数sunrpc.rdma_slot_table_entries和nfs线程数128,其他默认没动。客户端FIO 1MB 顺序读取,接近10GB/s,服务器CPU占有率15%。

2.SMB服务器 Windows Server是很好的选择。2022下大文件顺序IO基本可以跑满带宽,200Gbps也不是问题。100GbE下,非测速负载,在实际传输中,Robocopy可超过10GB/s,接近吞吐极限,IOPS也是所向披靡。另外,也像SummerQ说的,Server 2025在存储上,如NVME,S2D这些都有新的提升和创造,貌似也会原生支持Nvmf。这要还不够,还有SMB集群,翻倍。

3.SPDK提供的Nvmf拥有更极限的爆发,单盘超过250万的 iops,分配核心1-2两个就行。

4.我的实验条件下,顺序大文件吞吐都不成问题,基本都是满的,不管是SMB NFS Nvmf;不过4K随机的IOPS,差别不小,建议也测试一下。
oldnetdog 发表于 2024-9-12 22:05
iooo 发表于 2024-9-12 21:52
感觉通用环境对如此高的带宽优化有限,更多的是对高并发和低延迟的支持
...

确实也是,不过NVMeOF可以打满网路带宽。
200G卡和模块也有,但服务器性能有点跟不上,PCIe Gen3带宽不足。
oldnetdog 发表于 2024-9-12 22:00
本帖最后由 oldnetdog 于 2024-9-12 22:02 编辑
summerq 发表于 2024-9-12 20:54
你的测试结果跟我以前试过的一致。 如果你有时间,可以试试两边都是win server 2025,据说它nvme驱动以及sm ...


本地和远端都试了试EXT4和mount参数,差异不大,速度或高一些或低一些,目前看来,这个方向调整应该影响不大。

有空再试试看WinServer 2025,不过服务器端正常情况不会选择Windows作为服务端。

看到kernel 6.11下Ext4性能提升10%,等发布了看一下。
iooo 发表于 2024-9-12 21:54
用BSD测试不知道支持程度如何
iooo 发表于 2024-9-12 21:52
感觉通用环境对如此高的带宽优化有限,更多的是对高并发和低延迟的支持
summerq 发表于 2024-9-12 20:54
你的测试结果跟我以前试过的一致。 如果你有时间,可以试试两边都是win server 2025,据说它nvme驱动以及smbdirect性能都提高很多。
linux这边,kernel 6.11 会在这周末发布,你可以再看看性能。并且ext4的性能也有提高。这里xfs可以换ext4,同时mount参数加上 noatime nodiratime试试
oldnetdog 发表于 2024-9-12 18:16
mmma 发表于 2024-9-12 17:59
NFS本身性能就不好,建议能用smb还是smb吧。

就是想知道Linux下NFS单文件拷贝还有多少提升空间。Linux下SMBDirect稳定性还是略差些。
NFS本身,看vastnfs的文档,通过多通道和RDMA,性能可以支持到160GiB/s以上。
mmma 发表于 2024-9-12 17:59
NFS本身性能就不好,建议能用smb还是smb吧。

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2025-5-20 09:07 , Processed in 0.013661 second(s), 9 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表