找回密码
 加入我们
搜索
      
查看: 17515|回复: 61

[网络] I226-V不断流了?!

[复制链接]
发表于 2023-7-30 18:53 | 显示全部楼层 |阅读模式
新一代软路由N100,千篇一律配I226,没得选螃蟹。
请教厂家为啥这样,却是声称早就不断流了。
我信了。

直到今天,100%重现断流
环境:
N100 I226, 接TPLINK XDR5480 2.5G口,两台PC接千兆口。
观测:
一边iperf3, 一边ping;
使用:
第一遍测试,iperf3 -c N100_IP
第二遍测试使用:iperf3 -c N100_IP -R
结果:
第二遍时iperf3过程中,出现断流。ping包观测显示断流时间为11s。
很容易重现,按上面过程,百发百中。

于是不得不研究了一下解决办法
关闭I226 TSO功能。

手工输入(linux):
/usr/sbin/ethtool -K 你的网卡名 tso off
立即管用,同样环境重新测试无数遍也不断流了。

写进系统服务,自动启动:
PVE参考代码
创建执行文件/etc/systemd/system/off_tso.service
  1. [Unit]
  2. Description=Turn off TSO for NIC

  3. [Service]
  4. Type=oneshot
  5. ExecStart=/usr/sbin/ethtool -K enp5s0 tso off
  6. ExecStart=/usr/sbin/ethtool -K enp6s0 tso off
  7. ExecStart=/usr/sbin/ethtool -K enp7s0 tso off
  8. ExecStart=/usr/sbin/ethtool -K enp8s0 tso off
  9. RemainAfterExit=yes

  10. [Install]
  11. WantedBy=multi-user.target
复制代码

systemctl enable --now off_tso.service
systemctl daemon-reload

搞定。

发表于 2023-7-30 18:56 | 显示全部楼层
我感觉温度的 问题,我秋冬 225 不掉,天热起来偶尔掉。
发表于 2023-7-30 19:04 | 显示全部楼层
有一说一,2.5G网卡的bug搞了接近3年还没完全解决,有点太离谱了
发表于 2023-7-30 19:06 | 显示全部楼层
刷网卡更新固件呢?
发表于 2023-7-30 19:15 来自手机 | 显示全部楼层
试试看,有个mini居然是这个
发表于 2023-7-30 19:22 来自手机 | 显示全部楼层
你启发了我。现在我知道为什么过去三年我的i225从来没有断流。因为我用pfsense,在设置里默认就关闭了TSO跟LRO
发表于 2023-7-30 19:50 | 显示全部楼层
根本不懂这些代码怎么用我想如果有个厂能出个全瑞昱的2.5g,贵几百块也会有人买吧
发表于 2023-7-30 19:53 | 显示全部楼层
tso不是i217的问题吗,226也能用这代码?
发表于 2023-7-30 19:55 | 显示全部楼层
TSO会让网卡帮助CPU进行分段,关了会降低网卡负载

所以还是负载高了导致断网
发表于 2023-7-30 19:55 来自手机 | 显示全部楼层
刚整了个n5105+i266v的软路由,裸机直刷openwrt,出现过和笔记本的螃蟹网卡不兼容,协商千兆一直断流,然后网卡自动协商为100M就不断流了,不管它,i266v和ms510txup的10G口连接,自动xie'pgamgwdg2.5G,到目前为止很稳定,没出现断流现象
发表于 2023-7-30 19:58 | 显示全部楼层
这个关tso gso的e1000的老bug到现在新硬件还有?
发表于 2023-7-30 21:02 来自手机 | 显示全部楼层
i226断流的话e3100断流吗
发表于 2023-7-30 21:05 | 显示全部楼层
win下  怎么处理
发表于 2023-7-30 21:28 | 显示全部楼层
请问WIN怎么关呢
发表于 2023-7-30 21:29 | 显示全部楼层
本帖最后由 IceyHeart 于 2023-8-1 13:22 编辑

LEDE openwrt
photo_2023-08-01_13-20-44.jpg

1. 内核升级到 5.4.234, 5.15.98, 6.1.15  ,解决开启 Offload 加速后 SKU 内核报错的问题
2. Intel 全系列 I225/226 网卡内核禁止 EEE ,解决 1G/2.5Gbps 网络中断流的问题
3. 版本更新到 R23.3.3
发表于 2023-7-30 21:53 | 显示全部楼层
ikuai + 226 从未断流
发表于 2023-7-30 21:56 | 显示全部楼层
螃蟹卡一样断流,负载一大,温度一高,慢,断,等。
发表于 2023-7-30 22:14 来自手机 | 显示全部楼层
刚买的j4125➕226 4口,因为是pt大户,所以最近实际环境测试了下,150MB(大B)下载昨晚一晚上,cpu最高到了68,但是反而没事,而今天晚上就上传做种又断了一次。
刚给加了一个风扇,下周mt出大包再看看。如果再不行,就开始测试不直通,目前是2wan1lan都是直通口。
发表于 2023-7-30 22:24 | 显示全部楼层
我都是一步到位上10G 。2.5G是瞎折腾。
现在上10G的成本比2.5G还便宜不少。不少二手服务器设备。
发表于 2023-7-30 22:37 | 显示全部楼层
本帖最后由 yufei888 于 2023-7-30 22:55 编辑
  1. [Unit]
  2. Description=Turn off TSO for NIC

  3. [Service]
  4. Type=simple
  5. ExecStart=/var/opt/network-disable-tso.sh
  6. TimeoutSec=0
  7. RemainAfterExit=yes
  8. GuessMainPID=no

  9. [Install]
  10. WantedBy=multi-user.target
复制代码


这样子就不会报错了。
发表于 2023-7-30 22:48 来自手机 | 显示全部楼层
I219lm
完美入坑
发表于 2023-7-30 23:15 来自手机 | 显示全部楼层
牙膏也三哥化了?
发表于 2023-7-31 00:08 | 显示全部楼层
看来我买螃蟹的2.5g软路由是明智的选择
发表于 2023-7-31 01:12 | 显示全部楼层
同第二楼意见。
简介TSO(TCP Segment Offload)技术是一种利用网卡的少量处理能力,降低CPU发送数据包负载的技术,需要网卡硬件及驱动的支持。

要不TSO功能有BUG。要不就是TSO功能导致网卡芯片的负载高,热死了。
楼主加强散热试试?
 楼主| 发表于 2023-7-31 07:19 | 显示全部楼层
yufei888 发表于 2023-7-30 22:37
这样子就不会报错了。

代码只是参考哈。

Type=oneshot可以支持多行ExecStart,simple只支持一行。
同样oneshot在pve7还可以一行ExecStart多句代码,但在pve8中只支持多行ExecStart单句代码了。
示例是在pve8中实际验证并在运行的。
 楼主| 发表于 2023-7-31 07:34 | 显示全部楼层
ShireCiel 发表于 2023-7-31 01:12
同第二楼意见。
简介TSO(TCP Segment Offload)技术是一种利用网卡的少量处理能力,降低CPU发送数据包负载 ...


软路由密罐,已经有一个小风扇对着抽风了,改善散热有限。

目前这个现象,个人倾向于TSO设计有问题。而不是过热导致。
因为,
同样环境,去掉2.5G转千兆,从千兆口改为在2.5G口跑测试,跑满2.35G~2.38G bps,没有发现即时断流。
也就是,这个BUG并不是在负载最满连续2.5Gbps的时侯出现,反而在连续千兆流量时出现。
而且,
整天运行,有时能观察到在某个时间段网络无流量,初以为PVE死,但后来察看PVE运行时间是连续的,也就是PVE没死。也就是在那个时间段,也出现了断流,那时没跑测试,负载不会太高。
发表于 2023-7-31 09:25 | 显示全部楼层
hawie 发表于 2023-7-31 07:34
软路由密罐,已经有一个小风扇对着抽风了,改善散热有限。

目前这个现象,个人倾向于TSO设计有问题。而 ...

不是说对着外壳吹啊。
而是拆开看看226-V得网卡芯片在哪里。 直接加强 芯片得散热。
 楼主| 发表于 2023-7-31 12:21 | 显示全部楼层
ShireCiel 发表于 2023-7-31 09:25
不是说对着外壳吹啊。
而是拆开看看226-V得网卡芯片在哪里。 直接加强 芯片得散热。 ...

有两个风扇,对着外壳吹的是1225大风扇,对着内部吹的是8010小风扇,软路由就一巴掌大,如果还要从网卡做导热什么的,就太夸张了。
这个测试时间不长,在断流那个时刻,应该没有过热,以后也可以拿测温枪验证一下。
发表于 2023-7-31 15:03 | 显示全部楼层
提供下我情况,我是4口226,pve+ros,直通了3个给ros,2wan+1lan,因为ros可以很方便的看掉过几次。目前都是掉wan。目前也在摸排原因
发表于 2023-7-31 15:16 | 显示全部楼层
IceyHeart 发表于 2023-7-30 21:29
LEDE的openwrt针对这个问题已经在固件中关闭了TSO

请问,lede的网址是什么?想下最新的LEDE版op
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2024-5-13 22:01 , Processed in 0.015197 second(s), 6 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表