找回密码
 加入我们
搜索
      
楼主: Juzi丶

[网络] Mellanox SN2010 25GbE/100GbE 交换机 开箱

  [复制链接]
发表于 2021-10-3 02:54 | 显示全部楼层
Juzi丶 发表于 2021-10-3 02:48
ce68xx的话只有极少数型号用的海思,剩下的都是博通方案的,要单比asic的话肯定spectrum要强 ...

好吧,对应环境不一样了!
最近发现用交换机起dhcp,静态路由上网慢的问题!
没丢包无法找到原因
哈哈
发表于 2021-10-3 07:18 来自手机 | 显示全部楼层
太厉害了~
 楼主| 发表于 2021-10-3 09:14 | 显示全部楼层
hfyeqp 发表于 2021-10-3 02:54
好吧,对应环境不一样了!
最近发现用交换机起dhcp,静态路由上网慢的问题!
没丢包无法找到原因

不建议用交换的dhcp服务器,特别是国产这些,基本就只能保证能够完成“分配ip”就什么都不能做了,随便搭个dnsmasq都好使很多
发表于 2021-10-3 09:40 | 显示全部楼层
牛货!!QNAP出的25G,40G和100G网卡也是推这款交换机,个人觉得是家用的理想机型,10G,25G,40G和100G通吃。
发表于 2021-10-3 11:25 | 显示全部楼层
牛逼牛逼
发表于 2021-10-3 11:33 来自手机 | 显示全部楼层
wjm47196 发表于 2021-10-2 14:09
牛x啊 我要是重新装修我也来一套
当然用不到这么高级的就是了

我公司就有全套,产品现成的,价格问题
发表于 2021-10-3 11:36 来自手机 | 显示全部楼层
hfyeqp 发表于 2021-10-3 02:54
好吧,对应环境不一样了!
最近发现用交换机起dhcp,静态路由上网慢的问题!
没丢包无法找到原因

不丢包只是一方面,延迟什么的很好查的,你先确定是不是交换机问题
发表于 2021-10-3 13:05 | 显示全部楼层
  1. switch-b82fc8 [standalone: master] # show power consumers
  2. -------------------------------------------------------------------------
  3. Module  Device            Sensor  Power   Voltage  Current  Status
  4.                                   [Watts] [Volts]  [Amp]
  5. -------------------------------------------------------------------------
  6. MGMT    CURR_MONITOR      12V     49.55   11.76    4.21     OK

  7. Total power used : 49.55 Watts

  8. switch-b82fc8 [standalone: master] # show system capabilities
  9. IB: Supported, L2, Adaptive Routing
  10. Ethernet: Supported, L2, L3
  11. GW: Supported
  12. Max SM nodes: 648
  13. IB Max licensed speed: FDR
  14. Ethernet Max licensed speed: 56Gb

复制代码

比我的6036+L3协议的powerpc省电多了,我这个才到40/56G
发表于 2021-10-3 13:24 | 显示全部楼层
yan1990_y 发表于 2021-10-3 11:36
不丢包只是一方面,延迟什么的很好查的,你先确定是不是交换机问题

有线正常,有点怀疑是不是ubnt ac-pro的ap问题了,但也不可能二个ap都出问题啊
发表于 2021-10-3 13:25 | 显示全部楼层
Juzi丶 发表于 2021-10-3 09:14
不建议用交换的dhcp服务器,特别是国产这些,基本就只能保证能够完成“分配ip”就什么都不能做了,随便搭 ...

华为的s6720应该不至于那么垃圾啊
主要是vlan太多,只能用交换做三层吧,不然不能互通啊
发表于 2021-10-3 15:47 来自手机 | 显示全部楼层
hfyeqp 发表于 2021-10-3 13:24
有线正常,有点怀疑是不是ubnt ac-pro的ap问题了,但也不可能二个ap都出问题啊 ...

一层层ping过去,看延迟不就知道哪一个网关出问题了,还有带宽一起测
发表于 2021-10-3 17:02 | 显示全部楼层
劳驾问下 噪音如何 ?
发表于 2021-10-3 18:00 | 显示全部楼层
tonrain 发表于 2021-10-3 17:02
劳驾问下 噪音如何 ?

噪音肯定不行,一般都是要放机柜的!我放在了洗衣机旁边
 楼主| 发表于 2021-10-3 20:46 | 显示全部楼层
tonrain 发表于 2021-10-3 17:02
劳驾问下 噪音如何 ?

和sx6012一样,差不多电风扇最大档
发表于 2021-10-3 22:11 | 显示全部楼层
啊这.....这玩意小黄鱼真的有货吗。。。。。。
发表于 2021-10-4 19:49 | 显示全部楼层
楼主,性能怎么样,有测试吗
发表于 2021-10-4 20:06 | 显示全部楼层
本帖最后由 声色茶马 于 2021-10-7 20:58 编辑
test 发表于 2021-10-2 21:04
你们说的惊喜是指得10000?


这是CHH,理解一下亲。

毕竟100G,两套模块都贵过这交换机了。
发表于 2021-10-4 22:00 | 显示全部楼层
请问,setpci -s 00:00.0 8.w  这个是通用的吗?还是后面的 00:00.0 8.w需要根据不同的CPU来做修改?
 楼主| 发表于 2021-10-4 22:22 | 显示全部楼层
6892731 发表于 2021-10-4 22:00
请问,setpci -s 00:00.0 8.w  这个是通用的吗?还是后面的 00:00.0 8.w需要根据不同的CPU来做修改? ...

C2000系列通用
发表于 2021-10-7 15:18 来自手机 | 显示全部楼层
不错,家里新部署光路,来一个这个很爽啊。
发表于 2021-10-7 17:26 | 显示全部楼层
本帖最后由 jerrytsao 于 2021-10-7 17:30 编辑

CHH终于有人开了10/40/56GbE和25/50/100GbE全能型Switch, 就是这个噪音哈哈, Dell EMC Z9100-ON放在eBay一直没下单主要就是这个原因
 楼主| 发表于 2021-10-7 18:13 | 显示全部楼层
jerrytsao 发表于 2021-10-7 17:26
CHH终于有人开了10/40/56GbE和25/50/100GbE全能型Switch, 就是这个噪音哈哈, Dell EMC Z9100-ON放在eBay一 ...

Z9100和DX010一样是Tomahawk 1代,又热又吵还是电老虎
发表于 2021-10-7 20:17 | 显示全部楼层
我也入坑了,风扇有点吵,有什么办法解决
发表于 2021-10-8 06:55 | 显示全部楼层
sunneyboy 发表于 2021-10-7 20:17
我也入坑了,风扇有点吵,有什么办法解决

不插模块,风扇转速会从17000降到7000左右,
而只要插入一个模块,立马从7000升到14000,并且不再下降,一直维持,它的风扇策略估计就是这样?
发表于 2021-10-8 06:59 | 显示全部楼层
sunneyboy 发表于 2021-10-7 20:17
我也入坑了,风扇有点吵,有什么办法解决

是否能通过改固件来修改成静音模式,好象SX6012有修改成静音模式的,不知这个能不能修改?

另外一种是拆开机器,给风扇加降噪线或是换风扇?
发表于 2021-10-8 07:01 | 显示全部楼层
此机功耗还不错,整机不插模块是36W的实测功耗,插了模块,10G的每个加4W.
 楼主| 发表于 2021-10-8 09:19 | 显示全部楼层
本帖最后由 Juzi丶 于 2021-10-8 22:43 编辑

加楼说一下机器的初始和常用设置吧

必须两个电源都接上电

准备好PuTTY,或者你习惯的工具

前面板有两个RJ45接口
上面的是ETH管理口
下面的是Console口

首先先把上面的ETH管理口接上路由器,之后会获取DHCP分配的IP
第一次开机需要接下面的Console口

然后按下图设置,USB转Console线建议买FTDI芯片的

步骤1.png

等屏幕上信息滚完之后按一下回车会出现控制台
输入默认账号和密码admin登陆控制台

  1. NVIDIA Onyx Switch Management
  2. switch-xxxxxx login: admin
  3. Password:
  4. Number of total successful connections since last 1 days: 0
  5. Your password has been changed
  6. NVIDIA Switch
复制代码


第一句是问你是否进行初始设置
  1. Do you want to use the wizard for initial configuration?
  2. 您想使用向导进行初始配置吗?
复制代码

输入yes

然后跟着向导输入一些基本信息
  1. Step 1: Hostname?
  2. Step 2: Use DHCP on mgmt0 interface?
  3. Step 3: Enable IPv6?
  4. Step 4: Update time?
  5. Step 5: Enable password hardening?
  6. Step 6: Admin password (Must be typed)?
  7. Step 6: Confirm admin password?
  8. Step 7: Monitor password (Must be typed)?
  9. Step 7: Confirm monitor password?

  10. 第 1 步:主机名?
  11. 第 2 步:在 mgmt0 接口上使用 DHCP?
  12. 第 3 步:启用 IPv6?
  13. 第 4 步:更新时间?
  14. 第 5 步:启用密码强度?
  15. 第 6 步:管理员密码(必须输入)?
  16. 第 6 步:确认管理员密码?
  17. 第 7 步:监控密码(必须输入)?
  18. 第 7 步:确认监控密码?
复制代码


密码强度就是禁用简单密码,yes之后后面两个密码都需要大小写数字和符号
下面是我的示例

  1. NVIDIA Onyx Switch Management
  2. switch-xxxxxx login: admin
  3. Password:
  4. Number of total successful connections since last 1 days: 0
  5. Your password has been changed
  6. NVIDIA Switch

  7. Configuration wizard

  8. Do you want to use the wizard for initial configuration?

  9. Step 1: Hostname? [switch-xxxxxx]
  10. Step 2: Use DHCP on mgmt0 interface? [yes]
  11. Step 3: Enable IPv6? [yes] no
  12. Step 4: Update time? [2021/10/08 03:57:40]
  13. Step 5: Enable password hardening? [yes] no
  14. Step 6: Admin password (Must be typed)?
  15. Step 6: Confirm admin password?
  16. Step 7: Monitor password (Must be typed)?
  17. Step 7: Confirm monitor password?

  18. You have entered the following information:

  19.    1. Hostname: switch-xxxxxx
  20.    2. Use DHCP on mgmt0 interface: yes
  21.    3. Enable IPv6: no
  22.    4. Update time: 2021/10/08 03:57:59
  23.    5. Enable password hardening: no
  24.    6. Admin password (Must be typed): (CHANGED)
  25.    7. Monitor password (Must be typed): (CHANGED)

  26. To change an answer, enter the step number to return to.
  27. Otherwise hit <enter> to save changes and exit.

  28. Choice:


  29. Zero-touch is disabled
  30. Configuration changes saved.

  31. To return to the wizard from the CLI, enter the "configuration jump-start"
  32. command from configure mode.  Launching CLI...

  33. switch-xxxxxx [standalone: master] >
复制代码


然后进入配置模式,在CLI下修改任何配置都要先输入enable然后configure terminal

  1. switch-xxxxxx [standalone: master] >
  2. switch-xxxxxx [standalone: master] > enable
  3. switch-xxxxxx [standalone: master] # configure terminal
  4. switch-xxxxxx [standalone: master] (config) #
复制代码


然后先解锁模块

  1. switch-xxxxxx [standalone: master] (config) # fae cable-stamping-unlock 100g_lr4
  2. switch-xxxxxx [standalone: master] (config) # fae cable-stamping-unlock 40g_lr4
  3. switch-xxxxxx [standalone: master] (config) # fae cable-stamping-unlock eth_100g
  4. switch-xxxxxx [standalone: master] (config) # fae cable-stamping-unlock eth_sfp_25g
复制代码


任何更改都不会自动保存,CLI要输入命令保存,在WEB网页上的话就是右上角的SAVE或者存档标准

  1. switch-xxxxxx[standalone: master] (config) # configuration write
  2. switch-xxxxxx[standalone: master] (config) #
复制代码


QQ图片20211008215417.png

QQ截图20211008215516.png

风扇转速会在25分钟左右降速到20%(6000~7000RPM)
开机后转速是60%,每5分钟左右降10%

步骤2.png

上面初始配置设置了管理口DHCP获取IP,所以我们可以使用下面的命令获取管理口状态

  1. switch-xxxxxx [standalone: master] (config) # show interfaces mgmt0 brief

  2. Interface mgmt0 status:
  3.   Comment         :
  4.   VRF             : mgmt
  5.   Admin up        : yes
  6.   Link up         : yes
  7.   DHCP running    : yes
  8.   IP address      : 10.0.0.181
  9.   Netmask         : 255.0.0.0
  10.   IPv6 enabled    : no
  11.   Speed           : 1000Mb/s (auto)
  12.   Duplex          : full (auto)
  13.   Interface type  : ethernet
  14.   Interface source: bridge
  15.   Bonding master  : vrf_mgmt
  16.   MTU             : 1500
  17.   HW address      : xx:xx:xx:xx:xx:xx
复制代码


可以看到获取的IP是10.0.0.181
这时候就可以用IP登陆SSH控制台而不用Console了

步骤3.png

同理,输入账号密码登陆,然后输入enable和configure terminal进入配置模式

使用25G/100G链路必须设置FEC
下面是示例

  1. #关闭端口自动协商,设置端口速率为25G
  2. switch-xxxxxx [standalone: master] (config) # interface ethernet 1/7 speed 25G no-autoneg force
  3. #设置FEC模式,可以看到有RS FC NO三个可以选,这里选择RS
  4. switch-xxxxxx [standalone: master] (config) # interface ethernet 1/7 fec-override
  5. fc-fec  no-fec  rs-fec
  6. switch-xxxxxx [standalone: master] (config) # interface ethernet 1/7 fec-override rs-fec force
  7. switch-xxxxxx [standalone: master] (config) #
复制代码


在电脑上Mellanox网卡的话,可以安装官网的驱动程序MFT后使用mlxlink验证链路模式

MFT下的工具必须在管理员模式运行
mlxlink.bat -d mt4117_pciconf0的网卡的第一个接口
mlxlink.bat -d mt4117_pciconf0.1的网卡的第二个接口
下面是示例(Windows平台)
  1. Windows PowerShell
  2. 版权所有 (C) Microsoft Corporation。保留所有权利。

  3. 尝试新的跨平台 PowerShell https://aka.ms/pscore6

  4. PS C:\Windows\system32> cmd
  5. Microsoft Windows [版本 10.0.19044.1237]
  6. (c) Microsoft Corporation。保留所有权利。

  7. C:\Windows\system32>cd C:\Program Files\Mellanox\WinMFT

  8. C:\Program Files\Mellanox\WinMFT>
  9. C:\Program Files\Mellanox\WinMFT>mlxfwmanager.exe
  10. Querying Mellanox devices firmware ...

  11. Device #1:
  12. ----------

  13.   Device Type:      ConnectX4LX
  14.   Part Number:      MCX4121A-ACU_Ax
  15.   Description:      ConnectX-4 Lx EN network interface card; 25GbE dual-port SFP28; PCIe3.0 x8; UEFI Enabled; tall bracket
  16.   PSID:             MT_0000000266
  17.   PCI Device Name:  mt4117_pciconf0
  18.   Base MAC:         
  19.   Versions:         Current        Available
  20.      FW             14.31.1014     N/A
  21.      PXE            3.6.0403       N/A
  22.      UEFI           14.24.0013     N/A

  23.   Status:           No matching image found


  24. C:\Program Files\Mellanox\WinMFT>mlxlink.bat -d mt4117_pciconf0.1

  25. Operational Info
  26. ----------------
  27. State                           : Active
  28. Physical state                  : LinkUp
  29. Speed                           : 25GbE
  30. Width                           : 1x
  31. FEC                             : Standard RS-FEC - RS(528,514)
  32. Loopback Mode                   : No Loopback
  33. Auto Negotiation                : ON

  34. Supported Info
  35. --------------
  36. Enabled Link Speed              : 0x38007013 (25G,10G,1G)
  37. Supported Cable Speed           : 0x38007013 (25G,10G,1G)

  38. Troubleshooting Info
  39. --------------------
  40. Status Opcode                   : 0
  41. Group Opcode                    : N/A
  42. Recommendation                  : No issue was observed.


  43. C:\Program Files\Mellanox\WinMFT>
复制代码

可以看到端口的FEC已经运行在RS模式(根据交换机上的数据自动协商)

mlxcables查看模块型号,收发光等信息
mlxcables.bat -d mt4117_pciconf0_cable_0的网卡的第一个接口
mlxcables.bat -d mt4117_pciconf0_cable_1的网卡的第二个接口
  1. C:\Program Files\Mellanox\WinMFT>mlxcables.bat -d mt4117_pciconf0_cable_1 -q
  2. Querying Cables ....

  3. Cable #1:
  4. ---------
  5. Cable name    : mt4117_pciconf0_cable_1
  6. >> No FW data to show
  7. -------- Cable EEPROM --------
  8. Identifier    : SFP/SFP+/SFP28 (03h)
  9. Technology    : Transceiver
  10. Compliance    : Unspecified
  11. OUI           : 0xac4afe
  12. Vendor        : Hisense
  13. Serial number : UBU9C083728
  14. Part number   : LTF1325-BH1
  15. Revision      : A
  16. Temperature   : N/A
  17. Length        : 0 m
复制代码

  1. C:\Program Files\Mellanox\WinMFT>mlxcables.bat -d mt4117_pciconf0_cable_1 -DDM
  2. Cable DDM:
  3. ----------
  4. Temperature    : 52C
  5. Voltage        : 3.2639V
  6. RX Power : -1.1351dBm
  7. TX Power : -2.1120dBm
  8. TX Bias  : 53.8300mA
  9. ----- Flags -----
  10. Temperature:
  11.    Alarm  high  : 0
  12.    Warning high : 0
  13.    Warning low  : 0
  14.    Alarm  low   : 0
  15. Voltage:
  16.    Alarm  high  : 0
  17.    Warning high : 0
  18.    Warning low  : 0
  19.    Alarm  low   : 0
  20. RX/TX Power and TX Bias:
  21.    RX Power alarm  high : 0
  22.    RX Power warning high: 0
  23.    RX Power warning low : 0
  24.    RX Power alarm  low  : 0

  25.    TX Power alarm  high : 0
  26.    TX Power warning high: 0
  27.    TX Power warning low : 0
  28.    TX Power alarm  low  : 0

  29.    TX Bias alarm  high  : 0
  30.    TX Bias warning high : 0
  31.    TX Bias warning low  : 0
  32.    TX Bias alarm  low   : 0

  33. ----- Thresholds -----
  34.         Temperature high alarm threshold   : 95C
  35.         Temperature high warning threshold : 85C
  36.         Temperature low  warning threshold : -40C
  37.         Temperature low  alarm threshold   : -50C

  38.         Voltage high alarm threshold   : 3.6300V
  39.         Voltage high warning threshold: 3.4650V
  40.         Voltage low  warning threshold: 3.1350V
  41.         Voltage low  alarm   threshold: 2.9700V

  42.         RX Power high alarm threshold : 5.0000dBm
  43.         RX Power high warn threshold  : 2.0000dBm
  44.         RX Power low  warn threshold  : -10.5012dBm
  45.         RX Power low  alarm threshold : -13.4969dBm

  46.         TX Power high alarm threshold : 5.0000dBm
  47.         TX Power high warn threshold  : 2.0000dBm
  48.         TX Power low  warn threshold  : -7.0006dBm
  49.         TX Power low  alarm threshold : -10.0000dBm

  50.         TX Bias high alarm threshold  : 110.0000mA
  51.         TX Bias high warn threshold   : 100.0000mA
  52.         TX Bias low  warn threshold   : 1.0000mA
  53.         TX Bias low  alarm threshold  : 1.0000mA
  54. 
复制代码


有关交换机接口的其他设置可以看官方文档
https://docs.mellanox.com/display/Onyxv393202/Ethernet+Interfaces
https://docs.mellanox.com/displa ... +Interface+Commands

RoCE文档
https://docs.mellanox.com/pages/viewpage.action?pageId=56986516

机箱管理
https://docs.mellanox.com/display/Onyxv393202/Chassis+Management

如果发现任何异常的地方可以抓取日志查看详情

步骤4.png

如果日志出现下面错误

  1.     Oct  7 04:28:57 switch-xxxxxx temp_control[8490]: [tc.NOTICE]: Read all qsfp temperatures properly:[false], changing dynamic ambient mode
  2.   
  3.     Oct  7 04:28:57 switch-xxxxxx temp_control[8490]: [tc.NOTICE]: Dynamic ambient usage: Enabled. NOT all qsfps were read properly
  4.   
  5.     Oct  7 04:28:57 switch-xxxxxx temp_control[8490]: [tc.NOTICE]: minimum chassis fan speed - previous [20%] current [50%] after reading ambient temperature of [33.50 C]
  6.   
  7.     Oct  7 04:28:57 switch-xxxxxx temp_control[8490]: [tc.NOTICE]: Fan:[/MGMT/FAN1/f1], interval:[57] ,in affected area, max temperatures: ASIC:[48] X86:[33] QSFP_CABLE:[0] , Updating fan speed from:[20%] to:[50%]
复制代码


注意这两句
Read all qsfp temperatures properly:[false], changing dynamic ambient mode
Dynamic ambient usage: Enabled. NOT all qsfps were read properly

意思就是temp_control没有正确读到模块的温度数据
哪怕执行
show interfaces ethernet x/x transceiver diagnostics
后能读取到模块温度

机箱管理还是照样会把风扇转速提高到最低40%(11000~12000PRM)

如果遇到这种情况请更换模块,或者用官方模块
(或者等nvidia良心发现修复一下,又或者换cumulus linux或者sonic,再或者你的使用环境可以无视风扇提速)
发表于 2021-10-8 09:28 | 显示全部楼层
Juzi丶 发表于 2021-10-8 09:19
测了一下发现某些模块的温度读取有问题,热控制读取不到模块温度,就会把风扇提速到40% ...

那配哪个品牌的模块,可以正确读取温度,让风扇速度降下来
发表于 2021-10-8 09:57 | 显示全部楼层
请问RESTRICTED_CMDS的license是从哪里获取的呢,我的sn2700没这个lic
 楼主| 发表于 2021-10-8 10:56 | 显示全部楼层
kongtaibai 发表于 2021-10-8 09:57
请问RESTRICTED_CMDS的license是从哪里获取的呢,我的sn2700没这个lic

https://forums.servethehome.com/ ... y.10786/post-309240
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2024-5-19 13:03 , Processed in 0.015991 second(s), 6 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表