设为首页   锐捷官网
用其他帐号登录:
查看: 2245|回复: 1

[交换机] ERPS坏网网络不通

[复制链接]

761

主题

733

帖子

3830

积分

版主

Rank: 7Rank: 7Rank: 7

积分
3830
发表于 2015-4-7 09:27:07 | 显示全部楼层 |阅读模式
1、故障现象
ERPS环网(单环或相交环)的环境中,出现网络不通。
2、故障可能原因
1)配置原因,设备没有配置RPL owner节点,设备ERPS配置双RPL owenr节点;
2)操作问题,配置操作错误导致环路;
3)ERPS环状态无法稳定到IDLE状态。
3、故障处理步骤
步骤1、检查各设备的ERPS配置
步骤2、ERPS环网操作问题导致环路
步骤3、ERPS环网状态无法恢复到idle状态
4、故障信息搜集
如果经以上步骤排查后故障无法解决,请收集如下故障信息并联系4008-111-000协助处理。
show version
show run
show log
show cpu
show interface description
show interface status
show interface counter
show mac-address-table
show erps
show erps global
debug erps packet
您排查故障的过程日志
步骤1、使用show run命令查看各设备的ERPS环配置。
ERPS环配置要点:
1.一个环中必须并且只能有一个RPL-owner节点
2.非RPL-Owner节点可以不配置RPL-port命令
【27i-2】设备的ERPS配置
erps enable
erps raps-vlan 4001
ring-port west GigabitEthernet 0/3 east GigabitEthernet 0/4  
rpl-port west rpl-owner
state enable
interface GigabitEthernet 0/3
switchport mode trunk
rldp port bidirection-detect shutdown-port
!
interface GigabitEthernet 0/4
switchport mode trunk
rldp port bidirection-detect shutdown-port
【27i-3】设备的ERPS配置
erps enable
erps raps-vlan 4001
ring-port west GigabitEthernet 0/3 east GigabitEthernet 0/4  
rpl-port east rpl-owner
state enable
interface GigabitEthernet 0/3
switchport mode trunk
rldp port bidirection-detect shutdown-port
!
interface GigabitEthernet 0/4
switchport mode trunk
rldp port bidirection-detect shutdown-port
通过show run发现ERPS环中如果有两台设备都配置了RPL-Owner节点,ERPS环网中,会将rpl-owner节点设置为Block状态,导致环网中断,如下拓扑:
1.png
步骤2:打开设备的debug erps packet查看erps报文的接收情况。
由于网络中断,如果无法登录到所有设备收集erps信息,可以在RPL-ower部署的设备27i-2(或者27-4),打开debug erps packet查看erps报文的接收情况,如果设备检测接收到同一个raps-vlan的R-APS(NR,RB)报文中的MAC地址是否和自己一致,发现不一致的话,可以确定一个ERPS环配置了两个RPL-ower节点。
27i-2# debug erps packet
22:23:34:35:  %7: [ERPS-PKT]:Send erps packet R-APS(NR, RB) at 198567506, raps-vlan 4001 status 0x80
22:23:34:35:  %ERPS-5-TOPOLOGY_CHANGE: Topology changed for R-APS VLAN 4001, The ring changed state from protection to idle
22:23:34:35:  %7: [ERPS-PKT]:Send erps packet R-APS(NR, RB) at 198567509, raps-vlan 4001 status 0x80      
22:23:34:35:  %7: [ERPS-PKT]:Send erps packet R-APS(NR, RB) at 198567510, raps-vlan 4001 status 0x80    //rpl-owner节点会向外发送(NR,RB)报文
22:23:34:39:  %7: [ERPS-PKT]:Recv packet at 198567995, len = 60
22:23:34:39:  %7: [ERPS-PKT]:Recv erps packet R-APS(NR) at 198567995, raps-vlan 4001 ifx 4 status 0x0 node-id 001a.a917.de42
22:23:34:39:  %7: [ERPS-PKT]:Recv packet at 198567995, len = 60
22:23:34:39:  %7: [ERPS-PKT]:Recv erps packet R-APS(NR) at 198567995, raps-vlan 4001 ifx 3 status 0x0 node-id 001a.a917.de42   //接收到另一个RPL-Owner节点发送的(NR,RB)报文,从MAC可以看出为27i-3设备发送,说明网络中还有一个ERPS RPL-Owner节点,表示网络中配置了双RPL-Owner。
27i-2# no debug all
All possible debugging has been turned off
此过程中各设备的ERPS状态如下所示:
【27i-2设备】
27i-2#sho erps
ERPS Information
Global Status               : Enabled
Link monitored by           : Not Oam
-------------------------------------------
R-APS VLAN                  : 4001
Ring Status                 : Enabled
West Port                   : Gi0/3        (Blocking)  
East Port                   : Gi0/4        (Forwarding)
RPL Port                    : West Port
Protected VLANs             : ALL
RPL Owner                   : Enabled
Holdoff Time                : 0 milliseconds
Guard Time                  : 500 milliseconds
WTR Time                    : 2 minutes
Current Ring State          : idle
【27i-3设备】
27i-3#sho erps
ERPS Information
Global Status               : Enabled
Link monitored by           : Not Oam
-------------------------------------------
R-APS VLAN                  : 4001
Ring Status                 : Enabled
West Port                   : Gi0/3       (Forwarding)
East Port                   : Gi0/4       (Blocking)  
RPL Port                    : East Port
Protected VLANs             : ALL
RPL Owner                   : Enabled
Holdoff Time                : 0 milliseconds
Guard Time                  : 500 milliseconds
WTR Time                    : 5 minutes
Current Ring State          : idle
【27i-4设备】
27i-4#sho erps
ERPS Information
Global Status               : Enabled
Link monitored by           : Not Oam
-------------------------------------------
R-APS VLAN                  : 4001
Ring Status                 : Enabled
West Port                   : Gi0/3        (Forwarding)
East Port                   : Gi0/4        (Forwarding)
RPL Port                    : None
Protected VLANs             : ALL
RPL Owner                   : Disabled
Holdoff Time                : 0 milliseconds
Guard Time                  : 500 milliseconds
WTR Time                    : 2 minutes
Current Ring State          : idle
从上述信息可以看出,由于27i-2设备的gi0/3口、27i-3设备的gi0/4口被blcok,将导致从27i-2设备上将无法访问到27i-3设备
步骤3:将其中一台设备的RPL-owner配置删除,等待2分钟(2700G设备的WTR计数为2分钟,erps状态收敛成功)使用show erps命令,查看ERPS状态。环状态稳定后(为idle状态),只有27i-2设备的gi0/3口为Block状态。
删除RPL-owner的步骤如下:
       1、先shutdown一个erps关联接口
       2、关闭erps 环4001功能
       3、删除rpl-ower配置
       4、开启erps环4001功能
       5、恢复被shutdown的erps关联接口
范例:修改27i-3设备(或者27i-2设备)的ERPS配置。修改命令如下:
S27i-3(config)#int gi 0/4
S27i-3(config-if)#shutdonwn
S27i-3(config)#erps raps-vlan 4001
S27i-3(config-erps 4001)#no state enable   
S27i-3(config-erps 4001)#no rpl-port
S27i-3(config)#int gi 0/4
S27i-3(config-if)#no shutdonwn
【27i-2设备】的erps状态:
S27i_2#show erps
ERPS Information
Global Status               : Enabled
Link monitored by           : Not Oam
-------------------------------------------
R-APS VLAN                  : 4001
Ring Status                 : Enabled
West Port                   : Gi0/7        (Forwarding)
East Port                   : Gi0/8        (Forwarding)
RPL Port                    : None
Protected VLANs             : ALL
RPL Owner                   : Disabled
Holdoff Time                : 0 milliseconds
Guard Time                  : 500 milliseconds
WTR Time                    : 2 minutes
Current Ring State          : idle
【27i-4设备】的erps状态:
S27i_2#show erps
ERPS Information
Global Status               : Enabled
Link monitored by           : Not Oam
-------------------------------------------
R-APS VLAN                  : 4001
Ring Status                 : Enabled
West Port                   : Gi0/7        (Block)
East Port                   : Gi0/8        (Forwarding)
RPL Port                    : West
Protected VLANs             : ALL
RPL Owner                   : Disabled
Holdoff Time                : 0 milliseconds
Guard Time                  : 500 milliseconds
WTR Time                    : 2 minutes
Current Ring State          : idle
【27i-5设备】的erps状态:
S27i_2#show erps
ERPS Information
Global Status               : Enabled
Link monitored by           : Not Oam
-------------------------------------------
R-APS VLAN                  : 4001
Ring Status                 : Enabled
West Port                   : Gi0/7        (Forwarding)
East Port                   : Gi0/8        (Forwarding)
RPL Port                    : None
Protected VLANs             : ALL
RPL Owner                   : Disabled
Holdoff Time                : 0 milliseconds
Guard Time                  : 500 milliseconds
WTR Time                    : 2 minutes
Current Ring State          : idle
步骤2、确认操作过程,是否在修改ERPS关联的端口,没有先shutdown ERPS关联的端口,直接修改关联接口,导致无法收敛出现环路
拓扑如下:
11.png
存在问题的操作过程如下:
【场景一】拓扑如上
1、27i-2是ERPS环中的RPL-Owner节点,27i-5需要配置的erps关联端口是gi0/7(up),gi0/8(up),但是在关联端口时配置错误成gi0/7(up),gi0/6(down)
27i-2(config)#erps raps-vlan 4010
27i-2(config-erps 4010)#no state enable
27i-2(config-erps 4010)#ring-port west gi0/7 east gi0/6
27i-2(config-erps 4010)#ring-port west rpl-owner
27i-2(config-erps 4010)#state enable
2、由于27i-2的ERPS环网发现gi0/6为down状态,所以0/7会发送SF报文,27i-2处于protection状态,需要在接收到NR报文,触发WTR定时器,恢复到IDE状态
3、在27i-2设备上,将ERPS关联端口gi 0/6改为gi 0/8,但是此操作没有shutdown erps关联接口gi0/7(或者gi0/8)
27i-2(config)#erps raps-vlan 4010
27i-2(config-erps 4010)#no state enable   //停止发送SF报文
27i-2(config-erps 4010)#ring-port west gi0/7 east gi0/8    //配置ERPS关联接口
27i-2(config-erps 4010)#ring-port west rpl-owner  //开启erps,没有触发NR报文,导致WTR定时器无法开启,整网的ERPS控制报文丢失,ERPS无法收敛出现环路。ERPS处于protoction状态,ERPS关联端口处于(Link Normal)转发状态
27i-2(config-erps 4010)#state enable
4、按照上面修改后的ERPS环的状态如下:
27i-2#sho erps
ERPS Information
Global Status               : Enabled
Link monitored by           : Not Oam
-------------------------------------------
R-APS VLAN                  : 4010
Ring Status                 : Enabled
West Port                   : Gi0/7        (Forwarding)
East Port                   : Gi0/8        (Forwarding)
RPL Port                    : West Port
Protected VLANs             : ALL
RPL Owner                   : Enabled
Holdoff Time                : 0 milliseconds
Guard Time                  : 500 milliseconds
WTR Time                    : 2 minutes
Current Ring State          : protection
27i-2# debug erp pa    //打开debug erps 报文,没有接受到报文,ERPS的WTR定时器丢失,ERPS的控制面就失效了
【场景二】拓扑如上,27i-5需要配置的erps关联端口是gi0/7(up),gi0/8(up),但是在关联端口时配置错误gi0/7(up),gi0/6(down)
27i-5(config)#erps raps-vlan 4010
27i-5(config-erps 4010)#no state enable
27i-5(config-erps 4010)#ring-port west gi0/7 east gi0/6
27i-5(config-erps 4010)#state enable
27i-5(config-erps 4010)#00:00:20:23:  %ERPS-5-PORT_STATE_CHANGE: Port GigabitEthernet 0/6 on R-APS VLAN 4010 has been set to forwarding state.
00:00:20:23:  %ERPS-5-PORT_STATE_CHANGE: Port GigabitEthernet 0/7 on R-APS VLAN 4010 has been set to forwarding state.
27i-5#show erps
ERPS Information
Global Status               : Enabled
Link monitored by           : Not Oam
-------------------------------------------
R-APS VLAN                  : 4010
Ring Status                 : Enabled
West Port                   : Gi0/7        (Link Normal)
East Port                   : Gi0/6        (Link Failure)  //关联一个down的接口,ERPS环只有gi0/6是down的,gi0/7发生SF报文
RPL Port                    : None
Protected VLANs             : ALL
RPL Owner                   : Disabled
Holdoff Time                : 0 milliseconds
Guard Time                  : 500 milliseconds
WTR Time                    : 2 minutes
Current Ring State          : protection
2).在没有shutdown一个erps关联端口(gi0/7或gi0/8)的情况下,把gi0/6替换成gi0/8,出现WTR定时器丢失ERPS控制报文丢失,ERPS无法收敛,并出现环路;ERPS处于protoction状态,ERPS关联端口处于(Link Normal)转发状态
27i-5#config
27i-5(config)#erps raps-vlan 4010
27i-5(config-erps 4010)#no state enable
27i-5(config-erps 4010)#ring-port west gi0/7 east gi0/8   //在没有shutdonw erps关联接口gi0/7,或gi0/8的情况下直接修改
27i-5(config-erps 4010)#state enable
27i-5#sho erps
ERPS Information
Global Status               : Enabled
Link monitored by           : Not Oam
-------------------------------------------
R-APS VLAN                  : 4010
Ring Status                 : Enabled
West Port                   : Gi0/7        (Link Normal)
East Port                   : Gi0/8        (Link Normal)
RPL Port                    : None
Protected VLANs             : ALL
RPL Owner                   : Disabled
Holdoff Time                : 0 milliseconds
Guard Time                  : 500 milliseconds
WTR Time                    : 2 minutes
Current Ring State          : protection
确认存在上述操作,导致ERPS环存在环路问题时,通过如下配置进行恢复
int gi 0/7          //在存在问题的设备上,对ERPS关联的端口进行shutdown操作
shutdown
erps raps-vlan 4010
no state enable
ring-port west gi0/7 east gi0/8   //进行ERPS环关联的端口修改
ring-port west rpl-owner
state enable
int gi 0/7          //完成上述配置后,对端口进行恢复操作
no shutdown
步骤3、排查网络中是否存在erps状态无法收敛到idle状态
1、首先通过show查看ERPS环网中设备的状态,确定是否在在ERPS状态无法手链到IDLE状态
27i-2#sho erps
ERPS Information
Global Status               : Enabled
Link monitored by           : Not Oam
-------------------------------------------
R-APS VLAN                  : 4010
Ring Status                 : Enabled
West Port                   : Gi0/7        (Blocking)  
East Port                   : Gi0/8        (Forwarding)
RPL Port                    : West Port
Protected VLANs             : ALL
RPL Owner                   : Enabled
Holdoff Time                : 0 milliseconds
Guard Time                  : 500 milliseconds
WTR Time                    : 2 minutes
Current Ring State          : protection   //设备一直停留在protection状态
2、确认ERPS环网中的设备是否全部正确开启ERPS功能
在如下拓扑中,在27i-3设备未开启ERPS功能
2.png
1、27i-2、27i-4设备正确配置ERPS功能后,在27i-2设备上debug erps packet报文查看erps状态,由于27i-3未开启ERPS功能,27i-2、27i-4设备的rldp检测到环路,会将各自设备的gi0/3置为disable状态
【27i-2设备】
27i-2#sho rldp
rldp state         : enable
rldp hello interval: 3
rldp max hello     : 6
rldp local bridge  : 00d0.f822.33b9
-----------------------------------
GigabitEthernet 0/3
port state      : error
neighbor bridge : 001a.a917.de42
neighbor port   : GigabitEthernet 0/3
bidirection detect information :
     action: shutdown-port
     state : error
GigabitEthernet 0/4
port state      : normal
neighbor bridge : 00d0.f822.33e6
neighbor port   : GigabitEthernet 0/4
bidirection detect information :
     action: shutdown-port
     state : normal
27i-2#debug erps packet
21:22:42:32:  %7: [ERPS-PKT]:Send erps packet R-APS(SF) at 189615201, raps-vlan 4001 status 0x0
21:22:42:36:  %7: [ERPS-PKT]:Recv packet at 189615682, len = 60
21:22:42:36:  %7: [ERPS-PKT]:Recv erps packet R-APS(SF) at 189615682, raps-vlan 4001 ifx 4 status 0x0 node-id 00d0.f822.33e6
21:22:42:37:  %7: [ERPS-PKT]:Send erps packet R-APS(SF) at 189615701, raps-vlan 4001 status 0x0
21:22:42:41:  %7: [ERPS-PKT]:Recv packet at 189616182, len = 60
//由于设备的gi0/3口被rldp检测为error状态,所以设备一直在发送SF报文,通告对端设备(当节点的自身链路down 时,发送该报文通知其它节点。)
27i-2#no debug all
All possible debugging has been turned off
27i-2#sho erps
ERPS Information
Global Status               : Enabled
Link monitored by           : Not Oam
-------------------------------------------
R-APS VLAN                  : 4001
Ring Status                 : Enabled
West Port                   : Gi0/3        (Link Failure)            //端口由于被rldp检测为error口,所以此处状态显示为link failure
East Port                   : Gi0/4        (Forwarding)
RPL Port                    : West Port
Protected VLANs             : ALL
RPL Owner                   : Enabled
Holdoff Time                : 0 milliseconds
Guard Time                  : 500 milliseconds
WTR Time                    : 2 minutes
Current Ring State          : protection
【27i-4设备】
27i-4#sho rldp
rldp state         : enable
rldp hello interval: 3
rldp max hello     : 2
rldp local bridge  : 00d0.f822.33e6
-----------------------------------
GigabitEthernet 0/4
port state      : normal
neighbor bridge : 00d0.f822.33b9
neighbor port   : GigabitEthernet 0/4
bidirection detect information :
     action: shutdown-port
     state : normal
loop detect information        :
     action: shutdown-port
     state : normal
GigabitEthernet 0/3
port state      : error
neighbor bridge : 001a.a917.de42
neighbor port   : GigabitEthernet 0/4
bidirection detect information :
     action: shutdown-port
     state : error
loop detect information        :
     action: shutdown-port
     state : normal
27i-4#debug erps packet
07:01:23:57:  %7: [ERPS-PKT]:Send erps packet R-APS(SF) at 60983722, raps-vlan 4001 status 0x0
07:01:24:01:  %7: [ERPS-PKT]:Recv packet at 60984141, len = 60
07:01:24:01:  %7: [ERPS-PKT]:Recv erps packet R-APS(SF) at 60984141, raps-vlan 4001 ifx 4 status 0x0 node-id 00d0.f822.33b9
07:01:24:02:  %7: [ERPS-PKT]:Send erps packet R-APS(SF) at 60984222, raps-vlan 4001 status 0x0
27i-4#sho erps
ERPS Information
Global Status               : Enabled
Link monitored by           : Not Oam
-------------------------------------------
R-APS VLAN                  : 4001
Ring Status                 : Enabled
West Port                   : Gi0/3        (Link Failure)
East Port                   : Gi0/4        (Forwarding)
RPL Port                    : None
Protected VLANs             : ALL
RPL Owner                   : Disabled
Holdoff Time                : 0 milliseconds
Guard Time                  : 500 milliseconds
WTR Time                    : 2 minutes
Current Ring State          : protection
注:ERPS环里面,没开启ERPS功能的27i-3可以透传ERPS报文,但由于此过程中RLDP先生效,所以27i-2、27i-4设备的gi0/3口始终处于RLDP检测的error状态,所以erps环中设备相应的端口始终处于link failure状态:所以在整个ERPS物理环故障和故障恢复,ERPS无法恢复到IDE状态,整网互联还是正常的,无环路。
【解决方案】:针对未正确开启erps功能的设备,配置ERPS命令。
3、确认网络中的链路连接是否出现down,当ERPS环中某条物理链路一直处于故障down(Link Failure)的状态。
恢复故障链路,ERPS状态是可以恢复到IDLE状态的,故障链路一直down的话,就一直无法切换到IDLE状态,这个是ERPS正常的行为
如下拓扑:
22.png
27i-3#sho erps
ERPS Information
Global Status               : Enabled
Link monitored by           : Not Oam
-------------------------------------------
R-APS VLAN                  : 4001
Ring Status                 : Enabled
West Port                   : Gi0/3       (Forwarding)
East Port                   : Gi0/4       (Link Failure)
RPL Port                    : None
Protected VLANs             : ALL
RPL Owner                   : Disabled
Holdoff Time                : 0 milliseconds
Guard Time                  : 500 milliseconds
WTR Time                    : 5 minutes
Current Ring State          : protection
27i-2#22:23:22:29:  %ERPS-5-PORT_STATE_CHANGE: Port GigabitEthernet 0/3 on R-APS VLAN 4001 has been set to forwarding state.
22:23:22:29:  %ERPS-5-TOPOLOGY_CHANGE: Topology changed for R-APS VLAN 4001, The ring changed state from idle to protection   //有拓扑变更的提示
27i-2#debug erps pack
27i-2#22:23:23:39:  %7: [ERPS-PKT]:Recv packet at 198501930, len = 60
22:23:23:39:  %7: [ERPS-PKT]:Recv erps packet R-APS(SF) at 198501930, raps-vlan 4001 ifx 3 status 0x0 node-id 001a.a917.de42   
22:23:23:39:  %7: [ERPS-PKT]:Recv packet at 198501943, len = 60
22:23:23:39:  %7: [ERPS-PKT]:Recv erps packet R-APS(SF) at 198501943, raps-vlan 4001 ifx 4 status 0x0 node-id 00d0.f822.33e6
//持续接收到27i-3和27i-4 发送的SF报文,ERPS处于protection状态
27i-2#no debug all  
All possible debugging has been turned off
27i-2#sho erps
ERPS Information
Global Status               : Enabled
Link monitored by           : Not Oam
-------------------------------------------
R-APS VLAN                  : 4001
Ring Status                 : Enabled
West Port                   : Gi0/3        (Forwarding)
East Port                   : Gi0/4        (Forwarding)
RPL Port                    : West Port
Protected VLANs             : ALL
RPL Owner                   : Enabled
Holdoff Time                : 0 milliseconds
Guard Time                  : 500 milliseconds
WTR Time                    : 2 minutes
Current Ring State          : protection
【解决方案】:恢复故障链路,如果确认端口被shutdown(通过no shutdown恢复),确认端口由于线路问题(更换线路解决)



回复

使用道具 举报

0

主题

1

帖子

7

积分

新手上路

Rank: 1

积分
7
发表于 2017-7-28 13:17:38 | 显示全部楼层
我们是处理废旧电子垃圾的单位,从事回收报废线路板废旧设备进行废旧物资再生循环利用(回收-加工-冶炼),避免对周边环境造成污染,我们有多年的回收经验,可以为您在效益和环保和可持续发展方面保持 * 地位加油出力!如有需要处理请联系我们。
公司本着“实价回收、互惠互利、信义为本”的经营理念,长期向广州、深圳、北京、上海、天津、香港、福州、西安等地区的工厂企业单位收购废旧物品。
E-mail:81785767@qq.com  Cel:18025530908
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则