设为首页   锐捷官网
用其他帐号登录:
查看: 2414|回复: 3

[用户故事] 故障案例三分享之丢包/错报,欢迎拍砖

[复制链接]

6

主题

37

帖子

117

积分

初级会员

Rank: 2

积分
117
发表于 2015-12-1 17:54:51 | 显示全部楼层 |阅读模式
某客户的对外服务办公网络通过大量二层交换机连接终端,这些终端对外提供实时服务,而所有的二层交换机都通过双上行的方式连接到核心交换机上,客户网络示意图如下:
file:///C:/Users/ADMINI~1/AppData/Local/Temp/msohtmlclip1/01/clip_image001.jpg
客户的网络是局域网典型网络结构,整个网络通过STP来避免环路并实现双上行链路备份,整个网络设计合理规范,但是突然有段时间客户反馈下面的终端业务办理很慢,而且有时断时续的现象。工程师首先明确网络现象,确认网络中所有的终端业务都受到影响,因此工程师怀疑网络中有环路导致引发广播风暴从而影响网络的正常转发。因此工程师将处于备份状态的一台S7500下行连接业务的端口都断开,断开后,终端业务恢复,因此可以确认为网络环路导致了业务丢包,但是依然不能具体的问题点在那里。接下来工程师在晚上网络没业务流量的情况下,对S7500下行连接的L2交换机进行逐个排查,也即逐个将下行的L2交换机上行恢复到双上行结构同时开通过个Ping窗口对业务进行监测。果不其然,再将某台L2交换局恢复到双上行结构时,Ping业务出现丢包现象。工程师对该接入L2交换机的接口状态进行查看,发现两个上行端口都处于STP Forwarding状态。这种情况下必然导致网络环路。 * 后工程师确认是光模块硬件问题导致状态错误而引起STP计算错误。
TIPS:对于局域网的问题,由于局域网有大量的L2交换局、HUB以及接入很多终端,因此局域网的问题要特别注意广播风暴引发的全网振荡,而广播风暴的引发的局域网问题,可能是由于环路产生,而ARP Flooding、病毒、非法软件也都有可能引发局域网振荡,对于局域网网络问题建议如下;
à  尽可能将L3网关下移,增加路由L3层次的报文处理,减少L2交换层次的连接;
à  避免网络中单个VLAN下交换机或者HUB级联层次太多,减少广播风暴以及网络环路的影响;
à  在接入终端服务器或者PC的交换机端口上配置STP 边缘端口、BPDU保护;
à  全网部署EAD,对接入网络的用户终端强制实施企业安全策略,严格控制终端用户的网络使用行为,有效地加强用户终端的主动防御能力
故障案例分享系列之丢包/错报总结

丢包的问题是网络中 * 常见的问题也是耗费时间 * 久定位时间较长的问题,三个案例基本上涵盖了常见的丢包问题的处理思路,我们在日常的网络维护过程中需要慢慢积累经验,也许丢包也并不那么惹人烦!

图片.jpg
人生一半是无知的,另一半是学习和认知。
回复

使用道具 举报

2

主题

62

帖子

408

积分

中级会员

Rank: 3Rank: 3

积分
408
发表于 2015-12-9 10:19:22 | 显示全部楼层
“因此工程师怀疑网络中有环路导致引发广播风暴从而影响网络的正常转发。因此工程师将处于备份状态的一台S7500下行连接业务的端口都断开,断开后”

有了怀疑后,应该小心求证吧,这个断开行为太危险了。
广播风暴可以通过pc抓包快速排查是不是出现风暴。
回复 支持 反对

使用道具 举报

12

主题

71

帖子

368

积分

中级会员

Rank: 3Rank: 3

积分
368
发表于 2015-12-24 14:54:34 | 显示全部楼层
“客户的网络是局域网典型网络结构,整个网络通过STP来避免环路并实现双上行链路备份,整个网络设计合理规范”
我理解为,表面上看没问题,但是使用中可能出现问题,比如:客户可能有多级级联的二层交换机,虽然可以使用,但是已经有隐患了
回复 支持 反对

使用道具 举报

1

主题

6

帖子

19

积分

新手上路

Rank: 1

积分
19
发表于 2016-3-21 14:08:34 | 显示全部楼层
光模块硬件出问题,为什么不是断开??
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则