设为首页   锐捷官网
用其他帐号登录:
查看: 2665|回复: 3

[经验分享] EG网关产品故障定位不传秘籍之ping丢包或延迟排查

[复制链接]

6

主题

11

帖子

449

积分

中级会员

Rank: 3Rank: 3

积分
449
发表于 2016-11-2 09:54:16 | 显示全部楼层 |阅读模式
本帖最后由 hongjianwu 于 2016-11-11 14:52 编辑

        
EG网关产品故障定位不传秘籍之ping丢包或延迟排查


                              
本文背景:
       如今网关市场故障横行、攻击作祟,可谓民不聊生。通过大数据分析EG产品故障占据市场故障的半壁江山,如果把网关市场比作江湖,那么EG产品就是““丐帮””,我们知道”丐帮”乃天下第一大帮,而EG现在也确实占据了网关市场的头把交椅熟悉江湖规矩的人士都明白,”丐帮”目前在中原武林声势浩大,但凡出来混江湖的都要拼命跟”丐帮”扯上点关系,下面我们将为您解开”丐帮”这层神秘的面纱,同时和您一起踏上寻找传说中的克敌制胜的不传秘籍之旅……
丐帮”组织架构
“丐帮”“弟子”众多,身份复杂,组织结构相当严密,否则怎么能够号令天下?在帮中,以外观和规格来区分等级:日常主事儿的有18大“长老””(EG1000系列,EG2000系列,EG350和EG150系列),虽然这些人名为”丐帮”,实际都是名门望族,在江湖上拥有显赫的地位,这其中尤以EG2000K等灯”长老”、EG350红帽”长老”和EG2000XE18摸”长老”广为人知。参与议事的还有10多位黄金八袋”长老”,这里面有大家熟知的、纵横江湖多年的EG150死磕”长老”、E2000CE呆鹅”长老”、EG2000GE菊花”长老”等等,当然部分”长老”年事已高如EG1000L/C/S/M等几位”长老”基本不参与议事,平常也多拜读诵经或搞搞副业,但是他们仍然把持着”丐帮”主要话语权。“丐帮”“弟子”众多,如果您想了解”丐帮”子弟群英谱,请您猛戳这里:http://www.ruijie.com.cn/fw/rj/57597
     
        
登录锐捷官网下载
点击首页——服务与支持——常用工具-通用工具——锐捷小网络与网关产品软件版本地图官网版
      
   
没错,“丐帮”弟子群英谱,都在里面了。
丐帮”绝世武功
     说了这么多,您一定想知道”丐帮”有哪些绝世武功吧?说起”丐帮”武功,自然是名满天下的“降龙十八掌”了,经过多年的发展,已成为网关江湖中最刚猛的武功。
      
传统武功都是越传越没落,一代不如一代,但”丐帮”的“降龙十八掌'却是历久弥新,愈发厉害。都说“降龙十八掌”总共有18招,其实经过这么多年发展,招数早就超过了18,目前比较知名的大招已经有19招,包括六种内功心法招数,比如大家耳熟能详的飞龙在天、潜龙勿用、神龙摆尾和亢龙有悔…..
别看降龙十八掌只有19招,其实每种大招都包含了很多子招,变幻无穷,招式超过500了,基本可以对付网关江湖中的各种强敌,什么端口映射不成功,ping不通或ping丢包延迟,上不了网、认证异常等都不在话下。
有人会问,”丐帮”的“降龙十八掌”到底厉害不厉害呢?“降龙十八掌”如此复杂精密的武功何时可练成?我们当然知道整个武林也会关注此事,很多“弟子”都希望通过在榜单上露脸而引起世人关注。那么问题就来了,如何修炼?别急,等下且听洒家娓娓道来。

本文期望:
“降龙十八掌”如此复杂精密的武功,”丐帮”是如何代代传承、不断推陈出新的?这其实与”丐帮”的武功贡献机制有关,长期以来,”丐帮”弟子乞讨得到粮食钱物,都是要贡献给帮里的,如果您通过本秘诀修炼了我”丐帮”大神功,望您不介分享,传播远扬,共同把”降龙十八掌”发扬光大。

秘籍修炼必读:
1、该秘籍包含网关所有产品的故障定位招式,当然也可适用交换、无线等其他产品,看您如何灵活运用。
2
、秘籍分为内外功、招式两部分,招式是术,内功才是道,因此练此神功一定要先修炼内功

秘籍内功修炼:
ü  故障现象收集
ü  故障定位——分段排查法
ü  故障定位——替换对比法
ü  故障定位——简化环境法

故障现象收集:
1、 故障现象收集
故障现象是判断故障原因的根本,就像中医治病讲究望闻问切。提供准确的现象有利于尽快抓住根因,对症下药。
2、 收集哪些故障现象
故障发生的时间——为故障信息的筛选提供依据
故障发生的频率——判断故障的严重程度,排查是否突发因素影响
故障造成的影响——根据影响范围采取不同的定位手段
故障前后的操作——从操作中获取线索
举例:
案例:某客户电话呼入400反馈,内网上网慢或玩游戏卡。
现象确认:
1、什么时候出现的故障?
卡的时候是收集信息和判断的最佳时机,一旦错过,可能就无法判断。
2、是第一次出现么?
如果第一次出现有可能是非配置因素导致,如果多次出现有可能和配置或者软件版本或者线路质量有关系。
3、是部分PC卡还是全部卡?
部分卡意味着有可能是单点故障或者设备单点配置问题,全部卡就可能和流控、应用路由配置、以及环境有关系。
4、卡之前有没有做什么操作?
有些卡是人为的配置导致的,比如客户修改了流控的带宽,修改了应用的优先级,重新配置了应用路由都会导致卡。
故障定位——分段排查法:
分段顾名思义就是根据网络的拓扑逐段排查,广义分可以分为内网、设备、外网;狭义分可以分为接入层、汇聚层、核心层、出口网关等。
分段排查的利器——3PING操作!
Step 1:PC PING 内网主机的网关(一般在核心或者出口网关设备上)
这一步主要判断内网环境是否正常。
Step 2:PC PING 设备外网口地址
这一步主要查看设备配置是否正常。
Step 3:PC PING 设备外网网关及DNS或者在设备上PING 外网网关及DNS
这一步主要查看外网网关和DNS是否正常
举例:xx学校反馈内网学生无线网段上网很慢
拓扑:EG2000CE——汇聚——接入——RAP
分析:故障的关键词“无线”慢,从无线终端开始查。
Step 1 :现象确认
1)故障刚刚发生,之前一直正常
2)只出现过一次
3)所有的无线设备上网都慢
4)之前重启了下交换机设备
Step 2 :3 PING操作
1)首先找一台笔记本打开CMD(或者安卓手机打开带PING功能的软件)长PING网关看是否丢包
2)终端或者PC PING出口内网口是否丢包
3)终端或者PC PING出口外网口是否丢包
故障定位——替换对比法:
替换对比法主要是用在情况比较紧急、想尽快明确设备是否有问题的故障中。可以用型号设备替换,也可以用友商设备退换。这是我们经常使用方法,比如换设备、换配置、换电脑、换网线、还IP、换网络、还环境等做对比测试。
注意点:
1、替换要保证配置基本一致
2、替换的设备要保证是同一级别的,比如交换机去替换交换机
故障定位——简化环境法:
当一个复杂场景摆在你面前的时候,千万不要一把抓,简化环境法主要是通过简化拓扑来快速定位某个组件或者模块的问题,是快速定位的一种。
比如用户反馈内网有一台电脑无法打开某个网站,此时嫌疑人有一大堆,在条件允许的情况下我们是不可以先把电脑直接连接到外网,直接测试是否可以打开,如果可以那说明不是外网的问题,肯定是EG到内网的问题。此时再在直接在EG上接上电脑测试,如是通过了EG就有问题,那么再排查是EG上那个功能的问题,如果没有问题那就是用户内网的问题,具是那个设备呢还可以从外往内测试,直到最终确认哪台设备的问题,在确认是那个功能的问题,最后解决问题。
举例:xx学校反馈出口设备经常管理不了,但是上网正常。
拓扑:EG2000CE——防火墙(非我司设备)——S5750-E(3台环形VSU)——NBS252F(每层一个)
分析:由于涉及非我司设备因此为了定位问题,最快的办法就是跳过防火墙测试,或者直接将防火墙完全放通测试。
Step 1:故障现象确认
1)故障从某个时候开始就出现了,一直都不能访问WEB
2)故障时只有一台服务器可以访问出口设备,其余PC都无法访问
3)之前网络中心有做过全网优化
Step 2:简化测试法
1)直接拿PC到EG2000P的其他LAN口下测试,看是否网关配置问题
2)如果正常,将PC接到S57或者防火墙的桥口下测试是否可以访问
3)如果正常,说明故障点可能在内网S57下面,继续利用前面的3PING法测试
内功修炼总结:
这里,想跟大家在强调一下:为什么秘籍修炼前一定要先修炼内功,其实道理很简单,内功乃修炼秘籍的基础!假如内功没修炼好,直接练“降龙十八掌”19招式有可能会导致火入魔。当然除了像郭靖或萧大侠这种武学奇才(那也得天生具备浑厚内功)。大家都听说过某XX宝典,话说东方不败当年得到了XX宝典,心中万分高兴,打开第一页,赫然写着:“欲练此功,必先**”(此处略去N字),想必东方先生练此神功前肯定下了很大一部分功夫,最后才能成为天下第一,所以说内功基础重要性不言而喻,庆幸的是,“丐帮”“降龙十八掌”不传秘籍,不必**,也能成功”,前提是练好内功!
言归正传,我们说排查故障一定要从最基本的开始,不是一遇到故障就去抓包,debug就体现了技术水平有多么的高超,一定要有自己原则和套路,从物理层先开始,比如网线有没有插上啊,速率协商是否正确啊,当前使用的是不是这台设备啊,内外网接口有没有接反啊(大家不要笑,讲个故事有一个ACE的一级故障,几个牛逼工程师排查两天后,最终发现是设备搞错,原来是有两台设备,但排查是在一台没有业务的设备上进行,往往最专业,最资深工程师更容易忽略这些) 物理层排查后链路层看直连是不是通啊,跨网段是不是通啊,再看配置对不对,再show 信息表项看对不对,最后再去抓包,debug。

秘籍招式传授

招式一:ping丢包或延时大排查
1、 ping丢包或延时大记忆图谱:


2、 ping丢包或延时大排查思路(参见附件)
提醒:如果您对附件招式一内容仍似懂非懂,那么说明内功仍需加强,请您猛戳这里:http://www.ruijie.com.cn/fw/wd/41227
登录锐捷官网下载
点击首页——服务与支持——文档中心——锐捷EG和NPE产品防攻击优化与注意事项(V1.0)
      

作为招式一的加强版,定能助您熟能生巧,一招致胜。

招式二:未完待续,敬请期待…

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复

使用道具 举报

87

主题

311

帖子

1066

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
1066
发表于 2017-1-3 09:28:23 | 显示全部楼层

回帖奖励 +1

厉害了world锐捷。
回复 支持 反对

使用道具 举报

1

主题

3

帖子

13

积分

新手上路

Rank: 1

积分
13
发表于 2017-3-29 17:38:19 | 显示全部楼层
学习了,谢谢
回复 支持 反对

使用道具 举报

0

主题

6

帖子

17

积分

新手上路

Rank: 1

积分
17
发表于 2017-4-1 15:25:21 | 显示全部楼层
厉害  楼主文笔很好 技术也好  受教了
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则