设为首页   锐捷官网
用其他帐号登录:
查看: 3300|回复: 0

[无线百科] 如何借助工具对无线故障进行排查和预警?

[复制链接]

11

主题

17

帖子

227

积分

管理员

阁主

Rank: 9Rank: 9Rank: 9

积分
227
发表于 2016-9-20 09:28:37 | 显示全部楼层 |阅读模式
为了能够更好的促进课题,现提供WIS演示环境,老师们可以先行查看~
账号: wis_demo  密码: demoo0329
开始之前先给大家看一张图

图片1.png

无线网络的故障用四个字形容“五花八门”,再用四个字形容”千奇百怪“,还用……单从报障内容来看,完全是丈二和尚摸不着头脑,能看懂问题现象,永远摸不透问题本质,以至于无线网络的运维被吐槽,甚至大家对无线网络的期望低到低谷,开始仇恨。
其实这也见怪不怪,无线本身就虚无缥缈,难以理解,特别是遇到体验类的问题必现率不到10%,给故障诊断带来非常大的难度,让人不恨都难啊!
说这么多大道理,还不如看下具体点的案例
        
从上图中随性的选一个”上网慢“,这个也是大家运维过程中经常遇到的问题,抓典型么
按我个人的思路,遇到“上网慢的问题会怎么处理呢?
1、 大家都慢还是个别用户慢?(大部分需要到现场才能收集准确的信息)
A、 大家都慢原因有哪些?
B、 个别慢原因有哪些?
2、 到哪慢,到网关、到出口、到互联网?(用户不懂排查过程的尴尬)
上面这些思路大家都能想得到,但是解决的快慢各有不同,今天的目的就是与大家交流如何使用工具快速定位问题,排查问题不再一头雾水。
排查 * 基本的工具那就是CRT或者类似的工具了那排查“上网慢”要看哪些信息呢?
1、 查看AP底下用户的关联信息表了,AP上show dot11 associations all-client(当然查看前,还需要查看STA所在的AP,AP的地址,登陆AP等)

图片2.png

从表中我们需要了解:
1、 关联哪个radio?是否只是2.4G用户慢?这一点可以判断问题出现的频段
2、 上下行速率是多少?是否个别用户速率偏低?终端网卡性能差或者处于节电
3、 上行信号强度如何?终端是否处于覆盖边缘?终端周围存在较多障碍物
再者,还需要查看AP的射频状态
1、 发射功率大小?功率太低,导致覆盖盲区,终端上网慢
2、 噪声是多少?噪声低,存在干扰
等等,这些参数,这些都是早期研发定位问题的步骤与方法,至于哪个阶段慢,那方法就更简单了:ping网关,ping出口、ping互联网,这些对运维者来说再简单不过了,但是其中有个难点,ping网关慢,问题出现在这里,接下去需要做两个验证
1、 AP ping网关,排除AP到网关通路问题
2、 AP到到网关没问题,那就是射频端问题,难点就在这,射频端什么问题呢?没有专业的射频工具该如何查?
像上面这种情况, * 早也只能研发介入分析,甚至有时候现场还需要人蹲守,由于体验的种种原因,迫使研发也投入大量资源开发可以监控用户体验的工具WIS。

下面我们来看下WIS如何帮助我们提前预警、缩短排查周期(这期基于“上网慢”,WIS上需要看什么)
1、 上网慢所在的AP的Radio分析(区分2.4G与5G)

图片3.png

图中已经把上文使用CRT分析的原因归纳总结,主要原因有两点:
1、底噪低,受干扰了
2、终端上行信号弱

图片4.png

并且,可以监控当天AP的历史数据,甚至可以回溯已经发生过的问题,这样遇到上网慢的报障时,就可以及时了解情况,让管理者可以清晰的看到AP的工作状态。
以上是分析AP的整体体验情况,需要分析具体终端的体验情况,也可以直接搜索终端进行查看分析,如下图:
终端基本体验数据分析(全天候监控)
图中断层表示用户不在线
终端信息的射频情况分析

图片5.png
图片6.png

大家可以关注下,里面包含终端的关联信息
当然,查看终端 * 的体验情况比较费时,所以系统还对终端上下线异常进行单独分析。
终端上下线异常分析

图片7.png

上面的只是一个终端的异常,看不出整网情况,那要怎么预警呢?

图片8.png

上图是整网的一些异常统计

图片9.png

按照原因划分,这样当出现大面积终端上下线异常时,就能够准确抓出异常区域

图片10.png

异常的设备型号分布
图片11.png

当然,这是终端上下线的监控及预警
终端在线情况的监控与预警我们要如何通过WIS工具去挖掘呢

图片12.png

这里可以通过整网的终端体验监控得到一些参考

图片13.png


甚至我们可以通过这个原因分析找到可能或者即将出现问题的爆发点
直观的体验占比,以及体验分布能够迅速找到体验差的具体终端及原因,全天候监控用户体验
其实,无线问题的预警跟排查的难点在于如何把无线网络监控起来,如果作为管理者已经很熟悉这张无线网络情况下,发生什么样的问题,心里有底,知道问题可能出现在哪,出现了该从哪里查起,那自然对问题的排查非常有信心。

环节二:答疑

1. WIS只支持锐捷的无线AC和AP吗?对其他品牌,比如H3C的无线支持吗
A:目前是的。监控网络的软件很多,大部分的软件只能监控到设备端,无法监控到无线用户端。所以,WIS所做的是将无线用户体验监控并记录,方便管理者简单的运维无线网络需要的老师可以去WIS官网:wis.ruijie.com.cn了解

2. AP110支持WIS吗?我们学生宿舍用的全是AP110,1000多台了。
A:AP110-W受硬件影响,目前不支持。

3. 需要WIS的命令文档
A:现在WIS提倡全自助接入,官网申请项目自动生成配置

4. WIS服务了多少的用户?
A:511184的AP数 ;975380的在线用户数

5. 请问在宿舍区,如果用墙面AP的话,是不是用5GWIFI更好些,因为5G穿透力差,这样各个宿舍的干扰就会小些。
A:宿舍场景 * 杠杠的。5G干扰会小一些  体验会比2.4G好

6. AP 220、320也都支持吧
A:支持。支持所有11.X平台的AC及绝大部分AP (出AP110-W外)

7. Wave2的产品应该也出来了吧
A:已经出来了,老师可以关注http://www.ruijie.com.cn/cp/wx-fzhxwxjrd/ap740i   RG-AP740-I灵动天线型802.11ac wave2无线接入点官网介绍

8. WIS能不能对连接无线AP的物理网络进行监控?WIS的DEMO里,感觉还是对AP和用户监控得多一点,没看到有物理网络的监控。有线无线是一体的。
A:物理网络的话WIS只关注AP/AC。毕竟WIS是为无线而生。有线的监控软件其实已经很多了。这个战略肯定是一起的,当前是主攻无线。

9. 如果我看这个AP上的用户体验不行,在检查物理网络连通性的时候还得切换到其它系统里去检查,有点麻烦
A:-当当是链路的话,这个后面会考虑实现用户-互联网的检测。后面会考虑开发用户端到互联网的链路检测
这是AP的信道利用率监控  单台

图片18.png

下图为整网无线

图片15.png

10. wis能不能对AP的连接用户数进行监控
这个是可以的,会给AP接入能力评分

图片16.png

11. 对AP周围的无线信道监控吗
A:也是监控的,直观的是私设WIFI个数,客观的数信道利用率

12. AP能抑制私设WIFI吗
A:抑制的话两败俱伤,WIS能够主动避开私设WIFI规划信道

13. 上面的图是信道时隙用户使用分布图吗?数值代表什么意思?
A:是的。表示的是信道利用率分值 0-10。0表示 * ,10表示非常严重。

图片17.png

这里有区域分布,目前是以AP组作为区域划分
通过信道利用率、负载这两个维度监控

14. ap能辨别同样SSID的私设的AP吗?能设置反制白名单吗?现在很多钓鱼AP热点,不知道你们有成功反制的案例没?
A:这个设备是可以的,WIS能识别私设。除非存在第三块射频卡 我们建议反制。如果愿意单独拿出几台AP来做反制的话,反制的效果将会很好。

我一定要在你平庸无奇的人生里,做一个闪闪发光的神经病。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则