当前位置:首页 > 华为交换机视频类故障案例集(v1.0)
interface GigabitEthernet2/0/45 set flow-stat interval 10 (把接口速率统计周期调整为10s ,默认周期是300s,这样方便可以看节目是否断流) traffic-policy ljx outbound (过滤239.93.6.109流) # # interface GigabitEthernet2/0/47 set flow-stat interval 10 traffic-policy ljx outbound (过滤239.93.6.109流) < S9306>display clock 2013-12-11 17:32:35 Wednesday Time Zone(UTC) : UTC < S9306>display interface GigabitEthernet 2/0/47 GigabitEthernet2/0/47 current state : UP Line protocol current state : UP Description:HUAWEI, Quidway Series, GigabitEthernet2/0/47 Interface Switch Port, PVID : 1, TPID : 8100(Hex), The Maximum Frame Length is 9216 IP Sending Frames' Format is PKTFMT_ETHNT_2, Hardware address is 0046-4bc5-2ca0 Last physical up time : 2013-12-11 16:09:35 Last physical down time : 2013-12-11 16:09:33 Port Mode: COMMON COPPER Speed : 100, Loopback: NONE Duplex: FULL, Negotiation: ENABLE Mdi : AUTO Last 10 seconds input rate 144 bits/sec, 0 packets/sec Last 10 seconds output rate 3142456 bits/sec, 285 packets/sec Input peak rate 6672 bits/sec, Record time: 2013-12-11 16:22:51 Output peak rate 98437792 bits/sec, Record time: 2013-12-11 16:31:11 华为交换机视频类故障案例集
4) 当现场发现OLT上断流时,从S9300采集的接口流量速率统计来看,上下行明显没
有流,所以确认是S9300上行路由器没有把流发下来(如果故障概率不定时出现,可以借助SecureCRT跑脚本采集信息观察,下面是采集脚本做参考)。
#$language = \#$interface = \'Collect information 'Edit by zhubinghui ' This automatically generated script may need to be ' edited in order to work correctly. crt.Screen.Synchronous = True ' 查看更多信息 2014-5-25
第5页, 共56页
Sub wait_for_More() Dim currline currline = crt.Screen.Get(crt.Screen.CurrentRow, 0, crt.Screen.CurrentRow, 255) '判断是否在用户模式或者系统模式 If (InStr(currline,\ Then crt.Screen.Send chr(32) crt.Screen.Send chr(32) crt.Screen.Send chr(32) End If Do While crt.Screen.WaitForString (\ crt.Screen.Send chr(32) Loop currline = crt.Screen.Get(crt.Screen.CurrentRow, 0, crt.Screen.CurrentRow, 255) '判断是否在用户模式或者系统模式 If (InStr(currline,\ crt.Screen.Send chr(3) End If End Sub ' main procedure Sub Main crt.Screen.Synchronous = True For i = 0 To 1000000 crt.Screen.Send \ wait_for_More crt.sleep(200) crt.Screen.Send \ GigabitEthernet 2/0/45\ wait_for_More crt.sleep(200) crt.Screen.Send \ GigabitEthernet 2/0/47\ wait_for_More crt.sleep(9600) Next 'back_to_user_mode crt.Screen.Synchronous = False 华为交换机视频类故障案例集
2014-5-25
第6页, 共56页
End Sub 华为交换机视频类故障案例集
5) 继续排查路由器,发现是由于收不到OLT report报文老化删除表项的。 6) 继续排查S9300是否把OLT report报文透传给路由器,同样用端口镜像+过滤抓包
239.93.6.109的igmp report报文,经过抓包证实,故障时S9300已经保证每1分钟至少有一个report透传给路由器
# acl number 3900 rule 5 permit igmp # traffic classifier igmp_deny if-match any traffic classifier igmp_tj operator and if-match acl 3900 if-match destination-mac 0100-5e5d-066d # traffic behavior igmp_deny deny traffic behavior igmp_tj # traffic policy igmp_tj classifier igmp_tj behavior igmp_tj classifier igmp_deny behavior igmp_deny # interface GigabitEthernet1/0/1 port-mirroring to observe-port 2 outbound # interface GigabitEthernet1/0/11 port-mirroring to observe-port 1 inbound # interface GigabitEthernet2/0/45 set flow-stat interval 10 traffic-policy igmp_tj outbound # interface GigabitEthernet2/0/47 set flow-stat interval 10 traffic-policy igmp_tj outbound 7) 至此说明路由器对report报文处理有问题,所以怀疑路由器收发的igmp报文处理有
问题,继续在上行口1/0/1端口镜像抓包,用类似的方法把1/0/1入出方向流镜像到
2014-5-25
第7页, 共56页
华为交换机视频类故障案例集
2/0/45观察口,在2/0/45出方向过滤igmp报文,用PC只抓igmp报文(如果观察口上有其他流量,可以再PC抓包工具上过滤只抓igmp报文,PC网卡通常是GE的,小几百兆流量一般没问题)
8) 通过抓包分析是另外一个OLT的leave诱发的问题
? S9300下挂多台OLT点播同一个组播组节目时,1/0/15下的OLT离开后,会发送Leave报文。如
时间点4点32分33秒时,源IP为192.168.236.50的OLT发送了组播组为239.93.6.109的leave报文给交换机,同时交换机也会将该leave报文转发给路由器
? 路由器收到该Leave报文后,会每隔1秒,连续发送2个特定组查询报文给S9300交换机,但
交换机此时使能了igmp-snooping查询器功能,会将这2个特定组查询报文丢弃掉。
? 同时S9300具有snooping侦听和查询器功能,自己也会每隔1秒,连续发送2个特定组查询报
文只给源IP为192.168.236.50的OLT,即只向端口GE1/0/15定组查询报文。
但其他OLT点播该组播组的端口,比如GE1/0/11下的OLT设备是收不到特定组查询报文的,也就没办法及时回应report报文给路由器。
? 路由器2秒后收不到report报文,就将整个连接S9300的路由器上端口GigabitEthernet
1/0/2.3990给组播表项老化掉,于是就出现S9300下面GE1/0/11下的OLT设备出现断流的现象。
2014-5-25
第8页, 共56页
共分享92篇相关文档