ping丢包故障处理方法

author author     2022-12-30     636

关键词:

ping丢包故障处理方法

1. Ping丢包故障定位思路故障分析
Ping丢包是指Ping报文在网络中传输,由于各种原因(如线路过长、网络拥塞等)而产生部分Ping报文丢弃的现象。在使用Ping命令,出现Ping丢包的现象时,第一步需要确定Ping丢包的网络位置,其次是确定Ping丢包的故障原因,然后依据定位的故障原因再进行解决。
确认Ping丢包的网络位置时一般采用逐段Ping的方法,可以将Ping丢包故障最终确定在直连网段之间。 确认Ping丢包的故障原因一般采用流量统计的方法,通过流量统计可以知道丢弃报文的具体位置、判断故障原因。
导致Ping丢包的原因非常多,也非常复杂,实际故障定位中需要综合考虑各种因素。本文档针对常见Ping丢包故障分析,总结出以下几种常见故障:
物理环境故障;网络环路;ARP问题;ICMP问题。
需要注意并不是Ping丢包就一定表示网络质量差,某些情况下虽然Ping丢包,但是业务是正常的。分析Ping丢包时注意以下两点:
当设备对报文进行硬件转发,速度非常快,就不会丢包。例如,Ping设备端口下挂的电脑。当报文需要CPU进行处理时,CPU繁忙就会丢包。例如:Ping设备上的IP地址。
为了防止网络×××对设备造成影响,设备具有CPU保护功能,对于超过CPCAR(Control Plane Committed Access Rate)值的ARP、ICMP等报文进行丢弃,造成Ping丢包现象。此种现象不影响业务的正常运行。

2. Ping丢包故障定位
技术分享图片
图1 Ping测试组网图
如上图1所示,以一个Ping丢包实例,介绍Ping丢包故障定位。

3. Ping丢包故障现象
C:Users> ping -n 100 192.168.4.41
正在 Ping 192.168.4.41 具有 32 字节的数据:
请求超时。
请求超时。
来自 192.168.4.41 的回复: 字节=32 时间<1ms TTL=128
...
来自 192.168.4.41 的回复: 字节=32 时间<1ms TTL=128
192.168.4.41 的 Ping 统计信息:
数据包: 已发送 = 100,已接收 = 80,丢失 = 20 (20% 丢失),
往返行程的估计时间(以毫秒为单位):
最短 = 0ms,最长 = 0ms,平均 = 0ms

4. Ping丢包故障定位
依据故障发生的可能原因进行故障定位,故障定位方法如下:
1、配置Ping多包。
为了持续复现丢包现象,以便于故障处理,需要持续发送Ping报文。可以配置Ping的-c count参数,发送多个Ping报文。
2、缩小故障范围。
当在PC上直接Ping IP地址192.168.4.41丢包时,直接判定故障出现的原因将非常的困难。此时可以先缩小故障范围,在PC上分别Ping SwitchA、SwitchB、SwitchC和SwitchD,通过Ping结果可以判断出哪一段网络出现故障。本例假设PC上Ping SwitchB时也出现丢包,则可以初步判断丢包发生在SwitchA和SwitchB直连网段之间。
3、配置流量统计。
通过缩小故障范围最终将故障定位在SwitchA和SwitchB之间,为了进一步确认故障点,需要在SwitchA和SwitchB上配置流量统计功能,观察丢包情况。具体理论统计配置方法请参考各设备的说明手册。
4、分析统计结果。
在SwitchA上持续Ping SwitchB。
如果离开SwitchA的报文数目多余进入SwitchB的报文数目,说明传输链路上存在丢包,请依照后面介绍的物理链路故障引起ping丢包进行处理。
如果离开SwitchA的报文数目等于进入SwitchB的报文数目,但是离开SwitchB的报文数目少于进入SwitchB报文数目,说明SwitchB上存在丢包。引起SwitchB设备丢包可能原因分为网络环路和ICMP问题。
登录设备,续查看CPU和接口利用率是否很高、查看是否出现MAC地址漂移。如果出现利用率高或MAC地址漂移现象,请依照后面的网络环路引起ping丢包进行处理。
登录设备,查看是否有ICMP报文被丢弃、查看ICMP报文限速的配置是否过小。如果出现报文被丢弃或ICMP报文限速配置得很小,请依照后面介绍的ICMP问题引起ping丢包进行处理。
如果离开SwitchA的报文数目少于Ping发送的报文数目,说明SwitchA上丢包。引起SwitchA丢包可能原因分为网络环路和ARP问题。
登录设备,查看CPU和接口利用率的情况,查看是否出现MAC地址漂移,如果出现利用率高或MAC地址漂移现象,请依照后面介绍的网络环路引起ping丢包进行处理。
登录设备,查看是否有ARP报文被丢弃。如果出现报文被丢弃现象,请依照后面介绍的ARP问题引起ping丢包进行处理。

5. 物理链路故障引起ping丢包分析
通过Ping丢包故障定位思路可以判断出是否由于物理链路故障引起的丢包。物理链路故障常见以下原因:
计算机网卡有问题、设备接口不正常、线缆接头接触不良或松脱、网线过长或出现破损、光纤弯曲度过大、光模块收发的光功率过低、电口协商不一致,如一端自协商一端非自协商。
在实际环境中设备未接地导致静电不能释放、风扇损坏导致设备过热等物理环境问题也会引起Ping丢包。
物理链路故障可以通过观察发现,如光纤弯曲度过大、物理连接线过长、设备或者电脑网卡指示灯显示不正常等。针对物理链路故障,故障的解决的办法一般是更换物理器件,器件更换后故障即可恢复。

6. 网络环路故障引起ping丢包分析
以太网交换网络中为了进行链路备份,提高网络可靠性,通常会使用冗余链路。但是使用冗余链路会在交换网络上产生环路,引发广播风暴以及MAC地址表不稳定等故障现象,从而导致用户通信质量较差,甚至通信中断。网络环路会导致设备CPU和端口利用率高,Ping报文被丢弃。
当设备处于存在环路的网络中,设备的反应速度比较缓慢。环路问题判断方法如下:
1、通过display interface brief | include up命令,查看所有UP接口下的流量,存在环路的接口上InUti和OutUti两个计数会逐步增加,甚至到接近100%,远远超过业务流量。
第一次查询:
<SwitchA> display interface brief | include up
...
Interface PHY Protocol InUti OutUti inErrors outErrors
GigabitEthernet0/0/2 up up 0.56% 0.56% 0 0
...
第二次查询:
<SwitchA> display interface brief | include up
...
Interface PHY Protocol InUti OutUti inErrors outErrors
GigabitEthernet0/0/1 up up 76% 76% 0 0
...
2、判断交换机是否存在MAC地址漂移。
可以执行display trapbuffer命令,查看MAC地址漂移的日志来判断。
可以执行mac-address flapping detection命令配置MAC地址漂移检测功能,然后通过display mac-address flapping record命令来判断是否出现MAC地址漂移。
可以多次执行display mac-address来观察,若MAC地址在交换机不同的接口学习到,则存在mac地址漂移。
3、检查CPU的利用率。
通过命令display cpu-usage查看CPU的利用率。网络环路会导致CPU利用率一直很高,Ping报文未来得及处理就被丢弃。
解决此种Ping丢包问题的方法是破除网络环路,可以在设备上部署RRPP、SEP、Smart Link、STP/RSTP/MSTP等协议,对环路进行处理。

7. ARP问题故障引起ping丢包分析
通过前面介绍的Ping丢包故障定位思路断是否由于ARP问题导致Ping丢包。ARP问题常见故障现象:开始(由于ARP学习失败)出现Ping丢包,然后(学习到ARP)在一段时间内(ARP表项老化时间)无丢包现象,后续(再出现ARP学习失败)会继续出现丢包。
常见ARP问题有以下两种:
设备配置了ARP安全功能,如ARP Miss的源抑制、ARP速率抑制等,会导致ARP学习很慢,Ping丢包。 设备受到ARP报文×××,上送CPU的ARP报文数超过CPCAR值,导致部分ARP报文被丢弃,Ping丢包。
常见问题判断及解决方法如下:
通过display arp packet statistics命令,查看是否有ARP报文被丢弃,分析设备上ARP安全的配置情况,从而判断问题的原因。对于该问题需要重新配置ARP安全,使设备能够正常的处理ARP报文。
通过display cpu-defend statistics命令,查看CPU对于ARP报文处理情况,是否存在报文丢弃。
对于该问题需要检查设备是否受到ARP×××,正确配置ARP安全来防范×××,同时增加ARP报文的CPCAR值。配置样例如下:
<SwitchA> system-view
[SwitchA] cpu-defend policy arp
[SwitchA-cpu-defend-policy-arp] car packet-type arp-reply cir 32
Warning: Improper parameter settings may affect stable operating of the system. Use this command under assistance of Huawei engineers. Continue? [Y/N]:y
[SwitchA-cpu-defend-policy-arp] car packet-type arp-request cir 32
Warning: Improper parameter settings may affect stable operating of the system. Use this command under assistance of Huawei engineers. Continue? [Y/N]:y
[SwitchA-cpu-defend-policy-arp] quit
[SwitchA] cpu-defend-policy arp global

8. ICMP问题故障引起ping丢包分析
ICMP问题常见故障现象:
Ping设备时,一旦Ping速度比较快就会丢包,速度慢下来就不会丢包。 Ping大包时出现规律性丢包。 Ping设备时,会出现Ping通几个报文后Ping不通,大约两分钟左右又可以Ping通,Ping通几个报文后又Ping不通。
常见ICMP问题有以下三种:
设备受到ICMP报文×××,上送CPU的ICMP报文数超过CPCAR值,导致部分ICMP报文被丢弃,Ping丢包。 设备配置ICMP×××防范,超过速度限制的ICMP报文被丢弃,Ping丢包。 设备配置ICMP限速功能,超过速度限制的ICMP报文被丢弃,Ping丢包。
常见问题判断及解决方法如下:
1、通过display icmp statistics和display anti-attack statistics icmp-flood命令查看是否有ICMP报文被丢弃。
对于该问题需要重新配置ICMP安全,使设备能够正常的处理ICMP报文。
2、检查icmp rate-limit total threshold threshold-value命令的配置情况,了解ICMP流量限速的阈值。
如果阈值过小,则可通过icmp rate-limit total threshold threshold-value命令进行修改,使其允许更多的ICMP报文通过。配置样例如下:
<SwitchA> system-view
[SwitchA] icmp rate-limit enable
[SwitchA] icmp rate-limit total threshold 500
3、通过display cpu-defend statistics packet-type icmp all命令,查看CPU对于ICMP报文处理情况,是否存在报文丢弃。
对于该问题需要检查设备是否受到ICMP×××,正确配置ICMP安全来防范×××,同时增加ICMP报文的CPCAR值。ICMP报文的CPCAR值配置样例如下:
<SwitchA> system-view
[SwitchA] cpu-defend policy icmp
[SwitchA-cpu-defend-policy-icmp] car packet-type icmp cir 256
Warning: Improper parameter settings may affect stable operating of the system. Use this command under assistance of Huawei engineers. Continue? [Y/N]:y
[SwitchA-cpu-defend-policy-icmp] quit
[SwitchA] cpu-defend-policy icmp global
还可以通过icmp-reply fast命令使能Ping快回功能来解决CPU丢弃ICMP报文故障。

pingip丢包

我装的是100M光纤LAN下载速度不慢5M以上但是玩游戏平均1分钟会卡两下。1次卡3-5秒,别的时候很流畅。好多游戏都试过了。ping服务器IP的时候1分钟会有timedout2次左右,请问这是什么原因?问题可能出在路由器上,你可以重新配置... 查看详情

cpu故障导致丢包?

PC机,网络连接收不到包。能发包。把网卡,网线,主板问题都排除后,把CPU换了,就OK了,然后把原来那CPU再换上去,同样的问题出现了。因此,确诊是CPU问题,请高手解答下其中的奥妙。我再次声明一遍。确诊是PC机CPU故障,... 查看详情

故障处理方式

排除故障方法:1、自顶而下法2、自底而上法3、分而治之法4、跟踪流量路径法5、对比配置法6、组件替换法大多数采用的工具:ping测试链路连通性traceroute测试路由可达性,是否缺少路由telnet测试服务端口,是否被拒绝ICMP(Internet... 查看详情

网络编程之网络丢包故障如何定位?如何解决?(代码片段)

引言本期分享一个比较常见的网络问题--丢包。例如我们去ping一个网站,如果能ping通,且网站返回信息全面,则说明与网站服务器的通信是畅通的,如果ping不通,或者网站返回的信息不全等,则很可能是... 查看详情

如何检测网络数据丢包的现象?(网络行家进)

...一下,如何检测哪里的设备出了问题?如何检测网络数据丢包现象?有什么windows命令可以使用?如何查看?行家高手请指点!不胜感谢!有帮助另再赠分。决不吝啬。1、同时按下键盘中的Win+R组合快捷。2、在弹出的运行对话框... 查看详情

cdn网络职责

...并及时记录故障发生时的时间,然后仔细查看mtr的路径和丢包情况,判断分析是哪个地市出现的问题,并督促IDC及时联系运营商介入处理。如遇到重大,波及面广的故障及时报障给孙嘉。报障处理:遇到故障及时登陆交换机,检... 查看详情

主机网络故障处理

...否出现问题2.ping本机IP地址:看网卡或网卡驱动是否出现故障3.ping本网络上的其他主机,看本网络是不是通的:是否是集线器,交换机,vlan的划分出现问题。4.ping网关:如果数据包能够到达网关,则主机和本地网络都正常5.ping公... 查看详情

华为9312ping本地互联丢包tcpping不丢包,但转发正常

...华为9312设备cpu正常、但是从这台交换机ping其它互联设备丢包从其它设备ping进来也有丢包,但二层经过这台交换机的业务不影响流量正常,2、检查设备cpu正常,log无异常,3、os的版本比较老,解决方法,关闭华为设备默认的icmp... 查看详情

ping-c++的丢包测量

】ping-c++的丢包测量【英文标题】:Measuringpacketlossofping-c++【发布时间】:2013-05-3013:25:51【问题描述】:我需要编写C++代码来测量ping的丢包率——丢包的百分比。我看到IPHLPAPI库有很多关于RTT的统计信息,但没有丢包。如果有人... 查看详情

千兆工业以太网交换机出现丢包故障(代码片段)

...障一定不会出现故障,今天我们要说的就是工业交换机的丢包故障!要搞清楚丢包故障就先了解一下什么是丢包?丢包(Packetloss)是指一个或多个数据数据包(packet)的数据无法透过网上到达目的地。丢包与比特错误(biterror)... 查看详情

网络丢包率高怎么办

丢包率高达30%,上传图片都传不了。请问是怎么回事?该怎么解决?今天电信的人来检查过说网络没问题,而且也更换了新的猫。Ping127.0.0.1可以通,没问题。您的浏览器不支持HTML5视频zymedia(\'video\')参考技术A这种现象是三个方... 查看详情

如何对idc机房网络带宽进行测试

...个方面进行评估。一、网络稳定性检测机房的网络延迟、丢包率可以使用ping、smokeping、mtr三种工具来进行测试。Ping测试法(windows):1、 在windows系统下打开“运行”。快捷键:win+R2、 在运行窗口内输入“cmd”点击确定3... 查看详情

用ping命令简单的测试延时抖动丢包率

在DOS命令状态下输入:ping202.105.135.211-t(连续的对该IP地址执行Ping命令,直到被用户以Ctrl+C中断)就会得到下面的结果:Pinging202.105.135.211with32bytesofdata:Replyfrom202.105.135.211:bytes=32time=93msTTL=42Replyfrom202.105.135.211:bytes=32ti 查看详情

嵌入式开发之udp丢包---udp丢包控制方法

...个缓冲区,然后迅速返回继续recv。 2、发送的包巨大丢包。虽然send方法会帮你做大包切割成小包发送的事情,但包太大也不行。例如超过50K的一个udp包,不切割直接通过se 查看详情

stp抖动导致内网丢包

故障现象内网访问公网出现不规律丢包现象排查解决方法1、stp类型stp为mstp单实例2、接口tc报文发送接收对比接入、汇聚、核心dispstptc报文数量,基本锁定故障位置3、access接口配置边缘端口接入层交换机部分接口未配置边缘端口... 查看详情

ping不通或丢包,如何通过工具进行链路测试?

...IP地址和域名。按n键可切换显示。第二列(Loss%):节点丢包率。第三列(Snt):每秒发送数据包数。默认值是10,可以通过“-c”参数指定。第四列(Last):最近一次的探 查看详情

园区间业务系统访问故障处理

故障现象:客户反映园区仓库访问NC系统速度很慢,从园区pingNC服务器地址时有严重的丢包现象。如下图所示:650)this.width=650;"src="http://s3.51cto.com/wyfs02/M00/8A/8C/wKiom1gz1DKi117aAAKQFNfloAw338.png-wh_500x0-wm_3-wmp_4-s_1579186669.png"style="float 查看详情

udp主要丢包原因及具体问题分析

UDP主要丢包原因及具体问题分析一、主要丢包原因 1、接收端处理时间过长导致丢包:调用recv方法接收端收到数据后,处理数据花了一些时间,处理完后再次调用recv方法,在这二次调用间隔里,发过来的包可能丢失。对于这... 查看详情