利用科来网络分析系统分析某国税增值税应用服务异常问题

一、故障背景

该增值税应用服务器XX.XXX.XXX.127XX.XXX.XXX.129XX.XXX.XXX.131,当这三台服务器全部开启提供服务时,会出现其中两台Weblogic线程被占用导致卡死的情况,而使用两台服务器提供服务时,也会有其中一台出现卡死情况,使用一台服务器提供服务则不会出现此故障。

二、故障原因分析

在一次出现故障的时间段,对出现故障的XX.XXX.XXX.127XX.XXX.XXX.129的通讯会话数据进行了分析,其结果如下:

首先在对XX.XXX.XXX.127的会话交易分析中发现,当负载均衡XX.XXX.X.92XX.XXX.XXX..127建立TCP连接后,向服务器发出了应用请求数据包,并且服务器返回了ACK表示完成收到。但是在后续的1分钟内服务器没有返回任何响应数据,这时客户端发出FIN包请求断开连接,但服务器却在718秒后才发出了RST包强制断开会话。(即是说服务器没有及时响应请求数据并且长时间保持连接不释放

641

同样在XX.XXX.XXX.129的会话通讯中,也发现当客户端发起请求后,服务器无任何响应,并且当客户端请求断开连接后,服务器依然没有任何响应。

642

当仅开启一台服务器提供服务时,其TCP会话过程偶尔也存在一个可疑的现象:有时当客户端发起请求数据包后,服务器同样在59秒内没有任何响应,而当客户端发出主动断开连接数据包后,服务器会在之后一段时间(下图为24秒)内发出响应数据并断开连接。

643

三、总结

根据以上的数据分析,怀疑是服务器应用程序问题,导致其对客户端的请求处理缓慢并且长时间保持连接不断开,影响线程的使用。建议应用开发人员对应用的程序架构及工作机制进行分析,以便确认根本原因。