[p=30,2,center]学习资料:IT运维管理社区专家讲堂直播300期视频回放[p=30,2,center]
[p=30,2,center]
某天,服务台接到呼叫中心报障:部分台席报脚本错误,并发了一张报错的截图。并转到一线,一线又转到我这,图中有一个URL地址,我看了一下,初步定位到了服务器。
登录服务器后,发现有一个应用不释放与数据库的连接。查看另一台同一个应用,发现连接释放正常。于是做了以下尝试处理:
1、取得另一台服务器应用的发布程序,在此台服务器上发布——问题未解决;
2、发现此台服务器上其它应用数据连接释放正常,于是将此应用发布在其它应用的work上——问题未解决;
3、怀疑数据库性能问题,查看数据库,性能正常,为了测试,将数据连接指向备机——问题依然;
4、ping数据库服务器,正常;
5、ping大包,存在延时和丢包。怀疑为网络问题,此服务器为双网卡,请网络工程师查有无mac地址跳动情况——MAC地址固定。
6、Traceroute数据库服务器,第二跳速度很慢,显示结果很慢——茫然中。
7、网络工程师检查网络包——正常。
8、由于做的双网卡绑定,于是打算拔掉一根网线,看一下是什么情况。
9、拔掉网卡一的网线,92段正常,但是70段网络不通。但是ping大包正常。Traceroute正常。
10、拔掉网卡二的网线,网络不通。——巨大茫然中。
11、系统工程师中午到达机房,一起分析。
12、重做网卡绑定
13、用一根网线一个网卡,挨个测试,最终确认原网卡一的网线存在问题。
14、加载应用测试,确认网线存在问题。
到此问题解决。
这个故障是一个很小的问题,机器是07年的老机子,网线也是07年布的。
这次故障主要有两方面的问题,一是网卡绑定。另一个网线问题。开始定位的方向也是正确的。为这次问题解决赢得了时间。
|