广域网几种故障的诊断方法

来源:百度文库 编辑:神马文学网 时间:2024/04/20 10:39:32
故障定位

  广域网中的软硬件品种多,连接复杂,安装地点分散。因此,准确地对故障定位显得异常重要,它可以大大缩短排除故障的时间。
  查找故障的原则是先查软件后查硬件,修复故障的原则是先修硬件后修软件。 
  让我们先考察一下广域网中远程局域网的客户机到网络数据中心服务器的硬件和软件链路。典型的硬件链路为:用户终端→用户客户机→局域网集线器→边界路由器→中心路由器→交换机(IP交换或ATM交换)→服务器;相应的软件链路为:用户应用软件→用户客户机操作系统 →TCP/IP软件→服务器操作系统→服务器数据库。在如此复杂的软硬件链路中,要迅速找到出故障的软硬件,最好使用网管软件(如3COM的Transced或Cisco的CiscoWorks等),这些网管软件一般都可查看主要集线器、路由器、交换机的状况。
  这里我们介绍手工定位的办法。当远程局域网用户报告故障时,一般是先检查通信链路,并采用下面办法定位出故障的硬件或软件:
  1.在网络数据中心用Ping命令Ping发生故障的客户机的IP地址。 
  若不通,Ping边界路由器IP地址。若不通,Ping中心路由器IP地址;若不通,Ping服务器IP地址。在上述Ping过程中任何一次Ping成功,都表明这次Ping所跨越的软硬件链路正常,以此逐步缩小故障范围,直到定位到出故障的硬件或软件。
 2.若发生故障的客户机操作系统正常,Ping本机的IP地址,依次检查本机TCP/I P软件配置和网卡。
 3.若中心路由器与边界路由器不能正常连接,则检查路由器的路由表、连线。
 4.若广域网TCP/IP均正常,则检查网络流量和服务器数据库的负载。如果网络和数据库负载过重,就有可能致使服务器响应迟缓,从而导致客户机应用软件死锁。

 Modem 不能连通

 广域网最常见的故障便是Modem不能连通。大部分Modem前面板上都有CD、RD、TD几个灯,CD是载波信号,表示两台Modem是否连通;RD、TD是数据收发信号。正常情况时,RD、TD 不停地闪烁,即表示两台Modem正在收发数据。若两台Modem的CD灯不亮,则表明两台Modem 未连通,应检查两台Modem设置的参数(如专线方式、二线制、同步方式、连接速率等)。一般把处于中心的Modem设为应答方,处于边界的Modem设为呼叫方,检查连接电缆是否松动。如果使用的是电话专线,则可以自己测试一下电话专线是否正常。测试的方法非常简单,先把两线制电话专线的一端两线短接,在电话专线的另一端测试这两条线是否连通,即知道电话专线是否正常。对于DDN或X.25,则需要电信部门协助测试。
 如果对Modem本身有怀疑,可以找一台备用Modem,调好两台Modem的参数,设置均为专线方式、相同的速率、同步方式,其中一台为呼叫方式,另一台为应答方式,再找一段导线连接两台Modem,即可测试这台Modem是否正常。

 远程终端故障

 远程终端故障中,最常见的故障是进程死锁,这时可用Kill-9进程号命令杀死这个进程。如果仍不正常,则顺序检查终端的设置参数、宿主Unix机的终端设置,并试着用命令dis able终端口,enable终端口,恢复终端。如果上述办法都不行,换一个串行口,并重新启动宿主Unix系统。

 服务器响应太慢
 服务器响应太慢一般有三种原因:
 1.网络数据流通瓶颈;
 2.服务器CPU处理瓶颈;
 3.服务器内存瓶颈。

 在网络使用高峰时段,利用网管软件查看各路由器、交换机、服务器端口的数据流量 (用netstat命令也可统计各端口的数据流量),确认网络数据流通瓶颈的位置,设法增加其带宽。如果是服务器网卡流通瓶颈,则可增加服务器网卡带宽。一般要让服务器独占100M 带宽或使用两块100M网卡。 (下转第F29版)(上接第F27版)常用的网络操作系统如Wind ows NT、Unix都可以随时检查系统的负载。例如,在Window NT中可查看性能监视器的CPU 负载和内存消耗情况,若确认是CPU处理瓶颈,可以通过扩充服务器CPU或增加服务器的办法来分担作业。
 充足的内存可以使操作系统将更多的应用软件和数据放在内存中,减少CPU读取硬磁盘的次数。这样不仅可以提高系统性能,还增强了系统的可靠性。对于OLTP数据库应用系统来说,加大内存对系统性能的改善非常明显。