网络管理员在日常工作中经常遇到一些连网问题。尽管每个网络都有其自己独特的配置和特性,但故障现象和解决方法都有很大程度的相似性,这里列举一些在网管工作中经常遇到的问题及处理方法,供大家提供一点思路,以便迅速而准确地查找和排除故障,确保网络正常稳定地运行。
1、物理介质问题与故障处理
网络的物理介质(如电缆、连接器、集线器、网络接口卡)是最容易损坏和引起网络故障的部件,当出现网络连接性问题时,这些是首先要检查的部件。电缆短路或断路会引起工作站或整个网络段无法连接到服务器上,或者无法确认其他网络设备。
管理员必须使用一种方法,以便确定某一连接性问题是在工作站或终端内部还是在连接工作站或终端的介质上。在排除其它网络故障(例如重新配置计算机,更换适配卡,或者更新驱动器)之前,这是应首先考虑的问题。
如果有一台装有网卡工作正常的备用计算机,可以用它来测试电缆的连通性。如果备用机连接到出现问题的网络上,也出现问题,那么就可确定问题不在工作站或终端上,而是在电缆上。
一些可能要检查的的地方是:
1)确保与工作站或终端联网的电缆牢固地连接在该机器上,连接器没有破损、松动的地方,特别是使用同轴电缆网络。
2)确保所用的电缆没有超过该类型规定的使用长度。每种电缆都对其使用长度、数目以及阻抗有详细的规范限定(各种电缆长度规格见表1)。
表1 电缆长度规格说明
电缆类型 最大长度
细同轴电缆 185米
粗同轴电缆 500米
非屏蔽双绞线(UTP) 100米
屏蔽双绞线(STP) 100米
光纤 2000米
3)利用时域反射器(Time-Domain Reflector meter)来确定连接电缆是否存在短路或断路。当查出问题是出在墙内电缆或机箱内的电缆时,必须检查电缆的内壁和外壳,并找出问题。
4)确保整个网络使用同种类型的电缆。如果使用多种类型的电缆,必须使用专用设备(如路由器、交换机、集线器、网桥等),支持网络中多种电缆类型,并确保它们能正确地运行。
5)如果是用同轴电缆连接的网络,应检查终结接器,确保网络没有出现无限大电阻的情况。
2、网络接口卡(NIC)问题及处理
经常造成联网问题的另一个原因是“可恶”的网络接口卡(网卡、网络适配器),要使网卡成功运行需要正确地做好下面件事:
●适配器牢固地安装在工作站或终端机器母板的槽内。
●适配器必须安装和配置与网络结构相匹配的驱动程序。
有时网卡会由于老化、环境影响、质量或持续使用等情况而不能正常工作。而经常造成网卡无法工作的另一原因是配置错误,或者是工作站或终端的操作系统的兼容性问题。为确定网卡是否存在问题,需要认真检查以下方面:
1)网卡的背面是否有指示灯?一般情况下,网卡背面应该有两个LED灯,一个是“链路指示灯”,用来显示网卡已在OSI参考模型的数据链路层中与网络建立了连接;另一个是“传输指示灯”,该灯随着网卡发送/接收网络信息而“闪烁”(指示灯不闪,就意味着没有建立连接)。
2)最近工作站或终端是否安装了新的网络软件应用程序?有些应用程序有安装自己的驱动程序,它们可能在网络上不兼容,或者可能与工作站或终端上的OS版本不兼容。
3)从网络控制屏面上检查当前网络驱动程序的安装日期(联系销售商是否有解决这一问题的更新版本的驱动程序)。
3、网卡参数配置问题及处理
每个网卡都有其确定的配置参数,但是容易出现问题的地方是网卡“中断请求”(IRQ)设置、基本I/O端口地址和存储器地址。如果这些方面出现任何差错,或与工作站或终端中其他设备产生冲突,NIC即使能工作,也无法连续工作。
一般情况下,计算机有16个IRQ号。将这些IRQ号分配给不同设备,如表2所示。在设备发出中断请求时,就可向处理器发出中断请求信号。I/O端口基地址作为处理器和设备之间所有信息传输的通道。
表2 IRQ号与设备对应表
IRQ号码 设备
00 系统计时器
01 键盘
02 可编程中断控制器
03 通信端口2或4
04 通信端口1或3
05 打印机端口2(LPT2)”或“OPEN”按钮
06 软盘控制器
07 打印机端口1(LPT1)
08 实时时针
09 从IRQ重定向或“OPEN”
10 开放OPEN
11 开放OPEN
12 PS/2标端口或OPEN
13 算术协处理器
14 IDE硬盘驱动器控制器
15 IDE硬盘驱动器控制器或开放
存储器基地址是为正在传输数据保留的缓冲区。该缓冲区的基地址常常是十六进制数D8000。
如果网卡不能正常工作,可从以下几个方面进行检查:
1)工作站或终端的网络配置近来是下作了改动,如果作了改动,要检查改动原因以及以前的设置。
2)配置过程是否采用“自动配置”模式,有时这是无效的,试着用人工方式设置网卡。
3)三个基本参数是否被其他设备使用,如果是,则重新给网卡配置为“OPEN”的IRQ号。如果无可用值,或者网卡没有提供足够的选择,可能就要重新配置设备,去掉网卡或现存其它的设备。
4、网络协议失配及处理
对于一个在整个网络中进行通信的工作站或终端来说,它的网卡必须与需要访问的网络设备共享一组通用协议。每种协议配置各不相同。
一般情况下,几种网络协议必须通过一个网卡输出。把几个协议“绑定”(BINDING)到一个网卡的过程是通过利用网络设备驱动接口规范(NDIS)或开放数据链路接口(ODI)栈来完成的。
如果所有其它网卡检测列表(CHECKLISTS)显示没有配置或硬件问题,那么就要检查协议是否失配的问题。一个为IPX/SPX(NWLINK)协议配置的工作站或终端是不能与使用TCP/IP协议配置的文件服务器进行通信的。
在有多种服务器平台(UNIX、NetWare、Windows NT Server)的连网环境中,网络协议失配是一个常见的问题。可以从以下方面进行检查:
1)你的工作站或终端是否曾经能访问服务器?现在却不能访问了;或者这个工作站或终端从来就没有与服务器连接成功过;
2)检查网络控制屏面,看看已安装了那些协议,所有协议是否都正确地绑定到网卡上;
3)安装的每个协议的所有配置、参数埴写是否正确?例如,TCP/IP协议组需要一个IP地址,子网掩码和一个默认网关地址;
4)如果是TCP/IP网络,工作站或终端是否使用DHCP动态地获得IP地址;
5)如果是TCP/IP网络,对某一个网段来说,DNS或IP地址填写是否正确;
6)如果是IPX/SPX网络,当前使用的帧类型是否正确;
5、网络拥挤问题及处理
网络拥挤现象的基本症状是网络的某一部分或整个网络性能低劣。在高峰期,可能这只是暂现象。在其他情况下,这种现象可能逐渐漫延持续几周或几个月的时间,直到最后使网络性能降低到无法容忍的水平。
引起网络拥挤现象的原因有多种。需要用网络监视器来确定整个网络正在使用的带宽情况、高峰使用次数,以及正在传输的分组类型。协议分析器可以提供更多的有关整个网络中整个网络段的信息量的最大极限和有关在网络中的瓶颈的信息。
出现网络拥挤现象时可以进行以下方面的检查:
1)拥挤是近来才出现的还是一直存在的问题?网络拥挤只能通过更新网络主干来解决(如添加集线器或交换机创建子网等);
2)检查从某个IP地址发送数据包的最大数。发生故障的网卡可能正在“抖动”,而且正在发送许多不必要的数据包;
3)查看一下网络上是否已安装上任何新的应用程序。一个客户机/服务器应用程序可能正产生许多数据包信息;
4)用户数是否已大大增加,网络很可能需要扩大以便处理组织日益增长的需求;
5)网络中有那些传输哪些协议,网络上正在使用的协议有多少,为了使信息量控制到最少,可以删除一些不常用的协议,在不影响通信的情况下,协议越少越好;
6)NETBEUI是否在整个网络上运行,NETBEUI是一个强广播(BROADCAST-INTENSIVE)协议。试着用WINS服务器来减少NETBEUI广播,也可以通过TCP/IP或IPX来取代NETBEUI,并完全消除NETBEUI。
6、广播风暴问题及处理
“广播风暴”是指过多的广播数据包填满了网络带宽的所有容量。发生这种情况时,网络性能会减慢到极点。
广播风暴常是有故障的网卡和集线器造成的,也可能是整个NETBEUI网络上过多的广播信息引起的。
为了诊断故障所在,需要利用协议分析仪来隔离检查这些设备,以便确定故障设备并且更换;如果采用内部路由器和可选路由协议,也可以减弱广播风暴带来的影响,因为路由器并不为广播信息选择路由。
7、服务器问题及解决
影响网络的服务器问题可能有以下几个方面:
1)缺少足够的处理能力。
2)缺少足够的存储容量。
3)由于硬件故障引起的信息丢失。
服务器必须处理的用户会话、认证、I/O请求越多,对原始CPU处理能力的需求量越大。当网络的使用超过了管理网络的服务器的处理能力时,网络性能就会降低。网络性能监视器可以监视服务器CPU资源的消耗情况,可以确定什么时候服务器有必要升为多处理器,或者把工作负载分配到其他服务器上。
与整个网络吞量紧密相关的另一类资源是操作系统;各种服务程序和应用程序能够访问的存储器(RAM)的大小。对数据库服务器和处理系统认证及安全性要求的服务器来说,存储器特别重要。若存储器容量不够,有必要多增加一些内存。
如果某一数据保护措施使用不当时,也会引起服务器性能下降的故障。诸如实施RAIDI5(用奇偶性方法对驱动器进行带区分配)容错性能一类的解决方案,可以减少单个驱动器故障造成的影响。但要处理这样的故障,则需要实施更大的计划。许多组织对驱动器作了镜象处理,对服务器也作了映象处理,这样,即使某个服务器瘫痪,仍有足够的冗余,能够立即在管理员的操作下,将系统转换到备份方案。
8、电源问题及解决
如果停电,即使仅仅几秒钟,也可能对网络和其他电子部件造成意想不到的(并且常常是消极的)影响。而当电源重新接通的瞬间会产生“电涌”现象,这也会造成麻烦。所以,为了防止电源突然断电,以及电源突然接通形成电涌危害计算机,很有必要把计算机保护起来。
不间断电源UPS可以为服务器和其他计算机设备提供足够的电力,以便它们有时间执行正常的关闭程序。实际上,有些UPS与服务器之间有接口,万一出现停电,它可以通过接口启动服务器关闭程序。UPS的这一性能很有用。如果停电时,机器能够自动切换。
电流波动最终会导致电源、硬驱、以及母板过早出现故障。有些UPS可以提供运行良好的供电,这一特性可以有效地保持服务器电流稳定,消除抑制了电流波动。