|
笔者是一个Linux网络的管理员,网络拓扑如图1。在局域网内,有两台关键的服务器,一个是主服务器、一个是备份服务器,中间通过心跳线连接。服务器A使用红旗 Linux 4.0,作为文件服务器。
心跳线是用于连接A、B两台服务器间的网线。在这两台服务器A、B中,A为工作机,B为备份机。在服务器上都配有两块网卡,其中一块专门用于两台服务器(节点)间的通讯。安装在服务器上的软件通过心跳线来实时监测对方的运行状态。系统在运行中一旦发现服务器出现故障,可以把该服务器上的所有进程转移到备份服务器上,从而为客户提供不间断的服务。同时,还具有系统崩溃的智能检测与处理系统,可以利用各种手段来检测硬件、存储设备、网络及系统软件的故障。这样可以在最大限度上保证网络的正常运行,这也称为“心跳检测”。心跳线主要利用一条RS-233检测链路来完成。采用ping命令方式检测验证系统宕机检测的准确性。
一天,发现Linux服务器A连接心跳线的网卡由于硬件的磨损老化(RTL8139AS、100M),出现物理故障。随即到计算机市场购买一块最常见的10Mb/100Mb自适应网卡—Realtek多功能模块(Multifunction Mode)单芯片RTL 8139D(L)的网卡。它的兼容性很好,几乎可以工作在所有Linux主要发行版本。安装过程很顺利,系统自动识别。两台机器都可正常运行,设置网卡IP地址后,发现通过心跳线服务器A和服务器B却不能连通。由于心跳线是通过网卡相连来检测服务器状态的,所以要重点查看每台机器心跳线连接的网卡状态及配置,可经检查网卡状态并没有问题,网卡灯也是亮的。难道是网线没插好或是有问题?重新用一根确认正常的网线替换下原网线,可是两个服务器之间的心跳线还是不通,至此已基本排除了硬件方面的问题,估计还是网卡的设置有问题。进入两台机器的网卡状态选项,将两台机器的网卡状态一项一项地进行比较。
1.首先查看Linux服务器A网卡现在的工作模式,输入命令:
#mii-tool -v
eth0: negotiated 100baseTx-FD, link ok
product info: vendor 00:00:00, model 0 rev 0
basic mode: autonegotiation enabled
basic status: autonegotiation complete, link ok
capabilities: 100baseTx-FD 100baseTx-HD 10baseT-FD 10baseT-HD
advertising: 100baseTx-FD 100baseTx-HD 10baseT-FD 10baseT-HD
link partner: 100baseTx-FD 100baseTx-HD 10baseT-FD 10baseT-HD
从以上信息中可以看出,这块网卡工作在10M全双工自适应模式下,“10BaseTx-FD”意为10M Full Duplex。而服务器B连接心跳线网卡工作在100Mbit/s全双工状态下。
原来服务器A,B使用的是都是10/100Mbit/s自适应以太网卡,设计速度为100Mbit/s。服务器A更换新网卡后,网卡自动选择状态为10M全双工自适应模式。由于两边网卡所选择的工作状态不一致,导致网络不通。
2.下面我们查看如何修改网卡工作模式输入命令:
#mii-tool --help
usage: mii-tool [-VvRrwl] [-A media,... | -F media] [interface ...]
media: 100baseT4, 100baseTx-FD, 100baseTx-HD, 10baseT-FD, 10baseT-HD,
(to advertise both HD and FD) 100baseTx, 10baseT
media可选的模式有100baseTx-FD、100baseTx-HD、10baseT-FD、10baseT-HD等。Interface代表所选择的网卡,如eth0、eth1等,默认为eth0。
3.修改网卡工作在10M双工模式下,输入命令:#mii-tool -F 100baseTx-FD eth0
再使用ping命令检测连接状态,结果显示连接正常,问题解决。
目前有许多自适应的网卡,按照原理,应能正确适应速率和双工方式,但实际上,由于品牌的不一致,往往不能正确实现全双工方式。只有手工强制设定才能解决。 因此,我们在设置网络设备参数时,一定要参考服务器或者其他工作站上的网络设备参数,尽量能使各个设备匹配工作。另外大家在使用自适应网卡时最好设置一个初始的速率,且最好两边速率相同,而不要使用自适应。速率设置的问题常常会导致网络时断时续。 |
|