在Linux上实现高可用服务
高可用服务可算是当前企业应用中的一个热门了。高可用服务(High-Availability Service)是指用两台或更多机器来运行服务(比如http、NFT、Oracle等),当主服务 器down机后,其它的副服务器就自动接管服务,当主服务器回复到正常状态时,再自动将服务从副服务器上接管回来。大家都知道在服务器领域中Linux操作系统本身就具有很高的稳定性,然而在实际应用中,可能会要求系统具备更高的稳定性。这时候就需要构建高可用服务来保证系统能提供不间断的服务。许多商家都提供了Linux上的高可用产品,比如:Rose HA、Turbo HA Cluster Server、SGI FailSafe Server等,不过Linux上也有免费的高可用产品,比如High-Availability Linux Project,它是一个高可用性Linux项目。利用它,我们可以在Linux上构建各种高可用的服务。本文就将利用heartbeat实现高可用的http服务。下面先介绍一下这次实验的软硬件情况:
A. 硬件
服务器:2台, 都具有双网卡,一块用于连接到网络,一块用于双机互连。
心跳线:特殊的串口线,用于串口信息的检测。
网线:交叉网线,用于双机互连的。支持heartbeat的UDP协议通讯。
B. 软件
操作系统:RedHat 9.0
服务:Apache (两台服务器上的apache设置和内容完全一致)
HA软件:heartbeat 1.0.4 for RedHat 9.0
C. 网络信息
服务器1
主机名:ha1.bogus.sh.cn
eth0: 192.168.2.1(接入LAN)
eth1: 10.0.0.1(接心跳线)
服务器2
主机名:ha2.bogus.sh.cn
eth0: 192.168.2.2(接入LAN)
eth1: 10.0.0.2(接心跳线)
对外服务的IP:192.168.1.3
下面是具体的安装过程:
1、安装heartbeat
我们选择heartbeat1.0.4,它是2003/10/14更新的,也是当前最新的稳定版本。另外还有heartbeat-beta1.1.3,不过如果你是第一次安装,没有需要和以前的版本配合的话,就不要选这个。
因为我们使用的操作系统是Red Hat 9.0,所以我们直接用相应版本的rpm包来安装。
heartbeat 1.0.4 for RedHat 9.0主要包有以下4个:
heartbeat-1.0.4-2.rh.9.i386.rpm
heartbeat-ldirectord-1.0.4-2.rh.9.i386.rpm
heartbeat-pils-1.0.4-2.rh.9.i386.rpm
heartbeat-stonith-1.0.4-2.rh.9.i386.rpm
不过这些包都依赖其它的一些包,它们可以在这里中找到:
ipvsadm-1.21-1.rh.9.um.1.i386.rpm
libnet-1.1.0-1.rh.9.um.1.i386.rpm
perl-Authen-SASL-2.03-1.rh.9.um.1.noarch.rpm
perl-Convert-ASN1-0.16-2.rh.9.um.1.noarch.rpm
perl-IO-Socket-SSL-0.92-1.rh.9.um.1.noarch.rpm
perl-ldap-0.2701-1.rh.9.um.1.noarch.rpm
perl-Mail-IMAPClient-2.2.7-1.rh.9.um.1.noarch.rpm
perl-Net-SSLeay-1.23-1.rh.9.um.1.i386.rpm
perl-XML-NamespaceSupport-1.08-1.rh.9.um.1.noarch.rpm
perl-XML-SAX-0.12-1.rh.9.um.1.noarch.rpm
下面给出笔者的安装顺序:
rpm -ivh heartbeat-pils-1.0.4-2.rh.9.i386.rpm
rpm -ivh heartbeat-stonith-1.0.4-2.rh.9.i386.rpm
rpm -ivh heartbeat-1.0.4-2.rh.9.i386.rpm
rpm -ivh ipvsadm-1.21-1.rh.9.um.1.i386.rpm
rpm -ivh perl-Net-SSLeay-1.23-1.rh.9.um.1.i386.rpm
rpm -ivh perl-IO-Socket-SSL-0.92-1.rh.9.um.1.noarch.rpm
rpm -ivh perl-Convert-ASN1-0.16-2.rh.9.um.1.noarch.rpm
rpm -ivh perl-XML-NamespaceSupport-1.08-1.rh.9.um.1.noarch.rpm
rpm -ivh perl-XML-SAX-0.12-1.rh.9.um.1.noarch.rpm
rpm -ivh --nodeps perl-Authen-SASL-2.03-1.rh.9.um.1.noarch.rpm
rpm -ivh --nodeps perl-Mail-IMAPClient-2.2.7-1.rh.9.um.1.noarch.rpm
(注:以上两个包还有依赖关系,可以从cpan.org上找到tar包安装,然后就用--nodeps强行安装)
rpm -ivh perl-ldap-0.2701-1.rh.9.um.1.noarch.rpm
rpm -ivh heartbeat-ldirectord-1.0.4-2.rh.9.i386.rpm
2、配置heartbeat
heartbeat的配置有以下三个文件,它们是:
ha.cf
主要配置文件
haresources
资源配置文件
authkeys
关于认证信息
前两个文件应该是所有人都可读的,而authkeys是只有root才可读可写的。
2.1. /etc/hd.d/ha.cf
这个文件主要负责定义媒体和设置参数,是heartbeat的主要配置文件。这里我们的ha.cf文件内容如下:
node ha1.bogus.sh.cn
node ha2.bogus.sh.cn
serial /dev/ttyS0
baud 19200
deadtime 5
keepalive 1
initdead 30
udp eth1
u易做图ort 694
下面是对ha.cf的相关解释:
keepalive 1
该参数指定两次 heartbeat 之间的秒数。在本实验中,每秒一次 heartbeat。
deadtime 5
该参数指定等待声明主机死机的时间。指定 10 表示 heartbeat 将在节点停止响应 10 秒之后启动故障转移。
initdead 30
该参数指定heartbeat首次启动时deadtime应该为多久。因为当heartbeat在引导时启动时,还需要给网络启动留出时间,所以这个时间要设得长一些。
u易做图ort 694
该参数指定heartbeat发送UDP包时所使用的端口。
udp eth1
该参数指定在哪个接口上发送heartbeat。
node ha1.bogus.sh.cn与node ha2.bogus.sh.cn
该参数告诉 heartbeat 使用哪些主机。节点名的正确性是非常重要的。节点名应与命令uname -n所显示的名称一致。
serial /dev/ttyS0
该参数指定在心跳线接在哪一个串口上。
baud 19200
该参数串口通讯的波特率。
2.2. /etc/ha.d/haresources
这个文件指定同步的服务以及主机是什么。两台机器上的这个文件一定要一致。我们设定的是高可用服务是Apache,它对外的IP是192.168.2.3,所以haresources的内容应该如下:ha1.bogus.sh.cn 192.168.2.3 httpd
其中httpd是启动脚本的名称。heartbeat会先从/etc/ha.d/resource.d和/etc/rc.d/init.d的目录中去寻找httpd这个启动脚本,这里因为我们采用的apache是Redhat自带的apache,在/etc/rc.d/下面就有一个httpd的启动脚本,所以heartbeat就可以利用httpd start/stop来启动或停止apache服务了。NextPage###
2.3. /etc/ha.d/authkeys
有三种认证方式:crc, md5, and sha1. sha1是最难破解的,md5其次,crc最次。
这个文件的格式如下:
auth <number>
<number> <authmethod> [<authkey>]
这里我们的authkeys文件内容如下:
auth 1
1 sha1 sha1 myAuthkey
然后将其权限设为600,以提高安全性。注意:如果不做这一步,heartbeat可能无易做图常运作。
chmod 600 authkeys
2.4 另一台服务器的配置
对于另一台服务器就也重复做以上的设定,如:
vi /etc/ha.d/ha.cf
vi /etc/ha.d/haresources
vi /etc/ha.d/authkeys
chmod 600 authkeys
在两台机器上的haresources和authkeys应该完全相同。ha.cf也应该相同,除非你的心跳线是连接不同的串口的或者交叉网线连接的网卡不同。
3、启动heartbeat
首先关闭两台机器的高可用服务,因为heartbeat 启动时会自动服务打开,这里的高可用服务是apache,我们可以用以下命令来关闭它们:
/etc/rc.d/init.d/httpd stop
然后,可以通过以下命令先后在两台机器上启动heartbeat:
/etc/rc.d/init.d/heartbeat start
用以下命令可以查看到heartbeat在运行中的log:
tail -f /var/log/ha-log
用以下命令可以关闭heartbeat服务
/etc/rc.d/init.d/heartbeat stop
4、测试
heartbeat服务启动以后,就可以开始测试了。为了区分apache服务是来自于哪一台服务器,我们在apache的index.html中加上主机名。这样我们通过访问主页就能够区分是哪一台服务器在提供apache了。
一开始,我们访问http://192.168.2.3,看到的是ha1的页面,然后我们想办法让ha1断开一下,比如关机或重启。然后,我们刷新页面,不久就可以看到页面变成ha2的了,这表示ha2已经接管了ha1的apache服务,我们在ha2上察看,可以发现它已经自动挂上了192.168.