一、簡(jiǎn)介
Keepalived是一個(gè)免費(fèi)開源的,用C編寫的類似于layer3, 4 & 7交換機(jī)制軟件,具備我們平時(shí)說(shuō)的第3層、第4層和第7層交換機(jī)的功能。主要提供loadbalancing(負(fù)載均衡)和 high-availability(高可用)功能,負(fù)載均衡實(shí)現(xiàn)需要依賴Linux的虛擬服務(wù)內(nèi)核模塊(ipvs),而高可用是通過(guò)VRRP協(xié)議實(shí)現(xiàn)多臺(tái)機(jī)器之間的故障轉(zhuǎn)移服務(wù)。
上圖是Keepalived的功能體系結(jié)構(gòu),大致分兩層:用戶空間(user space)和內(nèi)核空間(kernel space)。
內(nèi)核空間:主要包括IPVS(IP虛擬服務(wù)器,用于實(shí)現(xiàn)網(wǎng)絡(luò)服務(wù)的負(fù)載均衡)和NETLINK(提供高級(jí)路由及其他相關(guān)的網(wǎng)絡(luò)功能)兩個(gè)部份。
用戶空間:
- WatchDog:負(fù)載監(jiān)控checkers和VRRP進(jìn)程的狀況
- VRRP Stack:負(fù)載負(fù)載均衡器之間的失敗切換FailOver,如果只用一個(gè)負(fù)載均稀器,則VRRP不是必須的。
- Checkers:負(fù)責(zé)真實(shí)服務(wù)器的健康檢查healthchecking,是keepalived最主要的功能。換言之,可以沒有VRRP Stack,但健康檢查healthchecking是一定要有的。
- IPVS wrapper:用戶發(fā)送設(shè)定的規(guī)則到內(nèi)核ipvs代碼
- Netlink Reflector:用來(lái)設(shè)定vrrp的vip地址等。
Keepalived的所有功能是配置keepalived.conf文件來(lái)實(shí)現(xiàn)的。
二、安裝與配置
從官網(wǎng)下載keepalived的最新版本,本文以當(dāng)前最新版本1.2.24為例。
2.1 安裝
shell> cd /usr/local/src
shell> wget http://www.keepalived.org/software/keepalived-1.2.24.tar.gz
shell> tar -zxvf keepalived-1.2.24.tar.gz
shell> cd keepalived-1.2.24
shell> ./configure --prefix=/usr/local/keepalived
shell> make && make install
2.2 配置
安裝完成后,進(jìn)入安裝目錄的etc目錄下,將keepalived相應(yīng)的配置文件拷貝到系統(tǒng)相應(yīng)的目錄當(dāng)中。keepalived啟動(dòng)時(shí)會(huì)從/etc/keepalived目錄下查找keepalived.conf配置文件,如果沒有找到則使用默認(rèn)的配置。/etc/keepalived目錄安裝時(shí)默認(rèn)是沒有安裝的,需要手動(dòng)創(chuàng)建。配置文件目錄結(jié)構(gòu)如下所示:
shell> tree -l /usr/local/keepalived/etc
-- keepalived
| |-- keepalived.conf
| `-- samples
| |-- keepalived.conf.status_code
| |-- keepalived.conf.track_interface
| |-- keepalived.conf.vrrp
| |-- 。。。
|-- rc.d
| `-- init.d
| `-- keepalived
`-- sysconfig
`-- keepalived
分別對(duì)應(yīng)系統(tǒng)目錄(忽略samples目錄):
/etc/keepalived/keepalived.conf
/etc/rc.d/init.d/keepalived
/etc/sysconfig/keepalived
將配置文件拷貝到系統(tǒng)對(duì)應(yīng)的目錄下:
shell> mkdir /etc/keepalived
shell> cp /usr/local/keepalived/etc/keepalived.conf /etc/keepalived/keepalived.conf
shell> cp /usr/local/keepalived/etc/rc.d/init.d/keepalived /etc/rc.d/init.d/keepalived
shell> cp /usr/local/keepalived/etc/sysconfig/keepalived /etc/sysconfig/keepalived
設(shè)置keepalived服務(wù)開機(jī)啟動(dòng):
shell> chkconfig keepalived on
shell> service keepalived start #啟動(dòng)服務(wù)
shell> service keepalived stop #停止服務(wù)
shell> service keepalived restart #重啟服務(wù)
另外需要注意的一點(diǎn)是,keepalived啟動(dòng)時(shí)不會(huì)檢查配置文件的語(yǔ)法是否正確,所以我們?cè)诰帉懪渲梦募r(shí)要特別小心,別寫錯(cuò)了,否則會(huì)出現(xiàn)一些意想不到的現(xiàn)象。
使用service keepalived start
命令啟動(dòng)服務(wù)時(shí),默認(rèn)會(huì)將/etc/sysconfig/keepalived
文件中KEEPALIVED_OPTIONS
參數(shù)作為keepalived
服務(wù)啟動(dòng)時(shí)的參數(shù),并從/etc/keepalived/
目錄下加載keepalived.conf配置文件,或用-f參數(shù)指定配置文件的位置。
# Options for keepalived. See `keepalived --help' output and keepalived(8) and
# keepalived.conf(5) man pages for a list of all options. Here are the most
# common ones :
#
# --vrrp -P Only run with VRRP subsystem.
# --check -C Only run with Health-checker subsystem.
# --dont-release-vrrp -V Dont remove VRRP VIPs & VROUTEs on daemon stop.
# --dont-release-ipvs -I Dont remove IPVS topology on daemon stop.
# --dump-conf -d Dump the configuration data.
# --log-detail -D Detailed log messages.日志默認(rèn)輸出在/var/log/message文件中
# --log-facility -S 0-7 Set local syslog facility (default=LOG_DAEMON)
#
KEEPALIVED_OPTIONS="-D"
運(yùn)行keepalived --help
可以查看啟動(dòng)時(shí)的可選參數(shù),這些可選參數(shù)都可以配置在/etc/sysconfig/keepalived
文件中的KEEPALIVED_OPTIONS
選項(xiàng)中,作為服務(wù)啟動(dòng)時(shí)的參數(shù)。
keepalived正常運(yùn)行后,會(huì)啟動(dòng)3個(gè)進(jìn)程,其中一個(gè)是父進(jìn)程,負(fù)責(zé)監(jiān)控其子進(jìn)程。一個(gè)是vrrp子進(jìn)程,另外一個(gè)是checkers子進(jìn)程。
shell> ps -ef | grep keepalived
root 831 1 0 11:22 ? 00:00:00 keepalived -D
root 840 831 0 11:22 ? 00:00:00 keepalived -D
root 841 831 0 11:22 ? 00:00:00 keepalived -D
到此keepalived就安裝完成了。
三、keepalived.conf配置文件說(shuō)明
keepalived服務(wù)安裝完成之后,后面的主要工作就是在keepalived.conf文件中配置HA和負(fù)載均衡。一個(gè)功能比較完整的常用的keepalived配置文件,主要包含三塊:全局定義塊、VRRP實(shí)例定義塊和虛擬服務(wù)器定義塊。全局定義塊是必須的,如果keepalived只用來(lái)做ha,虛擬服務(wù)器是可選的。下面是一個(gè)功能比較完整的配置文件模板:
#全局定義塊
global_defs {
# 郵件通知配置
notification_email {
email1
email2
}
notification_email_from email
smtp_server host
smtp_connect_timeout num
lvs_id string
router_id string ## 標(biāo)識(shí)本節(jié)點(diǎn)的字條串,通常為hostname
}
#VRRP 實(shí)例定義塊
vrrp_sync_group string {
group {
string
string
}
}
vrrp_instance string {
state MASTER|BACKUP
virtual_router_id num
interface string
mcast_src_ip @IP
priority num
advert_int num
nopreempt
smtp_alert
lvs_sync_daemon_interface string
authentication {
auth_type PASS|AH
auth_pass string
}
virtual_ipaddress { # Block limited to 20 IP addresses @IP
@IP
@IP
}
}
#虛擬服務(wù)器定義塊
virtual_server (@IP PORT)|(fwmark num) {
delay_loop num
lb_algo rr|wrr|lc|wlc|sh|dh|lblc
lb_kind NAT|DR|TUN
persistence_timeout num
protocol TCP|UDP
real_server @IP PORT {
weight num
notify_down /path/script.sh
TCP_CHECK {
connect_port num
connect_timeout num
}
}
real_server @IP PORT {
weight num
MISC_CHECK {
misc_path /path_to_script/script.sh(or misc_path “/path_to_script/script.sh <arg_list>”)
}
}
real_server @IP PORT {
weight num
HTTP_GET|SSL_GET {
url {
# You can add multiple url block path alphanum
digest alphanum
}
connect_port num
connect_timeout num
nb_get_retry num
delay_before_retry num
}
}
}
全局定義塊
1、email通知(notification_email、smtp_server、smtp_connect_timeout):用于服務(wù)有故障時(shí)發(fā)送郵件報(bào)警,可選項(xiàng),不建議用。需要系統(tǒng)開啟sendmail服務(wù),建議用第三獨(dú)立監(jiān)控服務(wù),如用nagios全面監(jiān)控代替。
2、lvs_id:lvs負(fù)載均衡器標(biāo)識(shí),在一個(gè)網(wǎng)絡(luò)內(nèi),它的值應(yīng)該是唯一的。
3、router_id:用戶標(biāo)識(shí)本節(jié)點(diǎn)的名稱,通常為hostname
4、花括號(hào){}:用來(lái)分隔定義塊,必須成對(duì)出現(xiàn)。如果寫漏了,keepalived運(yùn)行時(shí)不會(huì)得到預(yù)期的結(jié)果。由于定義塊存在嵌套關(guān)系,因此很容易遺漏結(jié)尾處的花括號(hào),這點(diǎn)需要特別注意。
VRRP實(shí)例定義塊
- vrrp_sync_group:同步vrrp級(jí),用于確定失敗切換(FailOver)包含的路由實(shí)例個(gè)數(shù)。即在有2個(gè)負(fù)載均衡器的場(chǎng)景,一旦某個(gè)負(fù)載均衡器失效,需要自動(dòng)切換到另外一個(gè)負(fù)載均衡器的實(shí)例是哪
- group:至少要包含一個(gè)vrrp實(shí)例,vrrp實(shí)例名稱必須和vrrp_instance定義的一致
- vrrp_instance:vrrp實(shí)例名
- 1> state:實(shí)例狀態(tài),只有MASTER 和 BACKUP兩種狀態(tài),并且需要全部大寫。搶占模式下,其中MASTER為工作狀態(tài),BACKUP為備用狀態(tài)。當(dāng)MASTER所在的服務(wù)器失效時(shí),BACKUP所在的服務(wù)會(huì)自動(dòng)把它的狀態(tài)由BACKUP切換到MASTER狀態(tài)。當(dāng)失效的MASTER所在的服務(wù)恢復(fù)時(shí),BACKUP從MASTER恢復(fù)到BACKUP狀態(tài)。
- 2> interface:對(duì)外提供服務(wù)的網(wǎng)卡接口,即VIP綁定的網(wǎng)卡接口。如:eth0,eth1。當(dāng)前主流的服務(wù)器都有2個(gè)或2個(gè)以上的接口(分別對(duì)應(yīng)外網(wǎng)和內(nèi)網(wǎng)),在選擇網(wǎng)卡接口時(shí),一定要核實(shí)清楚。
- 3> mcast_src_ip:本機(jī)IP地址
- 4> virtual_router_id:虛擬路由的ID號(hào),每個(gè)節(jié)點(diǎn)設(shè)置必須一樣,可選擇IP最后一段使用,相同的 VRID 為一個(gè)組,他將決定多播的 MAC 地址。
- 5> priority:節(jié)點(diǎn)優(yōu)先級(jí),取值范圍0~254,MASTER要比BACKUP高
- 6> advert_int:MASTER與BACKUP節(jié)點(diǎn)間同步檢查的時(shí)間間隔,單位為秒
- 7> lvs_sync_daemon_inteface:負(fù)載均衡器之間的監(jiān)控接口,類似于 HA HeartBeat 的心跳線。但它的機(jī)制優(yōu)于 Heartbeat,因?yàn)樗鼪]有“裂腦”這個(gè)問(wèn)題,它是以優(yōu)先級(jí)這個(gè)機(jī)制來(lái)規(guī)避這個(gè)麻煩的。在 DR 模式中,lvs_sync_daemon_inteface與服務(wù)接口interface使用同一個(gè)網(wǎng)絡(luò)接口
- 8> authentication:驗(yàn)證類型和驗(yàn)證密碼。類型主要有 PASS、AH 兩種,通常使用PASS類型,據(jù)說(shuō)AH使用時(shí)有問(wèn)題。驗(yàn)證密碼為明文,同一vrrp 實(shí)例MASTER與BACKUP使用相同的密碼才能正常通信。
- 9> smtp_alert:有故障時(shí)是否激活郵件通知
- 10> nopreempt:禁止搶占服務(wù)。默認(rèn)情況,當(dāng)MASTER服務(wù)掛掉之后,BACKUP自動(dòng)升級(jí)為MASTER并接替它的任務(wù),當(dāng)MASTER服務(wù)恢復(fù)后,升級(jí)為MASTER的BACKUP服務(wù)又自動(dòng)降為BACKUP,把工作權(quán)交給原MASTER。當(dāng)配置了nopreempt,MASTER從掛掉到恢復(fù),不再將服務(wù)搶占過(guò)來(lái)。
- 11> virtual_ipaddress:虛擬IP地址池,可以有多個(gè)IP,每個(gè)IP占一行,不需要指定子網(wǎng)掩碼。注意:這個(gè)IP必須與我們的設(shè)定的vip保持一致。
虛擬服務(wù)器virtual_server定義塊
- virtual_server:定義一個(gè)虛擬服務(wù)器,這個(gè)ip是virtual_ipaddress中定義的其中一個(gè),后面一個(gè)空格,然后加上虛擬服務(wù)的端口號(hào)。
- 1> delay_loop:健康檢查時(shí)間間隔,單位:秒
- 2> lb_algo:負(fù)載均衡調(diào)度算法,互聯(lián)網(wǎng)應(yīng)用常用方式為wlc或rr
- 3> lb_kind:負(fù)載均衡轉(zhuǎn)發(fā)規(guī)則。包括DR、NAT、TUN 3種,一般使用路由(DR)轉(zhuǎn)發(fā)規(guī)則。
- 4> persistence_timeout:http服務(wù)會(huì)話保持時(shí)間,單位:秒
- 5> protocol:轉(zhuǎn)發(fā)協(xié)議,分為TCP和UDP兩種
- real_server:真實(shí)服務(wù)器IP和端口,可以定義多個(gè)
- 1> weight:負(fù)載權(quán)重,值越大,轉(zhuǎn)發(fā)的優(yōu)先級(jí)越高
- 2> notify_down:服務(wù)停止后執(zhí)行的腳本
- 3> TCP_CHECK:服務(wù)有效性檢測(cè)
- connect_port:服務(wù)連接端口
- connect_timeout:服務(wù)連接超時(shí)時(shí)長(zhǎng),單位:秒
- nb_get_retry:服務(wù)連接失敗重試次數(shù)
- delay_before_retry:重試連接間隔,單位:秒
以上就是本文的全部?jī)?nèi)容,希望對(duì)大家的學(xué)習(xí)有所幫助,也希望大家多多支持腳本之家。