19個心得 明明白白說Linux下的負載均衡
原創(chuàng)【51CTO.com獨家特稿】前言:作為一名Linux/unix系統(tǒng)工程師,這幾年一直在涉及到對外項目,經(jīng)手過許多小中型網(wǎng)站的架構,F(xiàn)5、LVS及Nginx接觸的都比較多,我想一種比較通俗易懂的語氣跟大家說明下何謂負載均衡,何謂Linux集群,幫助大家走出這個誤區(qū),真正意義上來理解它們,項目施工案例請參考我在network.51cto.com上的同類文章。
一、目前網(wǎng)站架構一般分成負載均衡層、web層和數(shù)據(jù)庫層,我其實一般還會多加一層,即文件服務器層,因為現(xiàn)在隨著網(wǎng)站的PV越來越多,文件服務器的壓力也越來越大;不過隨著moosefs、DRDB+Heartbeat+NFS的日趨成熟,這問題也不大了.網(wǎng)站最前端的負載均衡層稱之為Director,它起的是分攤請求的作用,最常見的就是輪詢。
二、F5是通過硬件的方式來實現(xiàn)負載均衡,它較多應用于CDN系統(tǒng),用于squid反向加速集群的負載均衡,是專業(yè)的硬件負載均衡設備,尤其適用于每秒新建連接數(shù)和并發(fā)連接數(shù)要求高的場景;LVS和Nginx是通過軟件的方式來實現(xiàn)的,但穩(wěn)定性也相當強悍,在處理高并發(fā)的情況也有相當不俗的表現(xiàn)。
三、Nginx對網(wǎng)絡的依賴較小,理論上只要ping得通,網(wǎng)頁訪問正常,nginx就能連得通,nginx同時還能區(qū)分內外網(wǎng),如果是同時擁有內外網(wǎng)的節(jié)點,就相當于單機擁有了備份線路;lvs就比較依賴于網(wǎng)絡環(huán)境,目前來看服務器在同一網(wǎng)段內并且lvs使用direct方式分流,效果較能得到保證。
四、目前較成熟的負載均衡高可用技術有LVS+Keepalived、Nginx+Keepalived,以前Nginx沒有成熟的雙機備份方案,但通過shell腳本監(jiān)控是可以實現(xiàn)的,有興趣的可具體參考我在51cto上的項目實施方案;另外,如果考慮Nginx的負載均衡高可用,也可以通過DNS輪詢的方式來實現(xiàn),有興趣的可以參考張宴的相關文章。
五、集群是指負載均衡后面的web集群或tomcat集群等,但現(xiàn)在的集群意義泛指了整個系統(tǒng)架構,它包括了負載均衡器以及后端的應用服務器集群等,現(xiàn)在許多人都喜歡把Linux集群指為LVS,但我覺得嚴格意義上應該區(qū)分開。
六、負載均衡高可用中的高可用指的是實現(xiàn)負載均衡器的HA,即一臺負載均衡器壞掉后另一臺可以在<1s秒內切換,最常用的軟件就是Keepalived和Heatbeat,成熟的生產(chǎn)環(huán)境下的負載均衡器方案有Lvs+Keepalived、Nginx+Keepalived。
七、LVS的優(yōu)勢非常多:①抗負載能力強;②工作穩(wěn)定(因為有成熟的HA方案);③無流量;④基本上能支持所有的應用,基于以上的優(yōu)點,LVS擁有不少的粉絲;但世事無絕對,LVS對網(wǎng)絡的依賴性太大了,在網(wǎng)絡環(huán)境相對復雜的應用場景中,我不得不放棄它而選用Nginx。
八、Nginx對網(wǎng)絡的依賴性小,而且它的正則強大而靈活,強悍的特點吸引了不少人,而且配置也是相當?shù)姆奖愫秃喖s,小中型項目實施中我基本是考慮它的;當然,如果資金充足,F(xiàn)5是不二的選擇。
九、大型網(wǎng)站架構中其實可以結合使用F5、LVS或Nginx,選擇它們中的二種或三種全部選擇;如果因為預算的原因不選擇F5,那么網(wǎng)站最前端的指向應該是LVS,也就是DNS的指向應為lvs均衡器,lvs的優(yōu)點令它非常適合做這個任務。重要的ip地址,最好交由lvs托管,比如數(shù)據(jù)庫的ip、webservice服務器的ip等等,這些ip地址隨著時間推移,使用面會越來越大,如果更換ip則故障會接踵而至。所以將這些重要ip交給lvs托管是最為穩(wěn)妥的。
十、VIP地址是Keepalived虛擬的一個IP,它是一個對外的公開IP,也是DNS指向的IP;所以在設計網(wǎng)站架構時,你必須向你的IDC多申請一個對外IP
十一、在實際項目實施過程中發(fā)現(xiàn),Lvs和Nginx對https的支持都非常好,尤其是LVS,相對而言處理起來更為簡便。
十二、在LVS+Keepalived及Nginx+Keepalived的故障處理中,這二者都是很方便的;如果發(fā)生了系統(tǒng)故障或服務器相關故障,即可將DNS指向由它們后端的某臺真實web,達到短期處理故障的效果,畢竟廣告網(wǎng)站和電子商務網(wǎng)站的PV就是金錢,這也是為什么要將負載均衡高可用設計于此的原因;大型的廣告網(wǎng)站我就建議直接上CDN系統(tǒng)了。
十三、現(xiàn)在Linux集群都被大家神話了,其實這個也沒多少復雜;關鍵看你的應用場景,哪種適用就選用哪種,Nginx和LVS、F5都不是神話,哪種方便哪種適用就選用哪種。
十四、另外關于session共享的問題,這也是一個老生長談的問題了;Nginx可以用ip_hash機制來解決session的問題,而F5和LVS都有會話保持機制來解決這個問題,此外,還可以將session寫進數(shù)據(jù)庫,這也是一個解決session共享的好辦法,當然這個也會加重數(shù)據(jù)庫的負擔,這個看系統(tǒng)架構師的取舍了。
十五、我現(xiàn)在目前維護的電子商務網(wǎng)站并發(fā)大約是1000左右,以前的證券資訊類網(wǎng)站是100左右,大型網(wǎng)上廣告大約是3000,我感覺web層的并發(fā)越來越不是一個問題;現(xiàn)在由于服務器的強悍,再加上Nginx作web的高抗并發(fā)性,web層的并發(fā)并不是什么大問題;相反而言,文件服務器層和數(shù)據(jù)庫層的壓力是越來越大了,單NFS不可能勝任目前的工作,現(xiàn)在好的方案是moosefs和DRDB+Heartbeat+NFS;而我喜歡的Mysql服務器,成熟的應用方案還是主從,如果壓力過大,我不得不選擇oracle的RAC雙機方案。
十六、現(xiàn)在受張宴的影響,大家都去玩Nginx了(尤其是作web),其實在服務器性能優(yōu)異,內存足夠的情況下,Apache的抗并發(fā)能力并不弱,整個網(wǎng)站的瓶頸應該還是在數(shù)據(jù)庫方面;我建議可以雙方面了解Apache和Nginx,前端用Nginx作負載均衡,后端用Apache作web,效果也是相當?shù)暮谩?/p>
十七、Heartbeat的腦裂問題沒有想象中那么嚴重,在線上環(huán)境可以考慮使用;DRDB+Heartbeat算是成熟的應用了,建議掌握。我在相當多的場合用此組合來替代EMC共享存儲,畢竟30萬的價格并不是每個客戶都愿意接受的。
十八、無論設計的方案是多么的成熟,還是建議要配置Nagios監(jiān)控機來實時監(jiān)控我們的服務器情況;郵件和短信報警都可以開啟,畢竟手機可以隨身攜帶嘛;有條件的還可以購買專門的商業(yè)掃描網(wǎng)站服務,它會每隔一分鐘掃描你的網(wǎng)站,如果發(fā)現(xiàn)沒有alive會向你的郵件發(fā)警告信息或直接電話聯(lián)系。
十九、至少網(wǎng)站的安全性問題,我建議用硬件防火墻,比較推薦的是華賽三層防火墻+天泰web防火墻,DDOS的安全防護一定要到位;Linux服務器本身的iptables和SElinux均可關閉,當然,端口開放越少越好。
補充說明:測試網(wǎng)站的響應時間是用http://tools.pingdom.com,發(fā)現(xiàn)上了LVS+Keepalived、Nginx+Keepalived后并不影響速度,這一點大家就不要多慮了,Nginx現(xiàn)在作反向加速也日趨成熟了。
【51CTO.com獨家特稿,非經(jīng)授權謝絕轉載!合作媒體轉載請注明原文出處及作者!】



















