年底裸辭準(zhǔn)備面試,我用七張圖畫了ZK分布式鎖
一、寫在前面
這篇文章再給大家聊一下ZooKeeper實(shí)現(xiàn)分布式鎖的原理。
同理,我是直接基于比較常用的Curator這個(gè)開源框架,聊一下這個(gè)框架對(duì)ZooKeeper(以下簡稱zk)分布式鎖的實(shí)現(xiàn)。
一般除了大公司是自行封裝分布式鎖框架之外,建議大家用這些開源框架封裝好的分布式鎖實(shí)現(xiàn),這是一個(gè)比較快捷省事兒的方式。
二、ZooKeeper分布式鎖機(jī)制
接下來我們一起來看看,多客戶端獲取及釋放zk分布式鎖的整個(gè)流程及背后的原理。
首先大家看看下面的圖,如果現(xiàn)在有兩個(gè)客戶端一起要爭搶zk上的一把分布式鎖,會(huì)是個(gè)什么場景?

如果大家對(duì)zk還不太了解,建議先百度一下,快速了解一些基本概念,比如zk有哪些節(jié)點(diǎn)類型等等。
參見上圖。zk里有一把鎖,這個(gè)鎖就是zk上的一個(gè)節(jié)點(diǎn)。然后呢,兩個(gè)客戶端都要來獲取這個(gè)鎖,具體是怎么來獲取呢?
咱們就假設(shè)客戶端A搶先一步,對(duì)zk發(fā)起了加分布式鎖的請(qǐng)求,這個(gè)加鎖請(qǐng)求是用到了zk中的一個(gè)特殊的概念,叫做“臨時(shí)順序節(jié)點(diǎn)”。
簡單來說,就是直接在"my_lock"這個(gè)鎖節(jié)點(diǎn)下,創(chuàng)建一個(gè)順序節(jié)點(diǎn),這個(gè)順序節(jié)點(diǎn)有zk內(nèi)部自行維護(hù)的一個(gè)節(jié)點(diǎn)序號(hào)。
比如說,第一個(gè)客戶端來搞一個(gè)順序節(jié)點(diǎn),zk內(nèi)部會(huì)給起個(gè)名字叫做:xxx-000001。然后第二個(gè)客戶端來搞一個(gè)順序節(jié)點(diǎn),zk可能會(huì)起個(gè)名字叫做:xxx-000002。大家注意一下,最后一個(gè)數(shù)字都是依次遞增的,從1開始逐次遞增。zk會(huì)維護(hù)這個(gè)順序。
所以這個(gè)時(shí)候,假如說客戶端A先發(fā)起請(qǐng)求,就會(huì)搞出來一個(gè)順序節(jié)點(diǎn),大家看下面的圖,Curator框架大概會(huì)弄成如下的樣子:

大家看,客戶端A發(fā)起一個(gè)加鎖請(qǐng)求,先會(huì)在你要加鎖的node下搞一個(gè)臨時(shí)順序節(jié)點(diǎn),這一大坨長長的名字都是Curator框架自己生成出來的。
然后,那個(gè)最后一個(gè)數(shù)字是"1"。大家注意一下,因?yàn)榭蛻舳薃是第一個(gè)發(fā)起請(qǐng)求的,所以給他搞出來的順序節(jié)點(diǎn)的序號(hào)是"1"。
接著客戶端A創(chuàng)建完一個(gè)順序節(jié)點(diǎn)。還沒完,他會(huì)查一下"my_lock"這個(gè)鎖節(jié)點(diǎn)下的所有子節(jié)點(diǎn),并且這些子節(jié)點(diǎn)是按照序號(hào)排序的,這個(gè)時(shí)候他大概會(huì)拿到這么一個(gè)集合:

接著客戶端A會(huì)走一個(gè)關(guān)鍵性的判斷,就是說:唉!兄弟,這個(gè)集合里,我創(chuàng)建的那個(gè)順序節(jié)點(diǎn),是不是排在第一個(gè)???
如果是的話,那我就可以加鎖了啊!因?yàn)槊髅魑揖褪堑谝粋€(gè)來創(chuàng)建順序節(jié)點(diǎn)的人,所以我就是第一個(gè)嘗試加分布式鎖的人啊!
bingo!加鎖成功!大家看下面的圖,再來直觀的感受一下整個(gè)過程。

接著假如說,客戶端A都加完鎖了,客戶端B過來想要加鎖了,這個(gè)時(shí)候他會(huì)干一樣的事兒:先是在"my_lock"這個(gè)鎖節(jié)點(diǎn)下創(chuàng)建一個(gè)臨時(shí)順序節(jié)點(diǎn),此時(shí)名字會(huì)變成類似于:

大家看看下面的圖:

客戶端B因?yàn)槭堑诙€(gè)來創(chuàng)建順序節(jié)點(diǎn)的,所以zk內(nèi)部會(huì)維護(hù)序號(hào)為"2"。
接著客戶端B會(huì)走加鎖判斷邏輯,查詢"my_lock"鎖節(jié)點(diǎn)下的所有子節(jié)點(diǎn),按序號(hào)順序排列,此時(shí)他看到的類似于:

同時(shí)檢查自己創(chuàng)建的順序節(jié)點(diǎn),是不是集合中的第一個(gè)?
明顯不是啊,此時(shí)第一個(gè)是客戶端A創(chuàng)建的那個(gè)順序節(jié)點(diǎn),序號(hào)為"01"的那個(gè)。所以加鎖失敗!
加鎖失敗以后,客戶端B就會(huì)通過ZK的API,對(duì)他的上一個(gè)順序節(jié)點(diǎn)加一個(gè)監(jiān)聽器。zk天然就可以實(shí)現(xiàn)對(duì)某個(gè)節(jié)點(diǎn)的監(jiān)聽。
我們舉例說明,客戶端B的順序節(jié)點(diǎn)是:

他的上一個(gè)順序節(jié)點(diǎn),不就是下面這個(gè)嗎?

也就是客戶端A創(chuàng)建的那個(gè)順序節(jié)點(diǎn)!
所以,客戶端B會(huì)對(duì):

這個(gè)節(jié)點(diǎn)加一個(gè)監(jiān)聽器,監(jiān)聽這個(gè)節(jié)點(diǎn)是否被刪除等變化!
說了那么多,老規(guī)矩,給大家來一張圖,直觀的感受一下:

接著,客戶端A加鎖之后,可能處理了一些代碼邏輯,然后就會(huì)釋放鎖。那么,釋放鎖是個(gè)什么過程呢?
其實(shí)很簡單,就是把自己在zk里創(chuàng)建的那個(gè)順序節(jié)點(diǎn),也就是:

這個(gè)節(jié)點(diǎn)給刪除。
刪除了那個(gè)節(jié)點(diǎn)之后,zk會(huì)負(fù)責(zé)通知監(jiān)聽這個(gè)節(jié)點(diǎn)的監(jiān)聽器,也就是客戶端B之前加的那個(gè)監(jiān)聽器,說:兄弟,你監(jiān)聽的那個(gè)節(jié)點(diǎn)被刪除了,有人釋放了鎖。
我們一起來看看下面的圖,體會(huì)一下這個(gè)過程:

此時(shí)客戶端B的監(jiān)聽器感知到了上一個(gè)順序節(jié)點(diǎn)被刪除,也就是排在他之前的某個(gè)客戶端釋放了鎖。
此時(shí),就會(huì)通知客戶端B重新嘗試去獲取鎖,也就是獲取"my_lock"節(jié)點(diǎn)下的子節(jié)點(diǎn)集合,此時(shí)為:

集合里此時(shí)只有客戶端B創(chuàng)建的唯一的一個(gè)順序節(jié)點(diǎn)了!
然后呢,客戶端B一判斷,發(fā)現(xiàn)自己居然是集合中的第一個(gè)順序節(jié)點(diǎn),bingo!可以加鎖了!直接完成加鎖,運(yùn)行后續(xù)的業(yè)務(wù)代碼即可,運(yùn)行完了之后再次釋放鎖。
最后,再給大家來一張圖,大伙兒順著圖仔細(xì)的捋一捋這整個(gè)過程:

三、總結(jié)
其實(shí)如果有客戶端C、客戶端D等N個(gè)客戶端爭搶一個(gè)zk分布式鎖,原理都是類似的。
大家都是上來直接創(chuàng)建一個(gè)鎖節(jié)點(diǎn)下的一個(gè)接一個(gè)的臨時(shí)順序節(jié)點(diǎn)
如果自己不是第一個(gè)節(jié)點(diǎn),就對(duì)自己上一個(gè)節(jié)點(diǎn)加監(jiān)聽器
只要上一個(gè)節(jié)點(diǎn)釋放鎖,自己就排到前面去了,相當(dāng)于是一個(gè)排隊(duì)機(jī)制。
而且用臨時(shí)順序節(jié)點(diǎn)的另外一個(gè)用意就是,如果某個(gè)客戶端創(chuàng)建臨時(shí)順序節(jié)點(diǎn)之后,不小心自己宕機(jī)了也沒關(guān)系,zk感知到那個(gè)客戶端宕機(jī),會(huì)自動(dòng)刪除對(duì)應(yīng)的臨時(shí)順序節(jié)點(diǎn),相當(dāng)于自動(dòng)釋放鎖,或者是自動(dòng)取消自己的排隊(duì)。
最后,咱們來看下用Curator框架進(jìn)行加鎖和釋放鎖的一個(gè)過程:

其實(shí)用開源框架就是這點(diǎn)好,方便。這個(gè)Curator框架的zk分布式鎖的加鎖和釋放鎖的實(shí)現(xiàn)原理,其實(shí)就是上面我們說的那樣子。
但是如果你要手動(dòng)實(shí)現(xiàn)一套那個(gè)代碼的話。還是有點(diǎn)麻煩的,要考慮到各種細(xì)節(jié),異常處理等等。所以大家如果考慮用zk分布式鎖,可以參考下本文的思路。?




























