全面分析Linux正則表達(dá)式(五)
在前面幾篇文章中,我們介紹了Linux正則表達(dá)式的子模式,逆向引用和量詞,在這篇文章里,我們將重點(diǎn)介紹正則表達(dá)式中的斷言(Assertions)。 Linux正則表達(dá)式斷言可能開(kāi)始理解起來(lái)有些困難,我們應(yīng)該加以重點(diǎn)分析。
斷言(Assertions)
斷言(Assertions)是在目標(biāo)字符串的當(dāng)前匹配位置進(jìn)行的一種測(cè)試但這種測(cè)試并不占用目標(biāo)字符串,也即不會(huì)移動(dòng)模式在目標(biāo)字符串中的當(dāng)前匹配位置。
讀起來(lái)似乎有點(diǎn)拗口,我們還是舉幾個(gè)簡(jiǎn)單的例子。
兩個(gè)最常見(jiàn)的斷言是元字符“^”和“$”,它們檢查匹配模式是否出現(xiàn)在行首或行尾。
我們來(lái)看這個(gè)模式/^\d\d\d$/,試著用它來(lái)匹配目標(biāo)字符串“123”。“\d\d\d”表示三個(gè)數(shù)字字符,匹配了目標(biāo)字符串的三個(gè)字符,而模式中的^和$分別表示這三個(gè)字符同時(shí)出現(xiàn)在行首和行尾,而它們本身并不與目標(biāo)字符串中的任何字符相對(duì)應(yīng)。
其它還有一些簡(jiǎn)單的斷言\b, \B, \A, \Z, \z,它們都以反斜線開(kāi)頭,前面我們已經(jīng)介紹過(guò)反斜線的這個(gè)用法。這幾個(gè)斷言的含義如下表。
斷言 含義
\b 字分界線
\B 非字分界線
\A 目標(biāo)的開(kāi)頭(獨(dú)立于多行模式)
\Z 目標(biāo)的結(jié)尾或位于結(jié)尾的換行符前(獨(dú)立于多行模式)
\z 目標(biāo)的結(jié)尾(獨(dú)立于多行模式)
\G 目標(biāo)中的第一個(gè)匹配位置
注意這些斷言不能出現(xiàn)在字符類中,如果出現(xiàn)了也是其它的含義,例如\b在字符類中表示反斜線字?

【編輯推薦】
























