這篇文章主要介紹了javascript正則表達(dá)式中分組的相關(guān)資料,包括捕獲性分組和非捕獲性分組,需要的朋友可以參考下
分組在正則中用的還是比較廣的,我所理解的分組 就是一對括號() ,每一對括號 就代表了一個分組,
分組可以分為:
捕獲性分組
非捕獲性分組
捕獲性分組
捕獲性分組會在 比如 match exec這樣的函數(shù)中以第二項(xiàng),第三項(xiàng)的形式得到相應(yīng)分組的結(jié)果。先來看一個例子吧
var reg = /test(\d+)/;
var str = 'new test001 test002';
console.log(str.match(reg));
//["test001", "001", index: 4, input: "new test001 test002"]
代碼中 (\d+)是一個分組(有些人也叫他子模式),但是表示的都是同一個意思,上面的例子中 test001是完全匹配的結(jié)果
然而 分組的匹配是從整個完全匹配結(jié)果(也就是test001)中來查找與子模式\d+匹配的字符,這里顯然是 001.
但是今天遇到的情況是這樣的
var reg = /test(\d)+/;
var str = 'new test001 test002';
console.log(str.match(reg));
//["test001", "1", index: 4, input: "new test001 test002"]
不同之處就是 (\d+) 改為了 (\d)+ ,整個匹配結(jié)果還是 test001 但是第一個分組匹配的結(jié)果卻不同。
咱們慢慢來分析他們的區(qū)別
(\d+) 這整個是一個分組的情況,由于 默認(rèn)情況下 匹配模式都是貪婪模式 也就是說盡可能多的去匹配
所有\(zhòng)d+ 匹配到的結(jié)果 是 001 然后 外面添加了一對括號 也就是一個分組,這樣第一個分組中匹配的結(jié)果就是 001.
再來看第二個例子中的 (\d)+ 同樣這也是一個貪婪模式 首先會先匹配0然后后面是0 也會匹配到 最后是1 同樣也匹配到 到此 匹配結(jié)束
看起來跟第一個例子中的匹配沒什么區(qū)別,但是這里的 分組(\d)表示 匹配單個數(shù)字
按照我之前的理解是 會匹配最開始匹配到的結(jié)果 也就是0 但這種理解是錯誤的。由于整個匹配是貪婪模式,盡可能多的去匹配
分組中的 (\d) 就會捕獲 最后一次匹配到的結(jié)果 1
如果是非貪婪模式 那就會盡可能少的去匹配
var reg = /test(\d)+?/;
var str = 'new test001 test002';
console.log(str.match(reg));
//["test001", "0", index: 4, input: "new test001 test002"]
這樣(\d)匹配結(jié)果就是0了,雖然后面還有能夠匹配到的結(jié)果,但是這里是盡可能少的去匹配
非捕獲性分組
var reg = /test(?:\d)+/;
var str = 'new test001 test002';
console.log(str.match(reg));
//["test001", index: 4, input: "new test001 test002"]
非捕獲性分組也就是 有些地方需要用到一對括號,但是又不想讓他成為一個捕獲性分組也就是不想讓這個分組被類似 macth exec 這樣的函數(shù)所獲取到
通常在括號內(nèi)部的前面加上?: 也就是 (?:pattern)這樣就變成了一個非捕獲性分組
這樣 match的結(jié)果中就不會出現(xiàn)分組匹配到的內(nèi)容了 也就是少了 第二項(xiàng)的 1.
這篇文章著重說明 (\d+)和 (\d)+的區(qū)別