正则表达式- 捕获组

PS: 阅读此篇文章前须要具有如下知识:html

  1. 正则表达式的基本语法
  2. String​.prototype​.replace()
  3. String​.prototype​.match()

捕获组(capturing group)是正则表达式里比较经常使用,也是比较重要的概念,我我的以为掌握这部分的知识是很是重要的。
这篇文章内容不会很深刻,可是尽可能作到简单易懂又全面。接下来的内容主要是围绕如下7个点:java

1: () 捕获组
2: (?:) non capturing group
3: (?=) positive lookahead
4: (?!) negative lookahead
5: (?<=) positive lookbehind
6: (?<!) negative lookbehind
7: (?=), (?!), (?<=), (?<!)的捕获web

1: () 捕获组正则表达式

/go+/

以上的正则表达式表示一个字母g后面跟上一个或者多个字母o,他能匹配go或者goooo。可是若是咱们想+不仅是运用到字母o上,而是运用到go这个总体上怎么办呢?办法就是给go加括号:缓存

/(go)+/

为了全局匹配以及不考虑大小写,咱们接下来会给咱们的正则加上ig,这两个flag:app

let reg = /(go)+/ig;
'go is g gogo'.match(reg); //["go", "gogo"]

在上面的例子里面(go)就造成了一个捕获组(capturing group)。接下来看一个使用捕获组的例子来加深对它的理解:this

let reg = /(\d{2}).(\d{2}).(\d{4})/;
let originString = '10.25.2017';
reg.test(originString); //true
RegExp.$1; //10
RegExp.$2; //25
RegExp.$2; //2017

在上面这个例子里,咱们有三组括号,造成了三个捕获组,正则表达式(在javaScript里就是咱们的RegExp)会缓存捕获组所匹配的串,以$n表示,n就表明这第几个捕获组。prototype

假如如今咱们有一个需求:把显示格式为 10.25.2017 的时间改成 2017-10-25 格式。code

咱们知道String的replace()方法常常和正则表达式一块儿使用。在replace()方法里,咱们能够直接使用捕获组的结果:regexp

let reg = /(\d{2}).(\d{2}).(\d{4})/;
let originString = '10.25.2017';
let newString = originString.replace(reg, '$3-$1-$2');
console.log(newString);//"2017-10-25"

2: (?:) non capturing group 非捕获型分组
有的时候咱们可能只想匹配分组,可是并不想缓存(不想捕获)匹配到的结果,就能够在咱们的分组模式前面加上?:。例如上面的时间的例子,咱们不想捕获第一个分组的结果,就能够这么作:

let reg = /(?:\d{2}).(\d{2}).(\d{4})/;
let originString = '10.25.2017';
reg.test(originString); //true
RegExp.$1; //25
RegExp.$2; //2017
originString.match(reg);// ["10.25.2017", "25", "2017", index: 0, input: "10.25.2017", groups: undefined]

从上面的例子能够看出,咱们的正则表达式依然是匹配的(test()的结果依然为true),可是RegExp.$1不是数字10,而是25,由于咱们在第一个括号里加了?:,10就不会被捕获。match()的执行结果也会受?:的影响:match()的结果里再也不有‘10’。

3: (?=) positive lookahead 正向前瞻型捕获
有一个句子:1 apple costs 10€. 咱们想要匹配€前面的价格(这里是一个数字),可是注意不能匹配到句子开头的数字1。这种状况,就能够用到正向前瞻型捕获:

let reg = /\d+(?=€)/g;
let reg1 = /\d+/g;
let str = '1 apple costs 10€';
str.match(reg); //["10"]
str.match(reg1); //["1", "10"]

上面的例子里面reg1就只须要匹配数字,对于数字后面跟什么并无要求,因此它能匹配到1,10。可是reg使用了前瞻型匹配,就只能匹配到10。
或许你已经能从上面的对比里了解到什么是正向前瞻型捕获了,意思是:

/x(?=y)/ 匹配x, 可是必须在x的【后面】【是】y的状况下

4: (?!) negative lookahead 负向前瞻型捕获
上面咱们了解了什么是正向前瞻型匹配,从字面意思也能猜出来负向前瞻型捕获就是:

/x(?!y)/ 匹配x, 可是必须在x的【后面】【不是】y的状况下

例以下面的例子,咱们要匹配数字1,而不要€前面的2,就能够用到?!

let reg = /\d+(?!€)/g;
let str = '1 apple costs 2€';
str.match(reg); ['1']

5: (?<=) positive lookbehind 正向后顾型捕获
后顾型和前瞻型正好相反,意思就是:

/(?<=y)x/ 匹配x, 可是只在【前面】【有】y的状况下
来看一个例子:

let str = "1 turkey costs $2";
console.log( str.match(/(?<=\$)\d+/g) ); //["2"]

这里的要求是前面有$的数字,因此这里匹配到了数字2,而没有1.

6: (?<!) negative lookbehind 负向后顾型捕获
负向就是与正向相反,那么负向后顾型捕获就是:

/(?<=y)x/ 匹配x, 可是只在【前面】【没有】y的状况下

来看一个例子:

let str = "1 turkey costs $2";
console.log( str.match(/(?<!\$)\d+/g) ); //['1']

7: (?=), (?!), (?<=), (?<!)的捕获
默认状况下上面的前瞻后顾4种都是默认不匹配捕获组里面的内容的,也就是不匹配括号里的条件的。例如咱们的正向前瞻/d+(?=€)/g,只会匹配到数字,并不会匹配到€。若是咱们想要也匹配到€怎么办呢?答案就是给€也包上一个括号:

let str = "1 turkey costs 2€";
let reg = /\d+(?=(€))/; 
str.match(reg); //["2", "€", index: 15, input: "1 turkey costs 2€", groups: undefined]

这样就匹配到了数字2和它后面的€。

下面再来看看后顾型:

let str = "1 turkey costs $2";
let reg = /(?<=(\$|£))\d+/;
console.log( str.match(reg) ); //["2", "$", index: 16, input: "1 turkey costs $2", groups: undefined]

须要特别注意到的一点是,对于后顾型,虽然条件在匹配项的前面,可是匹配出来的结果顺序依然是条件在匹配项的后面。因此这里match()出来的结果是2在$的前面。

PS:截止到目前为止(ES2015),JavaScript还不支持后顾型匹配,就是说(?<=), (?<!)这两种是不支持的。若是你在webStorm里面使用可能会获得error:look-behind groups are not supported in this regex dialect。好消息是ES2018已经对其进行了支持,能够参考:http://2ality.com/2017/05/reg...

相关文章
相关标签/搜索