javascript正则表达式分组捕获理解

咱们先来看一段js代码:ui

var rquickExpr = /^(?:(<[\w\W]+>)[^>]*|#([\w-]*))$/;
console.log(rquickExpr.exec('#div'));//["#div", undefined, "div", index: 0, input: "#div"]
console.log(rquickExpr.exec('<li>'));//["<li>", "<li>", undefined, index: 0, input: "<li>"]

解释: (?:(<[\w\W]+>)[^>]*|#([\w-]*)) 中的 (<[\w\W]+>)[^>]* 或者 #([\w-]*) 是不捕获的。spa

有三个提示捕获的地方:code

1. ^(?:(<[\w\W]+>)[^>]*|#([\w-]*))$  这个最长的。blog

2.(?:(<[\w\W]+>)[^>]*|#([\w-]*))   中的 (<[\w\W]+>) 是捕获的, 因此 能捕获到,就是捕获的结果,不能捕获到就是 undefined.input

3.(?:(<[\w\W]+>)[^>]*|#([\w-]*))   中的  ([\w-]*) 是捕获的, 因此 能捕获到,就是捕获的结果,不能捕获到就是 undefined.console

 

第一个:rquickExpr.exec('#div')。class

  1. 能匹配: ^(?:(<[\w\W]+>)[^>]*|#([\w-]*))$,因此第一个是  #divdi

  2.不能匹配 :(<[\w\W]+>)[^>]* ,因此  (<[\w\W]+>) 这个捕获是  undefined.co

  3.能匹配:#([\w-]*), 因此 ([\w-]*) 这个捕获是 divindex

合起来就是 : ["#div", undefined, "div"]

第二个:rquickExpr.exec('<li>')。

 1. 能匹配: ^(?:(<[\w\W]+>)[^>]*|#([\w-]*))$,因此第一个是  <li>

 2.能匹配 :(<[\w\W]+>)[^>]* ,因此  (<[\w\W]+>) 这个捕获是  <li>.

 3.不能匹配:#([\w-]*), 因此 ([\w-]*) 这个捕获是 undefined.

合起来就是 : ["<li>", "<li>",undefined]