在java中正则表达式的捕获组由括号来表示 ,好比:javascript
String regexS = "abc(de)(fg)"
其中(de)和(fg)都是捕获组,那么上面的正则表达式就有两个捕获组.java
这玩意是来干吗的呢?web
这个主要是和Pattern和Matcher两个类结合使用的!正则表达式
仍是看个例子(从菜鸟教程上拷贝下来的):svg
public class RegexMatches
{
public static void main( String args[] ){
// 按指定模式在字符串查找
String line = "This order was placed for QT3000! OK?";
String pattern = "(\\D*)(\\d+)(.*)";
// 建立 Pattern 对象
Pattern r = Pattern.compile(pattern);
// 如今建立 matcher 对象
Matcher m = r.matcher(line);
if (m.find( )) {
System.out.println("Found value: " + m.group(0) );
System.out.println("Found value: " + m.group(1) );
System.out.println("Found value: " + m.group(2) );
System.out.println("Found value: " + m.group(3) ); //这行是我添加上去的,菜鸟教程上没有,这行对理解挺关键的!
} else {
System.out.println("NO MATCH");
}
}
再看看输出结果:ui
Found value: This order was placed for QT3000! OK?
Found value: his order was placed for QT
Found value: 3000
Found value: ! OK?
m.group(0) 里面的这个0很关键, 0表明整个正则表达式在此次匹配中,完整匹配出来的句子
你看m.group(0)获得的结果是:
---->> This order was placed for QT3000! OK?
这个就是"(\\D*)(\\d+)(.*)"所匹配的嘛!
而 m.group(1) m.group(2) m.group(3) 又是什么呢?
咱们再对照下: -----------------------------------------------------------
m.group(1) = This order was placed for QT
m.group(2) = 3000
m.group(3) = ! OK? -----------------------------------------------------------
对了!
这个1对应的就是第一个括号(\\D*)匹配出来的内容
2就是第二个括号(\\d+)匹配出来的内容
3就是第三个括号(.*)匹配出来的内容,依此类推
m.group(0) 老是表示整个正则表达式匹配出来的内容!
而1,2,3,4......依次表示的就是捕获组匹配的内容,
捕获到了几组就显示到几,
通常可又 m.groupCount() 获得,注意这个得到的count是不包含0的
不是说有多少个捕获组就能显示到几组啊,有些捕获组说不定就没不捕获到
/** * | 为何我要添加一行 System.out.println("Found value: " + m.group(3) ); 呢 * | 由于上面实际上匹配到了三个捕获组,有一个没打印出来 * | 若是没 m.group(3) 有这对理解捕获组的概念 影响很大 * | 到这你应该明白什么叫捕获组了吧 */
/**
* | 最后:你也能够在括号内添加个记号(?:pattern)价格问号和冒号,使得m.group(x)方法不获取到这个捕获组
* | 例如:
* | "(\\D*)(?:\\d+)(.*)"
* | 那么第二个捕获组(\\d+)就不会被记录下来,
* | 你在使用m.group(2)的时候得到的就不是"3000"而是"! OK?"
* | 即:
* | m.group(1) = This order was placed for QT
* | m.group(2) = ! OK?
* | 可是注意m.group(0)是不会改变的,依然是"This order was placed for QT3000! OK?"
* | m.group(0) = This order was placed for QT3000! OK?
*/