java正则表达式的捕获组

看书和文档,太复杂了…对形式化的概念真的没感受.因而本身写了好多例子来尝试.终于搞明白了

在java中正则表达式的捕获组由括号来表示 ,好比:javascript

String regexS = "abc(de)(fg)"

其中(de)和(fg)都是捕获组,那么上面的正则表达式就有两个捕获组.java

这玩意是来干吗的呢?web

这个主要是和Pattern和Matcher两个类结合使用的!正则表达式

仍是看个例子(从菜鸟教程上拷贝下来的):svg

public class RegexMatches
{
    public static void main( String args[] ){

      // 按指定模式在字符串查找
      String line = "This order was placed for QT3000! OK?";
      String pattern = "(\\D*)(\\d+)(.*)";

      // 建立 Pattern 对象
      Pattern r = Pattern.compile(pattern);

      // 如今建立 matcher 对象
      Matcher m = r.matcher(line);
      if (m.find( )) {
         System.out.println("Found value: " + m.group(0) );
         System.out.println("Found value: " + m.group(1) );
         System.out.println("Found value: " + m.group(2) );
         System.out.println("Found value: " + m.group(3) ); //这行是我添加上去的,菜鸟教程上没有,这行对理解挺关键的!
      } else {
         System.out.println("NO MATCH");
      }
   }

再看看输出结果:ui

Found value: This order was placed for QT3000! OK?
Found value: his order was placed for QT
Found value: 3000
Found value: ! OK?
m.group(0)  里面的这个0很关键, 0表明整个正则表达式在此次匹配中,完整匹配出来的句子
你看m.group(0)获得的结果是:
---->> This order was placed for QT3000! OK?
这个就是"(\\D*)(\\d+)(.*)"所匹配的嘛!
而 m.group(1)  m.group(2)  m.group(3) 又是什么呢?
咱们再对照下: -----------------------------------------------------------
m.group(1)  =   This order was placed for QT
m.group(2)  =   3000
m.group(3) = ! OK? -----------------------------------------------------------
对了!
这个1对应的就是第一个括号(\\D*)匹配出来的内容     
2就是第二个括号(\\d+)匹配出来的内容               
3就是第三个括号(.*)匹配出来的内容,依此类推 
m.group(0) 老是表示整个正则表达式匹配出来的内容!
而1,2,3,4......依次表示的就是捕获组匹配的内容,
捕获到了几组就显示到几, 
通常可又 m.groupCount() 获得,注意这个得到的count是不包含0的
不是说有多少个捕获组就能显示到几组啊,有些捕获组说不定就没不捕获到
/** * | 为何我要添加一行 System.out.println("Found value: " + m.group(3) ); 呢 * | 由于上面实际上匹配到了三个捕获组,有一个没打印出来 * | 若是没 m.group(3) 有这对理解捕获组的概念 影响很大 * | 到这你应该明白什么叫捕获组了吧 */
/**
    * | 最后:你也能够在括号内添加个记号(?:pattern)价格问号和冒号,使得m.group(x)方法不获取到这个捕获组
    * | 例如:
    * | "(\\D*)(?:\\d+)(.*)"
    * | 那么第二个捕获组(\\d+)就不会被记录下来,
    * | 你在使用m.group(2)的时候得到的就不是"3000"而是"! OK?"
    * | 即:
    * | m.group(1) = This order was placed for QT
    * | m.group(2) = ! OK?
    * | 可是注意m.group(0)是不会改变的,依然是"This order was placed for QT3000! OK?"
    * | m.group(0) = This order was placed for QT3000! OK?
*/