python基础(17):正则表达式

1. 正则表达式

1.1 正则表达式是什么

正则表达式自己也和python没有什么关系,就是匹配字符串内容的一种规则。python

官方定义:正则表达式是对字符串操做的一种逻辑公式,就是用事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑。正则表达式

一说规则我已经知道你很晕了,如今就让咱们先来看一些实际的应用。在线测试工具 http://tool.chinaz.com/regex/工具

首先你要知道的是,谈到正则,就只和字符串相关了。在我给你提供的工具中,你输入的每个字都是一个字符串。
其次,若是在一个位置的一个值,不会出现什么变化,那么是不须要规则的。
好比你要用"1"去匹配"1",或者用"2"去匹配"2",直接就能够匹配上。这连python的字符串操做均可以轻松作到。
那么在以后咱们更多要考虑的是在同一个位置上能够出现的字符的范围。

 

1.2 正则表达式的匹配规则

字符:x测试

含义:表明的是字符xspa

例如:匹配规则为 "a",那么须要匹配的字符串内容就是 ”a”字符串

 

字符:\\get

含义:表明的是反斜线字符'\'it

例如:匹配规则为"\\" 那么须要匹配的字符串内容就是 ”\”测试工具

 

字符:\tco

含义:制表符

例如:匹配规则为"\t" ,那么对应的效果就是产生一个制表符的空间

 

字符:\n

含义:换行符

例如:匹配规则为"\n",那么对应的效果就是换行,光标在原有位置的下一行

 

字符:\r

含义:回车符

例如:匹配规则为"\r" ,那么对应的效果就是回车后的效果,光标来到下一行行首

 

字符类:[abc]

含义:表明的是字符ab c

例如:匹配规则为"[abc]" ,那么须要匹配的内容就是字符a,或者字符b,或字符c的一个

 

字符类:[^abc]

含义:表明的是除了 ab c之外的任何字符

例如:匹配规则为"[^abc]",那么须要匹配的内容就是否是字符a,或者不是字符b,或不是字符c的任意一个字符

 

字符类:[a-zA-Z]

含义:表明的是a z A Z,两头的字母包括在内

例如:匹配规则为"[a-zA-Z]",那么须要匹配的是一个大写或者小写字母

 

字符类:[0-9]

含义:表明的是 09数字,两头的数字包括在内

例如:匹配规则为"[0-9]",那么须要匹配的是一个数字

 

字符类:[a-zA-Z_0-9]

含义:表明的字母或者数字或者下划线(即单词字符)

例如:匹配规则为" [a-zA-Z_0-9] ",那么须要匹配的是一个字母或者是一个数字或一个下滑线

 

预约义字符类:.

含义:表明的是任何字符

例如:匹配规则为" . ",那么须要匹配的是一个任意字符。若是,就想使用 . 的话,使用匹配规则"\\."来实现

 

预约义字符类:\d

含义:表明的是 09数字,两头的数字包括在内,至关于[0-9]

例如:匹配规则为"\d ",那么须要匹配的是一个数字

 

预约义字符类:\w

含义:表明的字母或者数字或者下划线(即单词字符),至关于[a-zA-Z_0-9]

例如:匹配规则为"\w ",,那么须要匹配的是一个字母或者是一个数字或一个下滑线

 

边界匹配器:^

含义:表明的是行的开头

例如:匹配规则为^[abc][0-9]$ ,那么须要匹配的内容从[abc]这个位置开始, 至关于左双引号

 

边界匹配器:$

含义:表明的是行的结尾

例如:匹配规则为^[abc][0-9]$ ,那么须要匹配的内容以[0-9]这个结束, 至关于右双引号

 

边界匹配器:\b

含义:表明的是单词边界

例如:匹配规则为"\b[abc]\b" ,那么表明的是字母abc的左右两边须要的是非单词字符([a-zA-Z_0-9])

 

数量词:X?

含义:表明的是X出现一次或一次也没有

例如:匹配规则为"a?",那么须要匹配的内容是一个字符a,或者一个a都没有

 

数量词:X*

含义:表明的是X出现零次或屡次

例如:匹配规则为"a*" ,那么须要匹配的内容是多个字符a,或者一个a都没有

 

数量词:X+

含义:表明的是X出现一次或屡次

例如:匹配规则为"a+",那么须要匹配的内容是多个字符a,或者一个a

 

数量词:X{n}

含义:表明的是X出现刚好 n

例如:匹配规则为"a{5}",那么须要匹配的内容是5个字符a

 

数量词:X{n,}

含义:表明的是X出现至少 n

例如:匹配规则为"a{5, }",那么须要匹配的内容是最少有5个字符a

 

数量词:X{n,m}

含义:表明的是X出现至少 n 次,可是不超过 m

例如:匹配规则为"a{5,8}",那么须要匹配的内容是有5个字符a 8个字符a之间