正则表达式「1」

一,概述:

  正则表达式,又称正规表示式、正规表示法、正规表达式、规则表达式、常规表示法(英语:Regular Expression,在代码中常简写为regex、regexp或RE),是计算机科学的一个概念。

正则表达式使用单个字符串来描述、匹配一系列匹配某个句法规则的字符串。在不少文本编辑器里,正则表达式一般被用来检索、替换那些匹配某个模式的文本。

Regular Expression的“Regular”通常被译为“正则”、“正规”、“常规”。此处的“Regular”便是“规则”、“规律”的意思,Regular Expression即“描述某种规则的表达式”之意。

二,re模块操做正则表达式

  在Python中须要经过正则表达式对字符串进行匹配的时候,能够使用一个模块,名字为re编辑器

  • 使用过程
#coding=utf-8
# 导入re模块
import re
# 使用match方法进行匹配操做
result = re.match(正则表达式,要匹配的字符串)
# 若是上一步匹配到数据的话,能够使用group方法来提取数据
result.group()
View Code

  re.match是用来进行正则匹配检查的方法,若字符串匹配正则表达式,则match方法返回匹配对象(Match Object),不然返回None(注意不是空字符串"")。

匹配对象Macth Object具备group方法,用来返回字符串的匹配部分。

  • re模块示例(匹配以itcast开头的语句)

#coding=utf-8
import re
result = re.match("itcast","itcast.cn")
result.group()
View Code

  运行结果为:itcastide

  • 说明

  e.match() 可以匹配出以xxx开头的字符串spa