Python之RE模块备忘

Python经常被用作写网页抓取工具的语言,因此经常会用到python解析网页或者字符串的场景,那么python自带的RE模块就不得不提了。下面记录一下经常用到的python的RE模块用到的语法。

##常用符号

符号 含义
* 模式重复0次或多次
+ 模式重复至少一次
? 模式重复0次或1次
{m} 重复m次
{m,n} 重复m到n次
{m,} 至少重复m次
. 指模式应当匹配该位置的任何单字符

##转义码

符号 含义
\d 一个数字
\D 一个非数字
\s 空白符(制表符、空格、换行符等)
\S 非空白符
\w 字母数字
\W 非字母数字

##锚定

符号 含义
^ 字符串或行开始的地方
$ 字符串或行的结束
\A 字符串的开始
\Z 字符串的结束
\b 一个单词开头或末尾的空串
\B 不在一个单词或末尾的空串

##断言语法

符号 含义
?=pattern 前向断言
?!pattern 否定前向断言
?<=pattern 后向断言
?<!pattern 否定后向断言