正则表达式之零宽断言

所谓零宽断言,可以字面理解:1. 零宽,宽度为0,不匹配任何字符;2.断言:判定是否存在某个字符(串)。连接到一起来说就是:判定字符串中是否存在某个字符串,但是并不匹配它。具体到底是什么意思呢?可能你还有点不能理解,举个李子:字符串 helloab,我要匹配ab,但是要求ab的前面有hello,如果前面没有hello,则匹配失败。

正先行断言

什么是正先行断言,就是在字符串相应位置之前进行查找匹配,使用 (?=exp) 匹配exp前面的位置。实例:

$str="abcgwcab";
$parent='/bc(?=gw)/';
$str=preg_match($parent,$str,$match);
var_dump($match);

/**
输出结果:
int 1 array (size=1) 
    0 => string 'bc' (length=2)
*/

解析:首先查找字符串”abcgwcab”中gw位置,断言为真,然后在匹配bc。如果将正则表达式写成$parent='/bc(?=gw)ca/'; 将会匹配不成功。

反先行断言

什么是反先行断言,使用 (?!exp) 匹配后面跟的不是exp。 实例:

$str="abcgwcab";
$parent='/bc(?!ww)gw/';
$str=preg_match($parent,$str,$match);
var_dump($str);
var_dump($match);
/**
输出:
int 1
array (size=1)
  0 => string 'bcgw' (length=4)
*/

解析:首先判断字符串是否包含bc,然后判断其后面不是ww,最后匹配gw。可以看出反向断言之前后之后,能够在添加其他匹配条件。

正后发断言

什么是正后发断言,就是在字符串相应位置之后进行查找匹配, (?<=exp) 匹配exp后面的位置

$str="abcgwcab";
$parent='/(?<=gw)ca/';
$str=preg_match($parent,$str,$match);
var_dump($str);
var_dump($match);
/**
输出结果:
int 1
array (size=1)
  0 => string 'ca' (length=2)
*/

解析:第一步,查找字符”abcgwcab”中是否包含有gw,返回结果为true,然后进行第二步,查找gw后面是否有ca。

反后发断言

什么是反后发断言,使用(?

$str="abcgwcab";
$parent='/(?<!bc)gw/';
$str=preg_match($parent,$str,$match);
var_dump($str);
var_dump($match);
/**
int 0
array (size=0)
  empty
*/

解析:首先在字符串中匹配gw,然后判断其前面是不是bc,发现其前面是bc,故返回false。

练习题

例1:\d+(?=abc)
判断一个字符串中是否包含’abc’,且其前面是否包含一个或多个数字
例2:(?<=\d\d)\w
判断字符串中是否存在连续两个数字,且其后面包含一个字母
例3:\d{3} (?!55)
判断字符串中是否包含连续三个数字,且三个数字后面不是55
例4:(?<!ac)\w\d
判断一个字符串是否包含一个字母加数字的组合,且其前面不是ac

总结

先行断言与后发断言区别?
先行断言是判断断言之前的正则表达式,断言在其他正则表达式之后。后发断言是判断断言之前的正则表达式,断言在其他正则表达式之前。这里的先与后,是其他匹配相对应断言在正则表达式中的顺序。

参考:https://blog.csdn.net/hsd2012/article/details/51272902

发表评论

电子邮件地址不会被公开。 必填项已用*标注