学习要点: 1.正则表达式语法(Perl风格) 2.正则表达式中的元素 3.Perl风格函数 处理字符串时,有很多较为复杂的字符串用普通的字符串处理函数无法干净的完成。比 如说,可能需要验证一个Email地址是否合法,为此需要查看许多不容易检查的规则。这正 是正则表达式的用武之地。正则表达式是功能强大而简明的字符组,其中可以包含大量的逻 辑,特别值得一提的是正则表达式相当简短。 一.正则表达式语法(Perl风格) Perl一直被认为是最伟大的解析语言之一,它提供了一种全面的正则表达式,即使是最 复杂的字符串模式,也可以用这种正则表达式语言搜索和替换。PHP开发人员认识到,与 其重新发明正则表达式,不如让PHP用户直接使用声名赫赫的Perl正则表达式语言,即Perl 风格的函数。 模式规则:/php/ 在字符串前后加上两条斜杠即可。 匹配函数:preg_match()函数在字符串中搜索模式,如果存在则返回true,否则返回false。
preg_match(‘/php/’,’php’);
?>二.正则表达式中的元素 正则表达式中包含三种元素分别为:量词、元字符、修饰符 量词 语法 描述 + 匹配任何至少包含一个前导字符串 * 匹配任何包含零个或多个前导字符串 ? 匹配任何包含零个或一个前导字符串 . 匹配任意字符串 {x} 匹配任何包含x个前导字符串 {x,y} 匹配任何包含x到y个前导字符串 元字符 修饰符 {x,} 匹配任何包含至少x个前导字符串 $ 匹配字符串的行尾 ^ 匹配字符串的行首 | 匹配字符串的左边或者右边 () 包围一个字符分组或定义个反引用,可以使用12提取 语法 描述 [a-z] 匹配任何包含小写字母a-z的字符串 [A-Z] 匹配任何包含大写字母A-Z的字符串 [0-9] 匹配任何包含数字0-9的字符串 [abc] 匹配任何包含小写字母a、b、c的字符串 [^abc] 匹配任何不包含小写字母a、b、c的字符串 [a-zA-Z0-9_] 匹配任何包含a-zA-Z0-9和下划线的字符串 w 匹配任何包含a-zA-Z0-9和下划线的字符串(同上) W 匹配任何没有下划线和字母数字的字符串 d 匹配任何数字字符,和[0-9]相同 D 匹配任何非数字字符,和[^0-9]相同 s 匹配任何空白字符 S 匹配任何非空白字符 b 匹配是否到达了单词边界 B 匹配是否没有达到单词边界 匹配正则中的特殊字符 语法 描述 i 完成不区分大小写的搜索 m 在匹配首内容或者尾内容时候采用多行识别匹配 x 忽略正则中的空白 A 强制从头开始匹配 U 禁止贪婪匹配只跟踪到最近的一个匹配符并结束 三.Perl风格函数 PHP为使用Perl兼容的正则表达式搜索字符串提供了7个函数,包括:preg_grep()、 preg_match()、preg_match_all()、preg_auote()、preg_replace()、preg_replace_callback()和 preg_split()。 搜索字符串:preg_grep()函数搜索数组中的所有元素,返回由与某个模式匹配的所有元 素组成的数组。
$language=array(‘php’,’asp’,’jsp’,’python’,’ruby’);
print_r(preg_grep(‘/p$/’,$language));
?>搜索模式:preg_match()函数在字符串中搜索模式,如果存在则返回true,否则返回false。
echopreg_match(‘/php[1-6]/’,’php5′);
?>电子邮件验证小案例(分组应用)
$mode=’/([w._]{2,10})@(w{1,}).([a-z]{2,4})/’;
$string=’yc60.com@gmail.com’;
echopreg_match($mode,$string);
?>匹配模式的所有出现:preg_match_all()函数在字符串中匹配模式的所有出现,然后将所 有匹配到的全部放入数组。
preg_match_all(‘/php[1-6]/’,’php5sdfphp4sdflljkphp3sdlfjphp2′,$out);
print_r($out);
?>定界特殊的正则表达式:preg_quote()在每个对于正则表达式语法而言有特殊含义的字 符前插入一个反斜线。这些特殊字符包含:$^*()+={}[]| \: <>。
echopreg_quote(‘PHP的价格是:$150’);
?>替换模式的所有出现:preg_replace()函数搜索到所有匹配,然后替换成想要的字符串返 回出来。
echopreg_replace(‘/php[1-6]/’,’python’,’This is aphp5,Thisis aphp4′);
?>ubb小案例:贪婪问题+分组使用()
$mode=’/[b](.*)[/b]/U’;
$replace=’1‘;
$string=’This is a[b]php5[/b],Thisis a[b]php4[/b]’;
echopreg_replace($mode,$replace,$string);
?>以不区分大小写的方式将字符串划分为不同的元素:preg_split()用来分割不同的元素。
print_r(preg_split(‘/[.@]/’,’yc60.com@gmail.com’));
?>注:目前为PHP使用POSIX风格的正则表达式搜索字符串提供了7个函数,包括:ereg()、 ereg_replace()、eregi()、eregi_replace()、split()、spliti()和sql_regcase()。