第4章数据处理-php正则表达式-郑阿奇(续)


答案：
1.正则表达式基础知识 
含义：由普通字符和（a-z)和一些特殊字符组成的字符串模式 
功能：有效性验证。 
替换文本。 
从一个字符串提取一个子字符串。 
分类：POSIX和Perl 
POSIX风格更容易掌握，但不能用于二进制模式，而perl相对比较复杂。 
2.POSIX风格的正则表达式 
1.编写正则表达式 
表4.3 POSIX正则表达式语法格式列表 





字 符

描 述


\

转义字符，用于转义特殊字符。例如，'.'匹配单个字符，'\.'匹配一个点号。'\-'匹配连字符'-'，'\\'匹配符号'\'


^

匹配输入字符串的开始位置。例如'^he'表示以'he'开头的字符串


$

匹配输入字符串的结束位置。例如，'ok$'表示以'ok'结尾的字符串


*

匹配前面的子表达式零次或多次。例如，'zo*'能匹配"z"以及"zoo"。*等价于{0,}


+

匹配前面的子表达式一次或多次。例如，'zo+'能匹配"zo"以及"zoo"，但不能匹配"z"。+等价于{1,}


?

匹配前面的子表达式零次或一次。例如，'do(es)?'可以匹配"do"或"does"中的"do"。'?'等价于{0,1}


{n}

n是一个非负整数。匹配确定的n次。例如，'o{2}'不能匹配"Bob"中的'o'，但是能匹配"food" 中的两个'o'


{n,}

n是一个非负整数。至少匹配n次。例如，'o{2,}'不能匹配"Bob"中的'o'，但能匹配"foooood" 中的所有'o'。'o{1,}'等价于'o+'。'o{0,}'则等价于'o*'


{n,m}

m和n均为非负整数，其中n≤m。最少匹配n次且最多匹配m次。例如，"o{1,3}"将匹配"fooooood"中的前三个'o'。'o{0,1}'等价于'o?'。请注意在逗号和两个数之间不能有空格


?

当该字符紧跟在任何一个其他限制符（*, +, ?, {n}, {n,}, {n,m}）后面时，匹配模式是非贪婪的。非贪婪模式尽可能少地匹配所搜索的字符串，而默认的贪婪模式则尽可能多地匹配所搜索的字符串。例如，对于字符串"oooo"，'o+?'将匹配单个"o"，而'o+' 将匹配所有'o'


.

匹配除"\n"之外的任何单个字符，要匹配包括'\n' 在内的任何字符，可以使用'[.\n]'的模式


(pattern)

匹配pattern并获取这一匹配。所获取的匹配保存到相应的数组中。要匹配圆括号字符，请使用 '\(' 或 '\)'


(?:pattern)

匹配pattern但不获取匹配结果，也就是说这是一个非获取匹配，不进行存储。这在使用"或"|"来组合一个模式的各个部分时很有用。例如，'industr(?:y|ies).就是一个比'industry|industries'更简略的表达式


(?=pattern)

正向预查，在任何匹配pattern的字符串开始处匹配查找字符串。这是一个非获取匹配，也就是说，该匹配不需要获取供以后使用。例如，'Windows(?=95|98|NT|2000)'能匹配"Windows 2000"中的"Windows"，但不能匹配"Windows 3.1"中的"Windows"。预查不消耗字符，也就是说，在一个匹配发生后，在最后一次匹配之后立即开始下一次匹配的搜索，而不是从包含预查的字符之后开始


(?!pattern)

负向预查，在任何不匹配pattern的字符串开始处匹配查找字符串。这是一个非获取匹配，也就是说，该匹配不需要获取供以后使用。例如'Windows(?!95|98|NT|2000)'能匹配"'Windows 3.1"中的"Windows"，但不能匹配"Windows 2000"中的"Windows"。预查不消耗字符，也就是说，在一个匹配发生后，在最后一次匹配之后立即开始下一次匹配的搜索，而不是从包含预查的字符之后开始


x|y

匹配x或y。例如，'z|food' 能匹配"z"或"food"，'(z|f)ood'则匹配"zood"或"food"


[xyz]

字符集合。匹配所包含的任意一个字符。例如，'[abc]'可以匹配"plain"中的'a'


[^xyz]

负值字符集合。匹配未包含的任意字符。例如，'[^abc]'可以匹配"plain"中的'p'


[a-z]

字符范围。匹配指定范围内的任意字符。例如，'[a-z]'可以匹配'a'到'z' 范围内的任意小写字母字符


[^a-z]

负值字符范围。匹配不在指定范围内的任意字符。例如，'[^a-z]'可以匹配不在'a' 到'z'范围内的任意字符
以下是几个简单的正则表达式的例子： 
●'[A-Za-z0-9] '：表示所有的大写字母、小写字母及0到9的数字。 
●'^hello'：表示以hello开始的字符串。 
●'world$'：表示以world结尾的字符串。 
●'.at'：表示以除"\n"外的任意单个字符开头并以"at"结尾的字符串，如"cat"、"nat"等。 
●'^[a-zA-Z]'：表示一个以字母开头的字符串。 
●'hi{2}'：表示字母h后跟着两个i即hii。 
●'(go)+'：表示至少含有一个'go'字符串的字符串，如'gogo' 
身份证号码一般由18位数字或17位数字后面加一个X或Y字母组成，要匹配身份证号码，可以写作： 
^[0-9]{17}([0-9]|X|Y)$ 
Email地址的正则表达式可以写作： 
^[a-zA-Z0-9\-]+@[a-zA-Z0-9\-]+\.[a-zA-Z0-9\-\.]+$ 
2.字符串的匹配 
ereg()和eregi()函数 
使用ereg()函数可以查找字符串与子字符串匹配的情况，并返回匹配字符串的长度，还可以借助参数返回匹配字符的数组。语法格式如下： 
int ereg(string ($pattern) , string $string [, array $regs ]) 
复制代码 代码如下:
 
<?php 
/*本例检查字符串是否是ISO格式的日期(YYYY-MM-DD) */ 
$date="1988-08-09"; 
$len=ereg ('([0-9]{4})-([0-9]{1,2})-([0-9]{1,2})', $date, $regs);//日期格式为YYYY-MM-DD 
if ($len) 
{ 
echo "$regs[3].$regs[2].$regs[1]". "<br>"; //输出"09.08.1988" 
echo $regs[0] ."<br>"; //输出"1988-08-09" 
echo $len; //输出10 
} 
else 
{ 
echo "错误的日期格式: $date"; 
} 
?> 
 
3.字符串的替换 
ereg_replace()函数语法格式如下： 
string ereg_replace(string $pattern , string $replacement , string $string) 
说明：函数使用字符串$replacement替换字符串$string中与$pattern匹配的部分，并返回替换后的字符串。若未找到匹配项，则原样返回 
复制代码 代码如下:
 
<?php 
$str="hello world"; 
echo ereg_replace('[aeo]', 'x',$str). "<br>"; //输出'hxllx wxrld' 
$res='<a href=>echo ereg_replace('hello', $res,$str); //使用超链接替换'hello' 
?> 
 
4.分割数组 

使用split()函数可以完成与explode()函数一样的功能，而且可以根据给出的正则表达式来分割字符串，并返回一个数组。语法格式如下： 

array split(string $pattern , string $string [, int $limit ]) 

5.产生正则表达式 

3.Perl兼容的正则表达式 

1.编写正则表达式 

表4.4 Perl兼容正则表达式扩充的语法格式 

上一个：php中批量删除Mysql中相同前缀的数据表的代码
下一个：PHP导出MySQL数据到Excel文件(fputcsv)
更多图片编程知识:
让PHP网站跑的更快---如何优化PHP

smarty局部缓存技术[源码分析]

求助：PHP一段代码的显示结果不明白？

Yii Framework 开发教程Zii组件-Menu 示例  

PHP设计模式漫谈之迭代器模式

企业建站好帮手 PHPCMS快速入门
  
更多php疑问解答：
wordpress问题<?php if(have_posts()) : ?>
建设一个搜索类网站php还是jsp，数据库那个好
我是一个学PHP的，我现在已经学会了PHP，HTML，CSS，JS，JQ，AJAX，XML，thinkPHP，smarty模板
没理由啊 php代码无法执行，貌似有语法错误。。。
关于PHP 和API 的一段代码不懂啊不懂，请高手指点！ 这是淘宝API的
php语言中，序列化到底在那里使用？它的优势是什么？劣势是什么？
PHP函数等于或等于应该怎么表达
请教php高手，解决basename函数和mb_substr函数处理中文文件名称的解决方法，在上传文件时，总是出现乱码
.NET，PHP，JAVA，JS优秀点分别是？
织梦cms 在环境监测的时候 wamp5 gd不支持 是为什么。;extension=php_gd2.dll这一句我删除了还是不显示？
我想学PHP。1.应安装什么编程工具？ 2. 装LIUNX系统是装简易的还是？什么版本的？3.还应安装什么？
<?php 和 <? 有什么区别
PHP网页如何接收按钮的值？请问
买来书的代码运行好是错误。。帮帮忙啊。php
求，一个php代码，用来修改 mysql数据库中的商品名字的大小写


  
    站长资源库
    	

      
    asp
php
Delphi
Matlab
JSP
Foxpro
JS
C/C++
C#/ASP.NET
VC++
JAVA
VB
汇编语言
html/css
CGI
XML/UML
wap
网站相关
网页素材
python
如果你遇到编程学习难题：
请访问www.zzzyk.com 试试
  
  
  



  


CopyRight © 2012 站长网 编程知识问答 www.zzzyk.com All Rights Reserved
部份技术文章来自网络，






字 符

描 述


\b

匹配一个单词边界，也就是指单词和空格间的位置。例如，'er\b'可以匹配"never"中的 'er'，但不能匹配"verb"中的'er'


\B

匹配非单词边界。'er\B'能匹配"verb"中的'er'，但不能匹配"never"中的'er'


\cx

匹配由x指明的控制字符。例如，'\cM'匹配一个Control-M或回车符。x的值必须为A～Z或a～z之一。否则，将'c'视为一个原义的'c'字符


\d

匹配一个数字字符。等价于'[0-9]'


\D

匹配一个非数字字符。等价于'[^0-9]'


\f

匹配一个换页符。等价于'\x0c'和'\cL'

字符	描述
\	转义字符，用于转义特殊字符。例如，'.'匹配单个字符，'\.'匹配一个点号。'\-'匹配连字符'-'，'\\'匹配符号'\'
^	匹配输入字符串的开始位置。例如'^he'表示以'he'开头的字符串
$	匹配输入字符串的结束位置。例如，'ok$'表示以'ok'结尾的字符串
*	匹配前面的子表达式零次或多次。例如，'zo'能匹配"z"以及"zoo"。等价于{0,}
+	匹配前面的子表达式一次或多次。例如，'zo+'能匹配"zo"以及"zoo"，但不能匹配"z"。+等价于{1,}
?	匹配前面的子表达式零次或一次。例如，'do(es)?'可以匹配"do"或"does"中的"do"。'?'等价于{0,1}
{n}	n是一个非负整数。匹配确定的n次。例如，'o{2}'不能匹配"Bob"中的'o'，但是能匹配"food" 中的两个'o'
{n,}	n是一个非负整数。至少匹配n次。例如，'o{2,}'不能匹配"Bob"中的'o'，但能匹配"foooood" 中的所有'o'。'o{1,}'等价于'o+'。'o{0,}'则等价于'o*'
{n,m}	m和n均为非负整数，其中n≤m。最少匹配n次且最多匹配m次。例如，"o{1,3}"将匹配"fooooood"中的前三个'o'。'o{0,1}'等价于'o?'。请注意在逗号和两个数之间不能有空格
?	当该字符紧跟在任何一个其他限制符（*, +, ?, {n}, {n,}, {n,m}）后面时，匹配模式是非贪婪的。非贪婪模式尽可能少地匹配所搜索的字符串，而默认的贪婪模式则尽可能多地匹配所搜索的字符串。例如，对于字符串"oooo"，'o+?'将匹配单个"o"，而'o+' 将匹配所有'o'
.	匹配除"\n"之外的任何单个字符，要匹配包括'\n' 在内的任何字符，可以使用'[.\n]'的模式
(pattern)	匹配pattern并获取这一匹配。所获取的匹配保存到相应的数组中。要匹配圆括号字符，请使用 '\(' 或 '\)'
(?:pattern)	匹配pattern但不获取匹配结果，也就是说这是一个非获取匹配，不进行存储。这在使用"或"\|"来组合一个模式的各个部分时很有用。例如，'industr(?:y\|ies).就是一个比'industry\|industries'更简略的表达式
(?=pattern)	正向预查，在任何匹配pattern的字符串开始处匹配查找字符串。这是一个非获取匹配，也就是说，该匹配不需要获取供以后使用。例如，'Windows(?=95\|98\|NT\|2000)'能匹配"Windows 2000"中的"Windows"，但不能匹配"Windows 3.1"中的"Windows"。预查不消耗字符，也就是说，在一个匹配发生后，在最后一次匹配之后立即开始下一次匹配的搜索，而不是从包含预查的字符之后开始
(?!pattern)	负向预查，在任何不匹配pattern的字符串开始处匹配查找字符串。这是一个非获取匹配，也就是说，该匹配不需要获取供以后使用。例如'Windows(?!95\|98\|NT\|2000)'能匹配"'Windows 3.1"中的"Windows"，但不能匹配"Windows 2000"中的"Windows"。预查不消耗字符，也就是说，在一个匹配发生后，在最后一次匹配之后立即开始下一次匹配的搜索，而不是从包含预查的字符之后开始
x\|y	匹配x或y。例如，'z\|food' 能匹配"z"或"food"，'(z\|f)ood'则匹配"zood"或"food"
[xyz]	字符集合。匹配所包含的任意一个字符。例如，'[abc]'可以匹配"plain"中的'a'
[^xyz]	负值字符集合。匹配未包含的任意字符。例如，'[^abc]'可以匹配"plain"中的'p'
[a-z]	字符范围。匹配指定范围内的任意字符。例如，'[a-z]'可以匹配'a'到'z' 范围内的任意小写字母字符
[^a-z]	负值字符范围。匹配不在指定范围内的任意字符。例如，'[^a-z]'可以匹配不在'a' 到'z'范围内的任意字符

字符	描述
\b	匹配一个单词边界，也就是指单词和空格间的位置。例如，'er\b'可以匹配"never"中的 'er'，但不能匹配"verb"中的'er'
\B	匹配非单词边界。'er\B'能匹配"verb"中的'er'，但不能匹配"never"中的'er'
\cx	匹配由x指明的控制字符。例如，'\cM'匹配一个Control-M或回车符。x的值必须为A～Z或a～z之一。否则，将'c'视为一个原义的'c'字符
\d	匹配一个数字字符。等价于'[0-9]'
\D	匹配一个非数字字符。等价于'[^0-9]'
\f	匹配一个换页符。等价于'\x0c'和'\cL'

第4章 数据处理-php正则表达式-郑阿奇(续)

第4章数据处理-php正则表达式-郑阿奇(续)