C语言中的正则表达式
正则表达式(Regular Expressions),又被称为regex或regexp,是一种十分简便、灵活的文本处理工具。它可以用来精确地找出某文本中匹配某种指定规则的内容。 关于正则表达式的教程,可以参考这里。
在C/C++中常用的正则表达式库有GNU Regex Library, Boost.Regex, PCRE, PCRE++。这四个库中,后面两个是有关系,其它都是各自己独立的,是不同的实现。今天主要用GNU Regex Library。
几个主要函数
(1)regcomp:
[cpp]
int regcomp(regex_t *preg, const char *pattern, int cflags)
功能:将要进行匹配的正则表达式pattern进行编译,做匹配前的准备工作
参数: preg, 输出参数,用来保存编译后的正则表达式结果
pattern, 输入参数,传入要进行编译的正则表达式的字符串
cflags, 输入参数,用来指定正则表达式匹配过程中的一些选项
返回值:编译成功返回0,失败返回非0的错误码
int regcomp(regex_t *preg, const char *pattern, int cflags)
功能:将要进行匹配的正则表达式pattern进行编译,做匹配前的准备工作
参数: preg, 输出参数,用来保存编译后的正则表达式结果
pattern, 输入参数,传入要进行编译的正则表达式的字符串
cflags, 输入参数,用来指定正则表达式匹配过程中的一些选项
返回值:编译成功返回0,失败返回非0的错误码
(2)regexec:
[cpp]
int regexec(const regex_t *preg, const char *string, size_t nmatch, regmatch_t pmatch[],
int eflags)
功能:用来检测字符串string是否匹配正则表达式preg
参数: preg, 输入参数,在(1)regcomp中编译好的正则表达式规则
string, 输入参数,用来被匹配的字符串
nmatch, 输入参数,用来指定pmatch参数所对应的数组的长度
pmatch, 输出参数,用来输出在string中匹配preg的具易做图置
eflag, 输入参数,用来指定正则表达式匹配过程中的一些选项
返回值: 如果string匹配preg所指定的规则,则返回0, 否则返回非0
int regexec(const regex_t *preg, const char *string, size_t nmatch, regmatch_t pmatch[],
int eflags)
功能:用来检测字符串string是否匹配正则表达式preg
参数: preg, 输入参数,在(1)regcomp中编译好的正则表达式规则
string, 输入参数,用来被匹配的字符串
nmatch, 输入参数,用来指定pmatch参数所对应的数组的长度
pmatch, 输出参数,用来输出在string中匹配preg的具易做图置
eflag, 输入参数,用来指定正则表达式匹配过程中的一些选项
返回值: 如果string匹配preg所指定的规则,则返回0, 否则返回非0
(3)regerror:
[plain] view plaincopyprint?size_t regerror(int errcode, const regex_t *preg, char *errbuf, size_t errbuf_size)
功能:用来把在regcompt和regexec中产生的错误码转化成字符串形式的错误信息
参数: errcode, 输入参数,在regcomp或regexec调用中返回的错误码
preg, 输入参数,与错误码所对应的编译过的正则表达式结构
errbuf, 输出参数,用来返回错误信息的buffer,如果buffer不够所需大小,错误信息将被截断
errbuf_size, 输入参数,返回错误信息的buffer的大小
返回值: 如果errbuf_size为0,那么regerror返回错误信息所需要的buffer的大小
size_t regerror(int errcode, const regex_t *preg, char *errbuf, size_t errbuf_size)
功能:用来把在regcompt和regexec中产生的错误码转化成字符串形式的错误信息
参数: errcode, 输入参数,在regcomp或regexec调用中返回的错误码
preg, 输入参数,与错误码所对应的编译过的正则表达式结构
errbuf, 输出参数,用来返回错误信息的buffer,如果buffer不够所需大小,错误信息将被截断
errbuf_size, 输入参数,返回错误信息的buffer的大小
返回值: 如果errbuf_size为0,那么regerror返回错误信息所需要的buffer的大小
(4)regfree:
[plain] view plaincopyprint?void regfree (regex_t *preg)
功能: 用来释放由regcomp编译时生成的preg结构所占用的内存
参数: preg, 输入参数,由regcomp编译时生成的正则表达的结构指针
返回值: 无
void regfree (regex_t *preg)
功能: 用来释放由regcomp编译时生成的preg结构所占用的内存
参数: preg, 输入参数,由regcomp编译时生成的正则表达的结构指针
返回值: 无
实例-邮箱匹配
[plain]
#include <stdio.h>
#include <sys/types.h>
#include <regex.h>
int main(int argc,char** argv)
{
int status,i;
int cflags=REG_EXTENDED;
regmatch_t pmatch[1];
const size_t nmatch=1;
regex_t reg;
const char *pattern ="^\\w+([-+.]\\w+)*@\\w+([-.]\\w+)*.\\w+([-.]\\w+)*";
char buf[256];
regcomp(®,pattern,cflags);
while(true)
{
printf("input your email address:\n");
gets(buf);
if((status=regexec(®,buf,nmatch,pmatch,0))==0)
{
printf("Correct\n");
//print match part
for(i=pmatch[0].rm_so;i<pmatch[0].rm_eo;++i)
putchar(buf[i]);
printf("\n");
regfree(®);
break;
}
else
{
printf("Error address,input again:\n");
}
}
return 0;
}
#include <stdio.h>
#include <sys/types.h>
#include <regex.h>
int main(int argc,char** argv)
{
int status,i;
int cflags=REG_EXTENDED;
regmatch_t pmatch[1];
const size_t nmatch=1;
regex_t reg;
const char *pattern ="^\\w+([-+.]\\w+)*@\\w+([-.]\\w+)*.\\w+([-.]\\w+)*";
char buf[256];
regcomp(®,pattern,cflags);
while(true)
{
printf("input your email address:\n");
gets(buf);
if((status=regexec(®,buf,nmatch,pmatch,0))==0)
{
printf("Correct\n");
//print match part
补充:软件开发 , C语言 ,
上一个:C语言32大关键字
下一个:如何使用C语言写: Generic Stack
- 更多C/C++疑问解答:
- 关于c++的cout输出的问题。
- 在学校里学过C和C++,不过学的很一般,现在自学C#,会不会很难?
- 全国计算机二级C语言笔试题
- 已知某树有2个2度结点,3个3度结点,4个4度结点,问有几个叶子结点?
- c++数据结构内部排序问题,整数排序
- 2012九月计算机二级C语言全国题库,,急求急求
- 如果assert只有一个字符串作为参数,是什么意思呢?
- C语言中,哪些运算符具有左结合性,哪些具有右结合性,帮忙总结下,谢谢了!
- 为什么用结构体编写的程序输入是,0输不出来啊~~~
- 将IEEE—754的十六进制转化为十进制浮点类型,用C或C++都行,多谢各位大侠啊,非常感谢!
- 为什么这个程序求不出公式?
- 这个链表倒置的算法请大家分析下
- c语言函数库调用
- C语言unsigned int纠错
- C语言快排求解啊