当前位置:编程学习 > C#/ASP.NET >>

正则表达式应用:分析查询字符串

 正则表达式作为一种分析技术,在很多地方都可以使用,最基础的可能人人都会。再此通过一系列简单的例子讲解正则表达式。
    给定一个地址如何分析需要的数据,例如如下的网址,分析各个查询字符串
    
    基本思路是,
1先得到?后边的部分,
2再根据&和=分割
 
  1先得到?后边的部分,
    匹配查询字符串的正则表达式:\?(?<querystring>([^&]+&?)+),去掉命名部分的正则表达式为:\?([^&]+&?)+ 匹配到'?word=test&tn=sitehao123&ie=utf-8
    \?([^&]+&?)+具体含义 :
          \?表示已 ?开头,由于?在正则表达式的中有特殊含义,所以需要一个斜杠 \转义。
          [^&]+表示匹配不是&的任意一个或者多个字符
         &? 表示&出现一次或者不出现
      \?([^&]+&?)+的整体含义就是
         1匹配以?开头
          2 
            2.1匹配不是&的多个字符
            2.2匹配&一个或者没有
            2.3 重复2.1,2.2一次或者多次
        3 把(([^&]+&?)+)部分匹配到的字符命名为querystring则正则表达式变为:\?(?<querystring>([^&]+&?)+)
 
2再根据&和=分割
分析查询字符串的正则表达式为:((?<key>[^&=]+)=(?<value>[^&=]+))+,去掉命名部分的正则表达式为:(([^&=]+)=([^&=]+))+
             [^&=]+表示匹配不是&=的任意一个或者多个字符    
   (([^&=]+)=([^&=]+))+的整体含义就是
      1匹配不是&=的任意一个或者多个字符
       2匹配等号=
       3匹配不是&=的任意一个或者多个字符
      4重复以上1,2,3
    把1匹配到的字符命名为key,把3匹配到的字符命名为value,则正则表达式变为((?<key>[^&=]+)=(?<value>[^&=]+))+
 
测试的代码如下:
 
private static void Test()   
      {  
          string url = "http://www.baidu.com/s?word=test&tn=sitehao123&ie=utf-8";  
            Regex reg = new Regex(@"\?(?<querystring>([^&]+&?)+)");            
            Match m =  reg.Match(url);  
            string querystring = m.Groups["querystring"].Value;  
            Regex reg2 = new Regex(@"((?<key>[^&=]+)=(?<value>[^&=]+))+");  
            Dictionary<string, string> querystringKeyValue = new Dictionary<string, string>();  
            foreach (Match item in reg2.Matches(querystring))  
          {               
            querystringKeyValue.Add(item.Groups["key"].Value, item.Groups["value"].Value);               
          }  
        
      }  

 

 
 
     
补充:软件开发 , C# ,
CopyRight © 2012 站长网 编程知识问答 www.zzzyk.com All Rights Reserved
部份技术文章来自网络,