当前位置:编程学习 > C#/ASP.NET >>

用正则表达式来抓取网页中的href="内容",最好有其他的C#代码,我找了很多都不对!谢谢!

rt

"<a[^>]+id\s*=\s*""(?<id>[^""]+)""\s*href\s*=\s*""(?<href>[^""]+)""\s*[^>]*>(?<text>.*?)</a>"
这个获取不了,谢谢! --------------------编程问答-------------------- @"<a.+?href=""(.+?)"".*?>

$1 就是地址, --------------------编程问答-------------------- sf,up --------------------编程问答-------------------- 后面落了一个 ",
string pattern = @"<a.+?href=""(.+?)"".*?>";
另外要用 IgnoreCase, 最好加上 SingleLine --------------------编程问答-------------------- 楼主参考




string regex = "(?<=<a[\\s\\S]*href=\").*?(?=\"[^>]*?>)";
            string content = "<a rel=\"mz\" href=\"http://www.csdn.net/\">首页</a>";
            Response.Write(Regex.Match(content,regex).Value);

--------------------编程问答-------------------- 抓不到正常,关键在于务实 --------------------编程问答-------------------- <.+href="(.+?)" --------------------编程问答-------------------- SDK上有例子哈

      r = new Regex("href\\s*=\\s*(?:\"(?<1>[^\"]*)\"|(?<1>\\S+))",RegexOptions.IgnoreCase|RegexOptions.Compiled);
补充:.NET技术 ,  ASP.NET
CopyRight © 2022 站长资源库 编程知识问答 zzzyk.com All Rights Reserved
部分文章来自网络,