在线求用正则表达式提取HTML里的需要的内容
我获取的源代码HTML=<li> <a href="http://list.mall.taobao.com/50024400/g-s-----40-0--50024400-x.htm" target="_blank"> <span>手机 </span> </a> </li>
<li> <a href="http://list.mall.taobao.com/50023064/g-d-----40-0--50025484-x.htm" target="_blank"> <span>太阳镜 </span> </a> </li>
<li> <a href="http://list.mall.taobao.com/50023647/g-s-----40-0--50025033-x.htm" target="_blank"> <span>童装 </span> </a> </li>
<li> <a href="http://list.mall.taobao.com/50024399/g-s-----40-0--50024399-x.htm" target="_blank"> <span>笔记本 </span> </a> </li>
我想从中提取
http://list.mall.taobao.com/50024400/g-s-----40-0--50024400-x.htm 手机
http://list.mall.taobao.com/50023647/g-s-----40-0--50025033-x.htm 童装
http://list.mall.taobao.com/50024399/g-s-----40-0--50024399-x.htm 笔记本
http://list.mall.taobao.com/50023064/g-d-----40-0--50025484-x.htm 太阳镜
让他们按组显示在1个textbox里面 谁能告诉我该怎么写表达式么 新人求教 --------------------编程问答-------------------- 用WebBrowser控件来做HTML解析吧 --------------------编程问答--------------------
--------------------编程问答-------------------- 这个在VB里也能用不?
@"<li>\s*<a\s+href=""(?<href>[^""]+)"".*?<span>(?<text>[^<]+)</span>"
//取Groups["href"] 和 Groups["text"]
--------------------编程问答--------------------
--------------------编程问答-------------------- 上面的内容是在txtHTML.text中的 并且不只这几条数据 是一样格式的许多数据 能给出详细点的VB么 新人来的 万分感谢
Dim str As String = "<li> <a href=""http://list.mall.taobao.com/50024400/g-s-----40-0--50024400-x.htm"" target=""_blank""> <span>手机 </span> </a> </li> "
str = str & "<li> <a href=""http://list.mall.taobao.com/50023064/g-d-----40-0--50025484-x.htm"" target=""_blank""> <span>太阳镜 </span> </a> </li> "
str = str & "<li> <a href=""http://list.mall.taobao.com/50023647/g-s-----40-0--50025033-x.htm"" target=""_blank""> <span>童装 </span> </a> </li> "
str = str & "<li> <a href=""http://list.mall.taobao.com/50024399/g-s-----40-0--50024399-x.htm"" target=""_blank""> <span>笔记本 </span> </a> </li>"
Dim re As Match
re = Regex.Match(str, "<li>\s*<a\s+href=""(?<href>[^""]+)"".*?<span>(?<text>[^<]+)</span>")
While re.Success
Console.WriteLine(String.Format("key: {0}, text: {1}", re.Groups("href").Value, re.Groups("text")))
re = re.NextMatch()
End While
补充:.NET技术 , VB.NET