这样的正则提取规则怎么写啊!提取标题和URL!
这样的正则提取规则怎么写啊!提取标题和URL!<td nowrap class="f14"><a href="www.163.com">美国</a></td>
<td nowrap class="f14"><a href="www.123.com">中国</a></td>
循环提取美国 www.163.com
中国 www.123.com --------------------编程问答-------------------- try...
MatchCollection mc = Regex.Matches(yourStr, @"<a[^>]*href=(['""]?)(?<url>[^""\s>]*)\1[^>]*>(?<text>[\s\S]*?)</a>", RegexOptions.IgnoreCase);--------------------编程问答-------------------- 学习。。。 --------------------编程问答-------------------- 这样不行啊!把很多无用的连接也提取了
foreach (Match m in mc)
{
richTextBox2.Text += m.Groups["url"].Value + "\n";
richTextBox2.Text += m.Groups["text"].Value + "\n";
}
--------------------编程问答-------------------- 给出实例,或者具体描述你的规则,要不然不知道哪些是你不想要的 --------------------编程问答-------------------- <td nowrap class="f14">
只提取这个表格里的内容!
就是只提取这个后面的内容
--------------------编程问答-------------------- <a href="www.dgfdgfdg.com">sdgdhfgjgh</a>
<td nowrap class="f14"> <a href="www.163.com">美国 </a> </td>
<td nowrap class="f14"> <a href="www.123.com">中国 </a> </td>
只提取美国 和中国
--------------------编程问答--------------------
MatchCollection mc = Regex.Matches(yourStr, @"<td\s*nowrap\s*class=""f14"">\s*<a[^>]*href=(['""]?)(?<url>[^""\s>]*)\1[^>]*>(?<text>[\s\S]*?)</a>", RegexOptions.IgnoreCase);
foreach (Match m in mc)
{
richTextBox2.Text += m.Groups["url"].Value + "\n";
richTextBox2.Text += m.Groups["text"].Value + "\n";
}
补充:.NET技术 , C#