c# 正则获取指定div里的所有P标签
程序后台已经获取到网页的所有源码,里面有个div如下:<div class="wm_sktq_l">.......</div>
这个div内包含多个div又包含多个p标签 现在我想获取这个div之内的所有p标签,请问该如何做?尽量详细些,最好将结果整成数组或集合,能够通过下标获取对应的p标签内容。 --------------------编程问答-------------------- 使用HtmlParser解析 --------------------编程问答--------------------
HtmlParser没用过,不会使啊。。。 --------------------编程问答-------------------- 加载到XmlDocument,查找p子节点(XPath),如果要在子节点内继续查找,用递归 --------------------编程问答--------------------
我数据是从外网上抓取的,好像不能加载到XmlDocument中吧 --------------------编程问答-------------------- 可以的,有个LoadXml()方法,参数是string类型,相关的方法(比如SelectSingleNode和SelectNodes)上MSDN(百度也行)去查一下 --------------------编程问答-------------------- string patten_block="<div class=\"wm_sktq_l\">[\\s\\S]*</div>"
string patten_p="<p>[\\s\\S]*</p>" 用组获取。
--------------------编程问答--------------------
不是太懂,本人刚开始用正则,能详细点么? --------------------编程问答-------------------- $("div p"),至于你要做什么事,你循环多少个P标签取出里面的 text() --------------------编程问答--------------------
贴html代码上来。
补充:.NET技术 , ASP.NET