当前位置:编程学习 > C#/ASP.NET >>

c# 正则获取指定div里的所有P标签

程序后台已经获取到网页的所有源码,里面有个div如下:
<div class="wm_sktq_l">.......</div>
这个div内包含多个div又包含多个p标签   现在我想获取这个div之内的所有p标签,请问该如何做?尽量详细些,最好将结果整成数组或集合,能够通过下标获取对应的p标签内容。 --------------------编程问答-------------------- 使用HtmlParser解析 --------------------编程问答--------------------
引用 1 楼 nice_fish 的回复:
使用HtmlParser解析

HtmlParser没用过,不会使啊。。。 --------------------编程问答-------------------- 加载到XmlDocument,查找p子节点(XPath),如果要在子节点内继续查找,用递归 --------------------编程问答--------------------
引用 3 楼 await2013 的回复:
加载到XmlDocument,查找p子节点(XPath),如果要在子节点内继续查找,用递归

我数据是从外网上抓取的,好像不能加载到XmlDocument中吧 --------------------编程问答-------------------- 可以的,有个LoadXml()方法,参数是string类型,相关的方法(比如SelectSingleNode和SelectNodes)上MSDN(百度也行)去查一下 --------------------编程问答-------------------- string patten_block="<div class=\"wm_sktq_l\">[\\s\\S]*</div>"

string patten_p="<p>[\\s\\S]*</p>" 用组获取。


--------------------编程问答--------------------
引用 6 楼 wonderfuly 的回复:
string patten_block="<div class=\"wm_sktq_l\">[\\s\\S]*</div>"

string patten_p="<p>[\\s\\S]*</p>" 用组获取。

不是太懂,本人刚开始用正则,能详细点么? --------------------编程问答-------------------- $("div p"),至于你要做什么事,你循环多少个P标签取出里面的 text()  --------------------编程问答--------------------
引用 7 楼 u010238570 的回复:
引用 6 楼 wonderfuly 的回复:string patten_block="<div class=\"wm_sktq_l\">[\\s\\S]*</div>"

string patten_p="<p>[\\s\\S]*</p>" 用组获取。
不是太懂,本人刚开始用正则,能详细点么?


贴html代码上来。
补充:.NET技术 ,  ASP.NET
CopyRight © 2012 站长网 编程知识问答 www.zzzyk.com All Rights Reserved
部份技术文章来自网络,