当前位置:编程学习 > JAVA >>

关于网页提取中正则表达式的一个问题

想提取网页源码中的代码,我使用的正则表达式为:regex = "<div class=\"comment_content\">(\\s)(.)*(<br/>)?</div>";
结果一点反应都没有,请教各位,我这段得怎么修改?

网页源码中的想提取的部分如下:
========================================================================================================

<div class="comment_content">
<p>综合评价的话,还是值得一看的。
<br/>但是我看到现在一半多看完了,但是里面确实是有几篇文章看完了二丈摸不着头脑,不知所措,不知道文章说完了,具体该怎么做却不知道。
<br/>难道是我智商太低了还是怎么地,我也不清楚。
<br/>反正我知道,我看懂了的那几篇文章,倒是非常有道理,受益匪浅。
<br/>懂得给自己提升一下内在修养的人,都应该慢慢品读一下这本书。
<br/>怎么说,刘墉先生的文笔和修养都是很不错的。推荐一下!!! </div>

================================================================================================================= --------------------编程问答-------------------- "<div   class=\ "comment_content\ "> (\\s)(.)*( <br/> )? </div>"

你这个的意思就是,匹配一次"<div   class=\ "comment_content\ "> 
(\\s)匹配一个空格
(.)* 匹配0个或者多个任意字符
( <br/> )?  匹配0个或者1个<br/>
</div>      匹配一个</div>

这个要求不能满足你的要求把?
补充:Java ,  Java SE
CopyRight © 2022 站长资源库 编程知识问答 zzzyk.com All Rights Reserved
部分文章来自网络,