当前位置:编程学习 > JAVA >>

正则表达式提取html串的问题

String ddd = "<span dd \\. >rereer </span><div>dfdsd</div></br>ddds</span><tr><tbody>";
patternStrs="<[\\s]*[^img][^br/][^>]*>";
Pattern linkPattern = Pattern
.compile(patternStrs, Pattern.CASE_INSENSITIVE);
Matcher m_linkPattern = linkPattern.matcher(ddd);
ddd =m_linkPattern.replaceAll("");
System.out.println(ddd);


我想让一个html文件只保留图片和<br/>串和纯文本怎么做
上面的代码过滤后怎么<tr><tbody>这两个标识还在,
我想要的结果是rereer dfdsd<br/>ddds要怎么写正则 正则表达式 HTML --------------------编程问答-------------------- </?(?!\b(?:img|br)\b)[a-z][a-z\d]*\b[^>]*>
补充:Java ,  Java EE
CopyRight © 2012 站长网 编程知识问答 www.zzzyk.com All Rights Reserved
部份技术文章来自网络,