当前位置:编程学习 > JAVA >>

有关html信息抽取的问题

需要提取的html类似以下情况:

...(其它内容)....
<b>target</b>
<tr>
annotations1<tr>
annotations2<tr>
....<tr>
...(其它内容)....

需要的东西包括target以及后面的annotations。不知道有什么方法可以把这些信息提取出来,希望有做过的前辈提供下帮助。
感谢ing……


html 信息抽取 --------------------编程问答-------------------- Java网页爬虫趴取到页面源代码之后  对页面源码进行正则提取   这是思路   我可懒得写代码  不过你可以等大牛来给你写个正则表达式
我不太会写 就不献丑了 --------------------编程问答-------------------- @hqshaozhu ,正则表达式确实可以考虑下。多谢
补充:Java ,  Web 开发
CopyRight © 2012 站长网 编程知识问答 www.zzzyk.com All Rights Reserved
部份技术文章来自网络,