有关html信息抽取的问题
需要提取的html类似以下情况:...(其它内容)....
<b>target</b>
<tr>
annotations1<tr>
annotations2<tr>
....<tr>
...(其它内容)....
需要的东西包括target以及后面的annotations。不知道有什么方法可以把这些信息提取出来,希望有做过的前辈提供下帮助。
感谢ing……
html 信息抽取 --------------------编程问答-------------------- Java网页爬虫趴取到页面源代码之后 对页面源码进行正则提取 这是思路 我可懒得写代码 不过你可以等大牛来给你写个正则表达式
我不太会写 就不献丑了 --------------------编程问答-------------------- @hqshaozhu ,正则表达式确实可以考虑下。多谢
补充:Java , Web 开发