跪求:抓取新浪新闻评论数
最近在开发一个新浪新闻报道的内容抓取软件(用java写的),像标题、时间、正文,来源等,通过正则表达式可以精确匹配。然而,里边涉及的评论数,由于是javascript调用,无法获取,详见源码:function cmnt_callback_2010() {
try {
var count = this.get_count();
if (count > 0) {
var show_top = document.getElementById("comment_t_show_top");
if (show_top) {
show_top.getElementsByTagName("a")[0].innerHTML = "<span class='pinglun'>已有<span class='f_c00'>" + count + "</span>条评论</span>";
}
}
}catch(e){}
} [取自http://news.sina.com.cn/c/2012-03-22/031024153945.shtml]
我现在想通过java代码获取变量count运行后的结果
--------------------编程问答-------------------- 同求 --------------------编程问答-------------------- http://comment5.news.sina.com.cn/page/info?format=js&channel=yl&newsid=1-1-3805116&group=0&compress=1&page=1&page_size=100&list=hot&mid=&jsvar=requestId_26686214
页面保存下来分析下。 --------------------编程问答-------------------- 是这个地址:
http://comment5.news.sina.com.cn/page/info?format=js&channel=yl&newsid=28-3-3801394&group=0&compress=1&page=1&page_size=100&list=hot&mid=&jsvar=requestId_26686214
newsid 娱乐频道是 “28-3-” 加上 新闻id 截掉前4位
补充:Java , Java相关