当前位置:编程学习 > JAVA >>

跪求:抓取新浪新闻评论数

最近在开发一个新浪新闻报道的内容抓取软件(用java写的),像标题、时间、正文,来源等,通过正则表达式可以精确匹配。然而,里边涉及的评论数,由于是javascript调用,无法获取,详见源码:
  function cmnt_callback_2010() {
try {
var count = this.get_count();
if (count > 0) {
var show_top = document.getElementById("comment_t_show_top");
if (show_top) {
show_top.getElementsByTagName("a")[0].innerHTML = "<span class='pinglun'>已有<span class='f_c00'>" + count + "</span>条评论</span>";
}
}
}catch(e){}
} [取自http://news.sina.com.cn/c/2012-03-22/031024153945.shtml]

我现在想通过java代码获取变量count运行后的结果

--------------------编程问答-------------------- 同求 --------------------编程问答-------------------- http://comment5.news.sina.com.cn/page/info?format=js&channel=yl&newsid=1-1-3805116&group=0&compress=1&page=1&page_size=100&list=hot&mid=&jsvar=requestId_26686214

页面保存下来分析下。 --------------------编程问答-------------------- 是这个地址:
http://comment5.news.sina.com.cn/page/info?format=js&channel=yl&newsid=28-3-3801394&group=0&compress=1&page=1&page_size=100&list=hot&mid=&jsvar=requestId_26686214

newsid 娱乐频道是 “28-3-”  加上 新闻id  截掉前4位
补充:Java ,  Java相关
CopyRight © 2012 站长网 编程知识问答 www.zzzyk.com All Rights Reserved
部份技术文章来自网络,