求帮助,怎样获取别人页面上的数据
要怎样才能获取别人页面上的各项数据,http://www.autohome.com.cn/373/options.html,比如获取这个页面里的发动机型号。。。求大神帮忙 java,网页 --------------------编程问答-------------------- 第一步,通过URL获取html网页内容。第二步,用正则表达式去截取你所需要的内容。
最后,如果你所需要的数据时动态JS生成的,那就木办法了。 --------------------编程问答-------------------- 首先通过http协议获取指定url地址的网页信息,然后解析html内容即可。可以参考http://blog.csdn.net/kingmaxno1/article/details/3273764 --------------------编程问答--------------------
正则表达式,爬取需要的数据。 --------------------编程问答-------------------- 我是来走歪门邪路的,网页字符抓取工具! --------------------编程问答-------------------- 这个能抓取到网页内容,具体需要的信息再解析builder就行了。
HttpURLConnection httpConn = (HttpURLConnection) new URL("http://www.autohome.com.cn/373/options.html").openConnection();
InputStreamReader input = new InputStreamReader(httpConn.getInputStream(), "gb2312");
BufferedReader reader = new BufferedReader(input);
String line = "";
StringBuilder builder = new StringBuilder();
while ((line = reader.readLine()) != null) {
builder.append(line).append("\r\n");
}
System.out.println(builder.toString());
补充:Java , Java相关