抓取网页遇见奇怪的乱码问题,查过很多资料都没有答案
--------------------编程问答-------------------- 你可以查看下content-encoding 如果是gzip 说明 返回的内容是压缩过的 --------------------编程问答-------------------- PHP的频繁抓取也碰到过这种情况,不知道为什么。 --------------------编程问答-------------------- 下载此文件:http://pan.baidu.com/s/1chrQ6import后:
--------------------编程问答-------------------- 写错了,第10行没有。
String reqUrl = "http://www.....";// 请求的网页网址(省略)
URL url = new URL(reqUrl);
HttpURLConnection url_conn = (HttpURLConnection)url.openConnection();
url_conn.setRequestMethod("GET");
url_conn.setConnectTimeout(HttpRequestProxy.connectTimeOut);//设置连接超时
url_conn.setReadTimeout(HttpRequestProxy.readTimeOut);//设置读取超时
System.out.println(FileGetContents.fromStream(url_conn.getInputStream(), "UTF-8"));
in.close();
补充:Java , Java相关