htmlparser解析网页问题
htmlparser解析文件时可以出现但是指定保存的文件里面没有怎么回事啊
第一次接触好多不清楚,大家快来帮帮我 爬虫和搜索 --------------------编程问答-------------------- 没有人回答我的问题吗 --------------------编程问答--------------------
/**
* 根据URL获得所有的html信息
*
* @param url
* @return
*/
public static String getHtmlByUrl(String url) {
String html = null;
HttpClient httpClient = new DefaultHttpClient(); // 创建httpClient对象
HttpGet httpget = new HttpGet(url); // 以get方式请求该URL
try {
HttpResponse responce = httpClient.execute(httpget); // 得到responce对象
int resStatu = responce.getStatusLine().getStatusCode(); // 返回码
if (resStatu == HttpStatus.SC_OK) { // 200正常 其他就不对
HttpEntity entity = responce.getEntity(); // 获得相应实体
String charset = "UTF-8"; //设置编码
if (entity != null) {
html = EntityUtils.toString(entity,charset); // 获得html源代码
}
}
} catch (Exception e) {
System.out.println("访问【" + url + "】出现异常!");
e.printStackTrace();
} finally {
httpClient.getConnectionManager().shutdown();
}
return html;
}
补充:Java , Java EE