当前位置:编程学习 > JAVA >>

httpClient抓取网页并存储mht格式的文件

求高手援助

    我已经通过httpClient抓取百度网页的html标签,现在将存储为mht格式 按以下方法 。存储htm格式文件没问题,但是存储mht就不行,该如何解决

江湖救急啊。
       //构造HttpClient的实例 
      HttpClient client = new HttpClient();     
            // 创建GET方法的实例 
             GetMethod getMethod  =   new  GetMethod(" http://www.baidu.com ");
             
            // 使用系统提供 的默认的恢复策略
             getMethod.getParams().setParameter(HttpMethodParams.RETRY_HANDLER,new  DefaultHttpMethodRetryHandler());
                                                     
            try  {
              // 执行getMethod 
              int  statusCode  =  client.executeMethod(getMethod);
              if  (statusCode  !=  HttpStatus.SC_OK) {
                  System.err.println( " Method failed:  " 
                                           +  getMethod.getStatusLine());
             }
               // 读取内容 
               byte [] responseBody  =  getMethod.getResponseBody();
               // 处理内容  打印html标签
               //System.out.println( new  String(responseBody));
               
               //将页面信息输出htm文件
//               FileOutputStream fos=new FileOutputStream("c:/Users/wenjiao/Desktop/1.htm");  
//               fos.write(responseBody);
//               fos.flush();
--------------------编程问答-------------------- 利用这个转换器进行MHT转换
MHTBuilder.jar
MHTBuilder builder = new MHTBuilder("","");
builder.compile();
补充:Java ,  Web 开发
CopyRight © 2022 站长资源库 编程知识问答 zzzyk.com All Rights Reserved
部分文章来自网络,