当前位置:编程学习 > JS >>

通过jsoup解析页面html获取优酷页面视频列表

 
通过jsoup解析页面html获取优酷页面视频列表
作者: javaboy2012
Email:yanek@163.com
qq:    1046011462
 
 
代码如下:
 
[java]  
package com.yanek;  
  
import java.io.IOException;  
import java.util.HashMap;  
  
import org.jsoup.Jsoup;  
import org.jsoup.nodes.Document;  
import org.jsoup.nodes.Element;  
import org.jsoup.select.Elements;  
  
public class Tool {  
  
    /** 
     * @param args 
     */  
    public static void main(String[] args) {  
  
          
        String url="http://www.youku.com";  
        //url="http://movie.youku.com";  
          
        HashMap list=new HashMap();  
          
        Document doc;  
        try {  
            doc = Jsoup.connect(url).get();  
              
            Elements links = doc.select("a[href]");  
              
            int s=0;  
              
            for (Element link : links) {  
  
                String v_url=link.attr("abs:href");  
                  
                if  (link.ownText().length()==0)  
                {  
                    continue;  
                }  
  
                if (list.containsKey(v_url))  
                {  
                    continue;  
                }  
                  
                if (v_url.startsWith("http://v.youku.com/v_show"))  
                {  
                    System.out.println(link.attr("abs:href")+"-"+link.ownText());  
                    list.put(v_url, v_url);  
                    s++;  
                }  
  
            }  
            System.out.println("total:"+ s);  
              
              
        } catch (IOException e) {  
            e.printStackTrace();  
        }  
  
          
          
  
    }  
  
}  
 
补充:web前端 , JavaScript ,
CopyRight © 2012 站长网 编程知识问答 www.zzzyk.com All Rights Reserved
部份技术文章来自网络,