当前位置:编程学习 > JAVA >>

一个mini爬虫的java实现,易做图有易做图

--------------------编程问答-------------------- 很好 学习了 谢谢分享哈 --------------------编程问答-------------------- 盗爬下 --------------------编程问答-------------------- 楼主是好人,一分钟下载71张风易做图PP

/*

Crawl Finish!
====== All the pic address have been writen to the file!
They are total 71 pics need to be download
1 download finished
2 download finished
3 download finished
4 download finished
5 download finished
6 download finished
7 download finished
8 download finished
9 download finished
10 download finished
11 download finished
12 download finished
13 download finished
14 download finished
15 download finished
16 download finished
17 download finished
18 download finished
19 download finished
20 download finished
21 download finished
22 download finished
23 download finished
24 download finished
25 download finished
26 download finished
27 download finished
28 download finished
29 download finished
30 download finished
31 download finished
32 download finished
33 download finished
34 download finished
35 download finished
36 download finished
37 download finished
38 download finished
39 download finished
40 download finished
41 download finished
42 download finished
43 download finished
44 download finished
45 download finished
46 download finished
47 download finished
48 download finished
49 download finished
50 download finished
51 download finished
52 download finished
53 download finished
54 download finished
55 download finished
56 download finished
57 download finished
58 download finished
59 download finished
60 download finished
61 download finished
62 download finished
63 download finished
64 download finished
65 download finished
66 download finished
67 download finished
68 download finished
69 download finished
70 download finished
71 download finished
---------All Download Finished!


*/


--------------------编程问答-------------------- 能下视屏吗?
引用 3 楼 k3108001263 的回复:
楼主是好人,一分钟下载71张风易做图PP

Java code

/*

Crawl Finish!
====== All the pic address have been writen to the file!
They are total 71 pics need to be download
1 download finished
2 download finished
……
--------------------编程问答-------------------- 好啊,顶一下 --------------------编程问答-------------------- 都啥时代了,还htmlparser.jar 换jsoup.jar吧。 --------------------编程问答-------------------- lz很YD --------------------编程问答-------------------- 视频当然可以下了。把URL换成视频的就可以了。 --------------------编程问答-------------------- 帮你顶! --------------------编程问答-------------------- 用的哪个htmlparser.jar版本啊,我下载了,可是对不上号,麻烦给个地址,让我去下载 --------------------编程问答-------------------- very good --------------------编程问答-------------------- 可以,把图片地址改成视频地址就行了,不过我还没下过
引用 4 楼 qqzy168 的回复:
能下视屏吗?引用 3 楼 k3108001263 的回复:
楼主是好人,一分钟下载71张风易做图PP

Java code

/*

Crawl Finish!
====== All the pic address have been writen to the file!
They are total 71 pics need to be download
1 downloa……
--------------------编程问答-------------------- 这里:http://sourceforge.net/projects/htmlparser/files/
引用 10 楼 zhanghua_1199 的回复:
用的哪个htmlparser.jar版本啊,我下载了,可是对不上号,麻烦给个地址,让我去下载
--------------------编程问答-------------------- /71.... --------------------编程问答-------------------- 我是个好易做图,但是不荡。。。。
引用 7 楼 softroad 的回复:
lz很YD
--------------------编程问答-------------------- 尼玛,我只路过~ --------------------编程问答--------------------
引用 13 楼 xxljayabc 的回复:
这里:http://sourceforge.net/projects/htmlparser/files/
引用 10 楼 zhanghua_1199 的回复:

用的哪个htmlparser.jar版本啊,我下载了,可是对不上号,麻烦给个地址,让我去下载



哥们,我打不开呀,不知道为什么,你就再帮帮忙吧,压缩一下发到我邮箱吧,,1215811695@qq.com

非常感谢,,
并且希望爱好编程的人加我为好友,,1215811695 --------------------编程问答--------------------
这种软件网上很多 templo** webzip

不过自己动手也是好的  --------------------编程问答-------------------- 不错,帮顶 --------------------编程问答-------------------- 谢谢,顶顶更健康!!
引用 19 楼 zjp852218431 的回复:
不错,帮顶
--------------------编程问答-------------------- 为什么我输入的网页里的图片都crawl不下来呢,你crawl什么样的网址

给一个让我试试,,,

程序能运行,就是crawl不下来 --------------------编程问答-------------------- 可能crawl过,但是很多百度上的图片crawl不下来,,也有大型网址道页的图片crawl不下来
--------------------编程问答-------------------- 我一直在顶这个贴子啊,,,
有没有httpparser帮助文档,,
官网又打不开。。。


lz帮帮忙了。。。 --------------------编程问答-------------------- zhanghua_1199,你要观察一下你要爬的网站的格式,然后稍稍修改一下代码,其实就是这里

 if(!alreadyCrawledSet.contains(href) && (href.indexOf("www.169pp.com")!=-1) && href.endsWith("htm"))
                        {
                            System.out.println("----find link: "+href);
                            unCrawlQueue.add(href);
                        }

看看你要爬的网站的地址样式
引用 21 楼 zhanghua_1199 的回复:
为什么我输入的网页里的图片都crawl不下来呢,你crawl什么样的网址

给一个让我试试,,,

程序能运行,就是crawl不下来
--------------------编程问答-------------------- 你一直在顶我这个帖子,顶的我差点连菊花都感应到了,谢谢。有关httpparser的资料网上不用翻墙的应该也有吧,多google,少baidu
引用 23 楼 zhanghua_1199 的回复:
我一直在顶这个贴子啊,,,
有没有httpparser帮助文档,,
官网又打不开。。。


lz帮帮忙了。。。
--------------------编程问答-------------------- 强啊 悍啊!!!!!了不起啊 --------------------编程问答-------------------- 楼主,你好!刚刚学爬虫,不是很懂,请问你回答二十四楼的观察网站格式并作修改是什么意思,谢谢! --------------------编程问答-------------------- 好东西!学习了 --------------------编程问答-------------------- 呵呵,还不错。 --------------------编程问答--------------------
补充:Java ,  Java SE
CopyRight © 2022 站长资源库 编程知识问答 zzzyk.com All Rights Reserved
部分文章来自网络,