当前位置:编程学习 > 网站相关 >>

寻求互联网数据抓取相关问题

在抓取互联网数据时,在爬虫程序在一定时间后,会出现以下几种情况,而不能爬取或者重新设置等问题,效率比较低:
1、直接屏蔽本机的IP,导致无法抓取
2、需要输入认真认证码
3、需要重新输入登录账号(比如爬取自己的同学录和好友时,在一定时间内,会提示重新登录或者输入账号ID)等等

请教各位大侠:
     1、以上三个问题分别采用什么方法去解决,需要怎么去做?谢谢!
     2、抓取的有的数据是乱码,比如姓名,有的会显示“****”,可以破解码?怎么破解?
     3、在登陆有些网站时,有比较复杂的图片和字符的验证码,请问这个验证码怎么破解?
补充:云计算 ,  云安全
CopyRight © 2022 站长资源库 编程知识问答 zzzyk.com All Rights Reserved
部分文章来自网络,