寻求互联网数据抓取相关问题
在抓取互联网数据时,在爬虫程序在一定时间后,会出现以下几种情况,而不能爬取或者重新设置等问题,效率比较低:1、直接屏蔽本机的IP,导致无法抓取
2、需要输入认真认证码
3、需要重新输入登录账号(比如爬取自己的同学录和好友时,在一定时间内,会提示重新登录或者输入账号ID)等等
请教各位大侠:
1、以上三个问题分别采用什么方法去解决,需要怎么去做?谢谢!
2、抓取的有的数据是乱码,比如姓名,有的会显示“****”,可以破解码?怎么破解?
3、在登陆有些网站时,有比较复杂的图片和字符的验证码,请问这个验证码怎么破解?
补充:云计算 , 云安全