nutch crawl 问题,贵求高手指点!
Exception in thread "main" org.apache.hadoop.mapred.FileAlreadyExistsException: Output directory L:/crawl/index already exists! 请问这个问题如何解决?我执行这个命令两次,./nutch crawl urls -dir L:/crawl -depth 1 -threads 1 -topN 10。就会报上面的错误,。原因是第一次执行已经生成index目录,难道我每次抓取都要清空crawl 目录吗?求指点。 nutch crawl
补充:云计算 , 云存储