当前位置:编程学习 > 网站相关 >>

nutch crawl 问题,贵求高手指点!

Exception in thread "main" org.apache.hadoop.mapred.FileAlreadyExistsException: Output directory L:/crawl/index already exists! 请问这个问题如何解决?我执行这个命令两次,./nutch crawl urls -dir L:/crawl -depth 1 -threads 1 -topN 10。就会报上面的错误,。原因是第一次执行已经生成index目录,难道我每次抓取都要清空crawl 目录吗?求指点。 nutch crawl
补充:云计算 ,  云存储
CopyRight © 2022 站长资源库 编程知识问答 zzzyk.com All Rights Reserved
部分文章来自网络,