当前位置:编程学习 > JAVA >>

【求助】修改NutchAnalyzer,调用其他中文分词器

开发环境: Ubuntu Eclipse 

想要开发基于nutch1.2的搜索引擎, 但是不想用nutch自带的分词器,使用已经编写完的用python编写的中文分词器。

已经在eclipse的Java代码中调用成功用Python编写的中文分词器,也就是说,实行编写的java代码可以用python编写的中文分词器进行分词。 (这里把python编写的中文分词器弄成 .sh可执行文件, 在java中调用.sh文件的)

在这种情况下,怎样修改nutch的源代码,使其建立索引的时候不使用nutch自带的分词器,而使用这个编写好的分词器呢?

哪位高手帮帮小妹吧。。。谢谢各位了~~~ nutch中文分词 分词 搜索引擎 分词器 java --------------------编程问答-------------------- 高手 帮顶了    
补充:Java ,  Java相关
CopyRight © 2012 站长网 编程知识问答 www.zzzyk.com All Rights Reserved
部份技术文章来自网络,