【求助】修改NutchAnalyzer,调用其他中文分词器
开发环境: Ubuntu Eclipse想要开发基于nutch1.2的搜索引擎, 但是不想用nutch自带的分词器,使用已经编写完的用python编写的中文分词器。
已经在eclipse的Java代码中调用成功用Python编写的中文分词器,也就是说,实行编写的java代码可以用python编写的中文分词器进行分词。 (这里把python编写的中文分词器弄成 .sh可执行文件, 在java中调用.sh文件的)
在这种情况下,怎样修改nutch的源代码,使其建立索引的时候不使用nutch自带的分词器,而使用这个编写好的分词器呢?
哪位高手帮帮小妹吧。。。谢谢各位了~~~ nutch中文分词 分词 搜索引擎 分词器 java --------------------编程问答-------------------- 高手 帮顶了
补充:Java , Java相关