关于asp.net读取word文档内容是否雷同
近来要做个判断word里的内容是否雷同的功能,例如,有1个word文档即word1,然后还有另外3个或更多word内容,用word1和其他3个里的内容进行比照。其中,word1里的内容按一句话进行匹配,一句话要包含16个字符以上。例如word1里有这样一句:我是学生你是老师他是领导俺们是人类。
如果其他3个word里出现了这句话,就算是雷同的!每句话都要去匹配!
如果做过类似的功能,请与我联系QQ:1104400183 --------------------编程问答-------------------- 相似度统计分析算法
LD算法
http://blog.csdn.net/lkf0217/archive/2009/08/20/4466952.aspx --------------------编程问答-------------------- 最后能有具体的方法?? --------------------编程问答-------------------- --------------------编程问答-------------------- 相似度统计分析算法
LD算法
http://blog.csdn.net/lkf0217/archive/2009/08/20/4466952.aspx
这个不错.. --------------------编程问答-------------------- 关键是怎么读取word里的内容,然后分别取句子的内容呢? --------------------编程问答-------------------- 感觉像全文检索啊~~
可以找下这方面资料 --------------------编程问答-------------------- 把几个WORD 都取出来 然后判断内容相似度也可以 直接判断也可以
内容相似度算法
--------------------编程问答-------------------- 用 lucene.net 实现全文检索也行
补充:.NET技术 , ASP.NET