当前位置:编程学习 > C#/ASP.NET >>

关于asp.net读取word文档内容是否雷同

近来要做个判断word里的内容是否雷同的功能,例如,有1个word文档即word1,然后还有另外3个或更多word内容,用word1和其他3个里的内容进行比照。

其中,word1里的内容按一句话进行匹配,一句话要包含16个字符以上。例如word1里有这样一句:我是学生你是老师他是领导俺们是人类。

如果其他3个word里出现了这句话,就算是雷同的!每句话都要去匹配!


如果做过类似的功能,请与我联系QQ:1104400183 --------------------编程问答-------------------- 相似度统计分析算法
LD算法
http://blog.csdn.net/lkf0217/archive/2009/08/20/4466952.aspx --------------------编程问答-------------------- 最后能有具体的方法?? --------------------编程问答-------------------- --------------------编程问答-------------------- 相似度统计分析算法
LD算法
http://blog.csdn.net/lkf0217/archive/2009/08/20/4466952.aspx
这个不错.. --------------------编程问答-------------------- 关键是怎么读取word里的内容,然后分别取句子的内容呢? --------------------编程问答-------------------- 感觉像全文检索啊~~
可以找下这方面资料 --------------------编程问答-------------------- 把几个WORD 都取出来 然后判断内容相似度也可以 直接判断也可以

内容相似度算法

--------------------编程问答-------------------- 用 lucene.net 实现全文检索也行
补充:.NET技术 ,  ASP.NET
CopyRight © 2012 站长网 编程知识问答 www.zzzyk.com All Rights Reserved
部份技术文章来自网络,