搜索引擎错别字自动纠错如何实现
如题;功能想要实现baidu.com一样。
比如输入一个词"互连网"
那么百度就会出现一个"您要找的是不是: 互联网 "
希望各位高手发表一上,如何实现这种功能的,有.net的代码提供更好,找了好几天,都没有找到什么头绪。好烦。
等待高手求命。@_@! --------------------编程问答-------------------- 你怎么判断他是错别字呢??这个问题很复杂吧,等待回答 --------------------编程问答-------------------- 除非你自己弄一个字典了,不符合字典的都为错误。
然后还得判断拼音吧。
我不知道,请别人回答 --------------------编程问答-------------------- 网上找到这个http://topic.csdn.net/u/20090328/17/11C40301-1D2C-40BA-BC8C-50B493F63AB1.html
感觉上思路是可行的。不过做起来,就烦了。
一、中文的题量要很大,而且还有一个英文的。难道要每一个字每一个字来查吗? --------------------编程问答-------------------- 人都去那里了。没人回答的。 --------------------编程问答-------------------- 没有词库的话,就先让引擎学习词库。比如搜索“互联网”的人数超过一定数量,就把该词记录在词库里,并取出拼音"hulianwang”,然后每次用户提交新搜索关键词时,如果该搜索结果数量过低,可以认定其输入有误,然后将提交的关键字取拼音,到数据库里去对比,除了查找相同拼音的词,还可以对比相似度(比如模糊音),然后取出可能的候选词。 --------------------编程问答-------------------- 有没有具体的实例提供参考呀?说了老半天都不知道怎么样实现 --------------------编程问答-------------------- 不做这方面的。以上都是纸上谈兵。觉得有启发您就赏点分。 --------------------编程问答-------------------- @_@! --------------------编程问答-------------------- 苍天呀。。大地呀。。
求命呀。。
高手都去那里啦。 --------------------编程问答-------------------- 这些东西, 如果你算法水平不够的话, 给你代码, 甚至讲给你听, 你也看不懂听不懂.
其实就两项技术:
1. 分词.
2. 模糊匹配.
--------------------编程问答-------------------- 将用户输入的字符串进行分词.
然后将单词与数据库中现有常见关键字进行模糊匹配, 挑选匹配度最高的一个或几个建议给用户.
补充:.NET技术 , C#