怎样做搜索引擎?
怎样才能做到类似百度那样的搜索? --------------------编程问答-------------------- 用lucence网上搜下吧
有本书叫lucence in action --------------------编程问答-------------------- 这个问题太大了,可能会做的人也不会在这里说吧 --------------------编程问答-------------------- 搜一下,有一位大哥用 lucence 作了迅龙,有源文件 --------------------编程问答-------------------- 这个问题确实比较大,建议先了解一下搜索引擎的原理,然后再看一些开源的项目,现在比较流行的就是nutch,lucene都是apache下的...
在前人的基础上再去创新,或者如果只是想实现功能的话,那可以直接基于lucene,即可以调用里面的API,进行开发... --------------------编程问答-------------------- 迅龙的源码我也有 --------------------编程问答-------------------- 我也想知道啊。原理都還不了解 --------------------编程问答-------------------- 原理很其实很简单:
抓取网页(用网络易做图)->预处理(主要是进行索引,消重排序等等)->信息查询服务..
但细节就很多了,如何抓取网页,如何索引,如何消重,如何排序等等一系列的问题,每一点都值得研究.... --------------------编程问答-------------------- 谢谢各位大侠了哈
--------------------编程问答-------------------- 最底层的自然语言处理就够头疼了。如果自己从头做起的话。
--------------------编程问答-------------------- 输入网址->下载网页,录入数据库,分析网页链接->得到网址->.....循环
把一个网页的首页当作盘符~~`把上面每一个链接当作文件夹~~"文件夹"里面又有链接~~~
爬虫~~爬吖爬吖爬吖爬~~~最后一个网站的所有网页就都爬进你的数据库了~~
最关键的还是分词,检索,排序,权重..... --------------------编程问答-------------------- 爬呀爬呀爬呀爬呀爬呀爬呀爬呀爬呀~~~~~~
这里有效率的问题。如果没做好,你爬了半天可能什么也没爬到。 --------------------编程问答-------------------- 非常好的东西 一定要做出来一个 --------------------编程问答-------------------- 我这里有好多源码 保证能看懂 http://117.135.140.108:100/index.aspx --------------------编程问答-------------------- 先弄懂网路易做图 --------------------编程问答-------------------- 我想给我的淘宝店在各个网站上做个链接,要怎样做啊!感谢各位高手指点!
补充:.NET技术 , C#