当前位置:编程学习 > JAVA >>

java类似于百度搜索引擎的功能

公司要求做一个模块,抓取到百度上关于IT方面的最新新闻,我感觉有点像百度的搜索引擎,应该从百度服务器上抓取,可是关于这方面真的拾菜鸟一个,希望各位高手帮帮忙,给点意见。 搜索引擎 百度 --------------------编程问答-------------------- 我也想做这个,一起努力。
谢谢 --------------------编程问答-------------------- 所谓抓取,是有请求的时候,现取抓取?

还是随时随地的就抓取着,放在某个地方,等待着用?

后者的话就要引入类似“爬虫”的概念。 --------------------编程问答-------------------- 就是在我做的网站上有一个单独的模块,显示信息,内容的从网站上抓取关于IT方面的消息,类似百度的爬虫功能,根据别人输入的条件,可以爬取到相关的内容,我要做的是固定搜索的条件,只抓取出IT方面的消息,根据时间吧,大概就是这个意思 --------------------编程问答-------------------- 不一定是搜索引擎。
因为你要做的是获取百度上的信息。类似于,你在百度搜索框内输入“IT”,然后百度返回你相关信息。
你要做的就是向百度发送关键字,然后得到搜索结果,并展示出来。中间没有搜索引擎的关键内容。
就像很多网页上都有的选择搜索引擎,并输入关键字。 --------------------编程问答--------------------
引用 4 楼 xiaoxiao081228 的回复:
不一定是搜索引擎。
因为你要做的是获取百度上的信息。类似于,你在百度搜索框内输入“IT”,然后百度返回你相关信息。
你要做的就是向百度发送关键字,然后得到搜索结果,并展示出来。中间没有搜索引擎的关键内容。
就像很多网页上都有的选择搜索引擎,并输入关键字。

我也觉得,感觉楼主只是通过"调用"百度的搜索功能,进行信息的采集 --------------------编程问答--------------------
引用 5 楼 kiritor 的回复:
Quote: 引用 4 楼 xiaoxiao081228 的回复:

不一定是搜索引擎。
因为你要做的是获取百度上的信息。类似于,你在百度搜索框内输入“IT”,然后百度返回你相关信息。
你要做的就是向百度发送关键字,然后得到搜索结果,并展示出来。中间没有搜索引擎的关键内容。
就像很多网页上都有的选择搜索引擎,并输入关键字。

我也觉得,感觉楼主只是通过"调用"百度的搜索功能,进行信息的采集

那敢问,怎么调用,我现在是用jsoup获取到了一张网页上的我要抓取的内容 --------------------编程问答-------------------- 我觉得用javascript比较好,具体怎么做也不知道 --------------------编程问答-------------------- 感谢几位给我出谋划策,我现在已经完成了基本功能,使用的是Jsoup。谢了 --------------------编程问答-------------------- 百度应该提供搜索开发接口,应该js的接口,这样开发应该比较合适,自己做搜索引擎是个浩大的工程,项目成本不允许,当然也可以看看google有没有,但是这种借口功能提供应该比较简单。
如果不能满足的话,java还是有一些开源的搜索引擎项目,但是据我所知对中文语汇分析支持得都不好。

搜索引擎一般包含 爬虫,语汇分析,数据分析,数据索引等内容,如果有兴趣可以研究,但不推荐小项目使用。 --------------------编程问答-------------------- jsoup,httpclient,xpath都可以,都用过,感觉xpath比较好用,通过google浏览器xpath插件可以选区任意页面内容。
补充:Java ,  Java SE
CopyRight © 2012 站长网 编程知识问答 www.zzzyk.com All Rights Reserved
部份技术文章来自网络,