用PHPdig打造属于你自己的Google
一、什么是php(做为现在的主流开发语言)dig?
php(做为现在的主流开发语言)dig是国外非常流行的垂直搜索引擎产品(与其说是产品,不如说是一项区别于传统搜索引擎的搜索技术),采用php(做为现在的主流开发语言)语言编写,利用了php(做为现在的主流开发语言)程序运行的高效性,极大地提高了搜索反应速度,它可以像Google或者Baidu以及其它搜索引擎一样搜索互联网,搜索内容除了普通的网页外还包括txt, doc, xls, pdf等各式的文件,具有强大的内容搜索和文件解析功能。php(做为现在的主流开发语言)dig同传统的搜索引擎一样,包含了以下三种最基本的技术:
1.Spider技术
2.网页结构化信息抽取技术或元数据采集技术
3.分词、索引技术
区别于传统搜索引擎,php(做为现在的主流开发语言)dig适用于专业化更强、层次更深的个性化搜索引擎,利用它打造针对某一领域的垂直搜索引擎是最好的选择。
二、如何获得这php(做为现在的主流开发语言)dig?
php(做为现在的主流开发语言)dig是免费产品(需要保留版权),最新版本是 php(做为现在的主流开发语言)dig-1.8.9 为了避免apache(Unix平台最流行的WEB服务器平台)以及MySQL(和PHP搭配之最佳组合)的版本兼容性问题,建议采用较低级的版本,其网站地址是:http://www.php(做为现在的主流开发语言)dig.net ,下载地址是:http://www.php(做为现在的主流开发语言)dig.net/navigation.php(做为现在的主流开发语言)?action=download 说明一下,我试用过php(做为现在的主流开发语言)dig-1.8.9版本,但出现了很多问题,改用php(做为现在的主流开发语言)dig-1.8.8则问题较少。
三、具体步骤
1.获取产品
访问http://www.php(做为现在的主流开发语言)dig.net/navigation.php(做为现在的主流开发语言)?action=download下载php(做为现在的主流开发语言)dig-1.8.8至桌面,解压缩至apache(Unix平台最流行的WEB服务器平台)服务器html目录,一般路径为:D:usrwwwhtml,(如果你没有安装apache(Unix平台最流行的WEB服务器平台)服务器请事先安装,推荐使用Mappm-Server v1.1.9 Final,Mappm-Server 采用傻瓜式安装,一次搞定,方便调试和运行 php(做为现在的主流开发语言)/cgi(现在已经不多人在用了)+MySQL(和PHP搭配之最佳组合) 程序)。
2.运行并配置php(做为现在的主流开发语言)dig数据库
打开浏览器输入http://localhost/php(做为现在的主流开发语言)dig/按回车键,页面列出php(做为现在的主流开发语言)dig的所有文件及包含文件夹,找一找发现没有默认首页文件(default,index),单击search.php(做为现在的主流开发语言)文件出现错误提示:Unable to connect to database : Check the connection script。提示无法完成数据库连接,原来我们还没有完成php(做为现在的主流开发语言)dig的数据库配置。返回进入admin目录找到install.php(做为现在的主流开发语言)文件,单击运行,乍一看,全英文界面(说明一下,php(做为现在的主流开发语言)dig目前所有版本均不支持中文界面),没有关系,如果你有过汉化经验不妨自己动手将其汉化,这里提供一份我自己汉化的cn-language.php(做为现在的主流开发语言)文档的下载(请将其拷贝至locales目录下)。另外你还需修改includes目录下的config.php(做为现在的主流开发语言)文件(语言修改)和style.css文件(字体修改和样式修改)。
进入install.php(做为现在的主流开发语言)后系统要求我们输入php(做为现在的主流开发语言)dig管理用户名和密码,默认情况下均为admin,进入后出现如下界面(汉化后):
补充:Web开发 , php ,