简易PHP抓网页
不包括抓图片
<?
$buffer = file("address"); //$address 网页地址
for($i = 0;i < sizeof($buffer);$i++)
{
//去yahoo广告
$buffer[$i] = str_replace(''<!----- ad start ----->'',''<noscrīpt>'' $buffer[$i]);
$buffer[$i] = str_replace(''<!----- ad end ----->'',''</noscrīpt>'' $buffer[$i]);
//最后显示
echo($buffer);
}
?>
str_replace 3个参数 ,第一个是原文件的内容,第二个是替换成的内容.最后一个是写入的地方.
$buffer能取得整个html页面的文本档,成为一个数组,每行一个元素,简单的说就是逐行寻找替换.
替换后输出.
同样的可以把烂掉的无法显示的页面 例如成为 http://localhost/images/a.jpg 这样的替换成对应网址.
替换前查看下原HTML档对比下就行.
补充:Php教程,Php常用代码