当前位置:编程学习 > C#/ASP.NET >>

这样一个正则怎么取?爬虫,抓取程序,急!!!!!!!!!!

<!DOCTYPE html><html><head><meta http-equiv=content-type content="text/html; charset=UTF-8" /><meta http-equiv=X-UA-Compatible content=IE=EmulateIE7 /><title>香山 - Google 地图</title><script type=text/javascript>//<![CDATA[
var w = window.parent;function onLoad(){w.loadVPage({title:"香山 - Google 地图",vartitle:"",url:"/maps?f=q\x26source=s_q\x26hl=zh-CN\x26geocode=\x26q=%E9%A6%99%E5%B1%B1\x26vps=8\x26jsv=156c\x26sll=39.965543,116.503143\x26sspn=0.442063,0.704498\x26ie=UTF8",urlViewport:false,ei:"ULMCStwHhfK5A4Lr2cQO",form:{selected:"q",q:{q:"香山"},l:{q:"香山",near:""},d:{saddr:"",daddr:"",dfaddr:"北京市"},geocode:"",g:{q:"香山"},d_edit:{saddr:"",daddr:""}},query:{type:"l"},viewport:{center:{lat:0,lng:0,alt:{ll:"34545111588400255001",mode:2}},span:{lat:0.44206299999999998,lng:0.70449799999999996},mapType:""},modules:["","truffle","app_infowindow"],overlays:{sxcar:false,markers:[{id:"A",image:"/intl/zh-CN_cn/mapfiles/markerA.png",elms:[4,1,6,2,5],laddr:"北京市海淀区买卖街 (北京香山金源商旅中心酒店)",sxti:"北京香山金源商旅中心酒店",name:"北京香山金源商旅中心酒店",dtlsUrl:"/maps?f=q\x26source=s_q\x26hl=zh-CN\x26geocode=\x26q=%E9%A6%99%E5%B1%B1\x26vps=8\x26jsv=156c\x26sll=39.965543,116.503143\x26sspn=0.442063,0.704498\x26ie=UTF8\x26latlng=0,0,12994289385194773328\x26ei=ULMCStwHhfK5A4Lr2cQO\x26cd=2",addressLines:["北京市海淀区","买卖街"],title:"北京\x3cb\x3e香山\x3c/b\x3e金源商旅中心酒店",reviews:13,photoUrl:"http://base.googlehosted.com/base_media?q=maps:www.5booking.com/pic/200549201742.jpg\x26size=2\x26hl=zh-CN",phototabUrl:"/maps?f=q\x26source=s_q\x26hl=zh-CN\x26geocode=\x26q=%E9%A6%99%E5%B1%B1\x26vps=8\x26jsv=156c\x26sll=39.965543,116.503143\x26sspn=0.442063,0.704498\x26ie=UTF8\x26latlng=0,0,12994289385194773328\x26ei=ULMCStwHhfK5A4Lr2cQO\x26cd=1\x26oi=md_photos\x26sa=X\x26ct=iw_photo\x26cad=5booking.com",cid:"12994289385194773328",infoWindow:{basics:"\x3cdiv transclude=\"iw\"\x3e\x3c/div\x3e",maxUrl:"/maps?f=q\x26source=s_q\x26hl=zh-CN\x26geocode=\x26q=%E9%A6%99%E5%B1%B1\x26vps=8\x26jsv=156c\x26sll=39.965543,116.503143\x26sspn=0.442063,0.704498\x26ie=UTF8\x26latlng=0,0,12994289385194773328\x26ei=ULMCStwHhfK5A4Lr2cQO\x26cd=2\x26iwd=1\x26fb=0",moreInfo:"更多信息"},geocode:"CcMQRuHunLNuFeQ3YgIdex3tBiFQ2ylhWf1UtA",icon_id:"B",sprite:{width:20,height:34,top:34,image:"/intl/zh-CN_cn/mapfiles/red_markers_A_J.png"},cat2:[{name:"住宿服务;宾馆酒店;五星级宾馆",lang:"zh"},{name:"体育休闲服务;运动场馆;健身中心",lang:"zh"},{name:"其他",lang:"zh"},{name:"其他餐饮美食",lang:"zh"},{name:"星级酒店",lang:"zh"}],latlng:{lat:0,lng:0,alt:{ll:"34510131588008159223",mode:2}},phones:[{number:"010-59898888"}],b_s:2,photoType:1},{id:"C",image:"/intl/zh-CN_cn/mapfiles/markerC.png",

取其中的地电话:地址,连接

laddr:"北京市海淀区买卖街 (北京香山金源商旅中心酒店)",sxti:"北京香山金源商旅中心酒店",name:"北京香山金源商旅中心酒店"

photoUrl:"http://base.googlehosted.com/base_media?q=maps:www.5booking.com/pic/200549201742.jpg --------------------编程问答-------------------- 先占个楼看看 --------------------编程问答-------------------- up --------------------编程问答-------------------- 就是找其前后的格式特征,加上其本身的特征就可以了。
但是有时页面的格式稍一变化,就还得重新做。 --------------------编程问答-------------------- 自己的贴子都不能编辑..我晕..

LZ的问题不是太明确..是取出来就行..还是必须得按照你的那个结果那样取..
如果是取出来就行..可以试试这样写..

(?<=\bladdr:)"\w*"\b

我现在用的电脑..没有任何开发环境..还不能下载软件..所以没调试过..
算是提供个思路吧..找关键字"xxxx"后面的又是""以内的字符串 --------------------编程问答--------------------
引用 4 楼 cyougyoku 的回复:
自己的贴子都不能编辑..我晕.. 

LZ的问题不是太明确..是取出来就行..还是必须得按照你的那个结果那样取.. 
如果是取出来就行..可以试试这样写.. 

(? <=\bladdr:)"\w*"\b 

我现在用的电脑..没有任何开发环境..还不能下载软件..所以没调试过.. 
算是提供个思路吧..找关键字"xxxx"后面的又是""以内的字符串


能不能写完整点?就是取出来就行  用正则 --------------------编程问答-------------------- 这个就是取laddr的式子....你把laddr换成你要的那些..应该就可以吧..

我这没啥环境..不能试..你试试看取出来的是什么...

我记得..好象是这么写..就可以取..

laddr:"xxxxxxxxxx",这样的格式中的xxxxxx...了..规定头和双引号
补充:.NET技术 ,  C#
CopyRight © 2012 站长网 编程知识问答 www.zzzyk.com All Rights Reserved
部份技术文章来自网络,