VB采集网页数据,求助!!!
想用VB采集一下代码的房源信息(区域,地址,面积,楼层,价格,联系人,联系电话等等)内容!在此谢谢了!小弟分数不多,只有那么多了,请多理解,辛苦了!
<tr bgcolor="#FFFFFF"><td height="30" colspan="6" align="center">详细信息</td></tr>
<tr bgcolor="#FFFFFF">
<td width="57" height="22">城 市</td>
<td width="143">南宁市</td>
<td width="58">区 县</td>
<td width="142">江南区</td>
<td width="62">房源编号 </td>
<td width="99">82011234607</td></tr>
<tr bgcolor="#FFFFFF">
<td height="22">地 址 </td>
<td colspan="5">白沙大道龙光·普罗旺斯</td></tr>
<tr bgcolor="#FFFFFF">
<td height="22">户 型 </td>
<td>三房二厅</td>
<td>建筑面积</td>
<td>123平方米 </td>
<td>使用面积</td>
<td>0平方米</td></tr>
<tr bgcolor="#FFFFFF">
<td height="22">楼 层 </td>
<td>第5层 </td>
<td>楼层总数 </td>
<td>共17层 </td>
<td>产权性质 </td>
<td></td></tr>
<tr bgcolor="#FFFFFF">
<td height="22">
总 价</td>
<td>
75万元
</td>
<td>
单 价</td>
<td>0
元/平米 </td>
<td>竣工日期 </td>
<td width="99"></td></tr>
<tr bgcolor="#FFFFFF">
<td height="22">装修情况</td>
<td>毛坯</td>
<td>查看次数</td>
<td></td>
<td>更新日期</td>
<td>2011-02-12</td>
</tr>
<tr bgcolor="#FFFFFF">
<td height="22">备 注 </td>
<td colspan="5"> 带入户花园,通气明亮<br />
</td>
</tr>
<tr bgcolor="#FFFFFF">
<td height="22">联系人</td>
<td>
</td>
<td align="center">联系电话</td>
<td colspan="3">
13878177335
</td>
</tr>
帮顶, 看到熟悉的信息 批量采集,有高手帮忙吗? 分析下源码,先用">城 市</td>"分出数组,再根据各个关键词取得各个值
朋友,可以提供一下源代码吗?小弟,刚接触VB~辛苦了。 似乎用正则好。不过我不会,这里有正则大师啊……
'This code was generated by "RegTestTool v1.1.30", please call the sub TestReg.
Private Sub TestReg()
Dim strData As String
Dim reg As Object
strData = "<tr bgcolor=""#FFFFFF""><td height=""30"" colspan=""6"" align=""center"">详细信息</td></tr>" & vbCrLf & _
"<tr bgcolor=""#FFFFFF"">" & vbCrLf & _
"<td width=""57"" height=""22"">城 市</td>" & vbCrLf & _
"<td width=""143"">南宁市</td>" & vbCrLf & _
"<td width=""58"">区 县</td>" & vbCrLf & _
"<td width=""142"">江南区</td>" & vbCrLf & _
"<td width=""62"">房源编号 </td>" & vbCrLf & _
"<td width=""99"">82011234607</td></tr>" & vbCrLf & _
"<tr bgcolor=""#FFFFFF"">" & vbCrLf & _
"<td height=""22"">地 址 </td>" & vbCrLf & _
"<td colspan=""5"">白沙大道龙光·普罗旺斯</td></tr>" & vbCrLf & _
"<tr bgcolor=""#FFFFFF"">" & vbCrLf & _
"<td height=""22"">户 型 </td>" & vbCrLf & _
"<td>三房二厅</td>" & vbCrLf & _
"<td>建筑面积</td>" & vbCrLf & _
"<td>123平方米 </td>" & vbCrLf & _
"<td>使用面积</td>" & vbCrLf & _
"<td>0平方米</td></tr>" & vbCrLf & _
"<tr bgcolor=""#FFFFFF"">" & vbCrLf & _
"<td height=""22"">楼 层 </td>"
Set reg = CreateObject("vbscript.regExp")
reg.Global = True
reg.IgnoreCase = True
reg.MultiLine = True
reg.Pattern = "<.*?>"
Debug.Print reg.Replace(strData, "")
End Sub
'This code was generated by "RegTestTool v1.1.30", please call the sub TestReg.
Private Sub TestReg()
Dim strData As String
Dim reg As Object
strData = "<tr bgcolor=""#FFFFFF""><td height=""30"" colspan=""6"" align=""center"">详细信息</td></tr>" & vbCrLf & _
"<tr bgcolor=""#FFFFFF"">" & vbCrLf & _
"<td width=""57"" height=""22"">城 市</td>" & vbCrLf & _
"<td width=""143"">南宁市</td>" & vbCrLf & _
"<td width=""58"">区 县</td>" & vbCrLf & _
"<td width=""142"">江南区</td>" & vbCrLf & _
"<td width=""62"">房源编号 </td>" & vbCrLf & _
"<td width=""99"">82011234607</td></tr>" & vbCrLf & _
"<tr bgcolor=""#FFFFFF"">" & vbCrLf & _
"<td height=""22"">地 址 </td>" & vbCrLf & _
"<td colspan=""5"">白沙大道龙光·普罗旺斯</td></tr>" & vbCrLf & _
"<tr bgcolor=""#FFFFFF"">" & vbCrLf & _
"<td height=""22"">户 型 </td>" & vbCrLf & _
"<td>三房二厅</td>" & vbCrLf & _
"<td>建筑面积</td>" & vbCrLf & _
"<td>123平方米 </td>" & vbCrLf & _
"<td>使用面积</td>" & vbCrLf & _
"<td>0平方米</td></tr>" & vbCrLf & _
"<tr bgcolor=""#FFFFFF"">" & vbCrLf & _
"<td height=""22"">楼 层 </td>"
Set reg = CreateObject("vbscript.regExp")
reg.Global = True
reg.IgnoreCase = True
reg.MultiLine = True
reg.Pattern = "(?:<.*?>| )"'修改了下表达式
Debug.Print reg.Replace(strData, "")
End Sub
'This code was generated by "RegTestTool v1.1.30", please call the sub TestReg.正则大师来了……楼主有福 不敢当,那个兔子才是 视乎还不行哦,,,我要获取的地址是:http://08fang.com/show.aspx?t=d&zid=112054&typeto=Sale
Private Sub TestReg()
Dim strData As String
Dim reg As Object
strData = "<tr bgcolor=""#FFFFFF""><td height=""30"" colspan=""6"" align=""center"">详细信息</td></tr>" & vbCrLf & _
"<tr bgcolor=""#FFFFFF"">" & vbCrLf & _
"<td width=""57"" height=""22"">城 市</td>" & vbCrLf & _
"<td width=""143"">南宁市</td>" & vbCrLf & _
"<td width=""58"">区 县</td>" & vbCrLf & _
"<td width=""142"">江南区</td>" & vbCrLf & _
"<td width=""62"">房源编号 </td>" & vbCrLf & _
"<td width=""99"">82011234607</td></tr>" & vbCrLf & _
"<tr bgcolor=""#FFFFFF"">" & vbCrLf & _
"<td height=""22"">地 址 </td>" & vbCrLf & _
"<td colspan=""5"">白沙大道龙光·普罗旺斯</td></tr>" & vbCrLf & _
"<tr bgcolor=""#FFFFFF"">" & vbCrLf & _
"<td height=""22"">户 型 </td>" & vbCrLf & _
"<td>三房二厅</td>" & vbCrLf & _
"<td>建筑面积</td>" & vbCrLf & _
"<td>123平方米 </td>" & vbCrLf & _
"<td>使用面积</td>" & vbCrLf & _
"<td>0平方米</td></tr>" & vbCrLf & _
"<tr bgcolor=""#FFFFFF"">" & vbCrLf & _
"<td height=""22"">楼 层 </td>"
Set reg = CreateObject("vbscript.regExp")
reg.Global = True
reg.IgnoreCase = True
reg.MultiLine = True
reg.Pattern = "(?:<.*?>| )"'修改了下表达式
Debug.Print reg.Replace(strData, "")
End Sub
继续求助。。。辛苦了,兔子,但问题还没解决。 上不了外网,只能试试:
'This code was generated by "RegTestTool v1.1.30", please call the sub TestReg.还是不行哦 lz 去下载个火车头采集 不用谢得麻烦用现有的就好 出钱找人做算了,愿意的话米我 打开网址看了下,太多了,估计没人愿意搞的。这里是学习交流的地方,建议不要当做免费劳动力市场。
Private Sub TestReg()
Dim strData As String
Dim reg As Object
strData = getHtmlStr("http://08fang.com/show.aspx?t=d&zid=112054&typeto=Sale")
Set reg = CreateObject("vbscript.regExp")
reg.Global = True
reg.IgnoreCase = True
reg.MultiLine = True
reg.Pattern = "(?:<.*?>| )"
Debug.Print reg.Replace(strData, "")
End Sub
Private Function getHtmlStr(strUrl As String) As String
Dim XmlHttp As Object
Set XmlHttp = CreateObject("Microsoft.XMLHTTP")
XmlHttp.Open "GET", strUrl, False
XmlHttp.send
getHtmlStr = StrConv(XmlHttp.ResponseBody, vbUnicode)
Set XmlHttp = Nothing
End Function
补充:VB , 网络编程