当前位置:编程学习 > VB >>

VB采集网页数据,求助!!!

想用VB采集一下代码的房源信息(区域,地址,面积,楼层,价格,联系人,联系电话等等)内容!在此谢谢了!
小弟分数不多,只有那么多了,请多理解,辛苦了!


<tr bgcolor="#FFFFFF"><td height="30" colspan="6" align="center">详细信息</td></tr>
<tr bgcolor="#FFFFFF">
<td width="57" height="22">城  市</td>
<td width="143">南宁市</td>
<td width="58">区  县</td>
<td width="142">江南区</td>
<td width="62">房源编号 </td>
<td width="99">82011234607</td></tr>
<tr bgcolor="#FFFFFF">
<td height="22">地    址 </td>
<td colspan="5">白沙大道龙光·普罗旺斯</td></tr>
<tr bgcolor="#FFFFFF">
<td height="22">户    型 </td>
<td>三房二厅</td>
<td>建筑面积</td>
<td>123平方米 </td>
<td>使用面积</td>
<td>0平方米</td></tr>
<tr bgcolor="#FFFFFF">
<td height="22">楼    层 </td>
<td>第5层 </td>
<td>楼层总数 </td>
<td>共17层 </td>
<td>产权性质 </td>
<td></td></tr>
<tr bgcolor="#FFFFFF">
<td height="22">
总    价</td>
<td>
75万元
</td>
<td>
单    价</td>
<td>0
元/平米 </td>
<td>竣工日期 </td>
<td width="99"></td></tr>
<tr bgcolor="#FFFFFF">
<td height="22">装修情况</td>
<td>毛坯</td>
<td>查看次数</td>
<td></td>
<td>更新日期</td>
<td>2011-02-12</td>
</tr>
<tr bgcolor="#FFFFFF">
<td height="22">备    注 </td>
<td colspan="5"> 带入户花园,通气明亮<br />

</td>
</tr>
<tr bgcolor="#FFFFFF">
<td height="22">联系人</td>
<td>
    
</td>
<td align="center">联系电话</td>
<td colspan="3">
    13878177335
</td>
</tr>
帮顶, 看到熟悉的信息 批量采集,有高手帮忙吗? 分析下源码,先用">城  市</td>"分出数组,再根据各个关键词取得各个值
引用 3 楼 yiguangqiang88 的回复:
分析下源码,先用">城&nbsp;&nbsp;市</td>"分出数组,再根据各个关键词取得各个值


朋友,可以提供一下源代码吗?小弟,刚接触VB~辛苦了。 似乎用正则好。不过我不会,这里有正则大师啊……
'This code was generated by "RegTestTool v1.1.30", please call the sub TestReg.
Private Sub TestReg()
    Dim strData As String
    Dim reg As Object

    strData = "<tr bgcolor=""#FFFFFF""><td height=""30"" colspan=""6"" align=""center"">详细信息</td></tr>"  &  vbCrLf  & _
              "<tr bgcolor=""#FFFFFF"">"  &  vbCrLf  & _
              "<td width=""57"" height=""22"">城  市</td>"  &  vbCrLf  & _
              "<td width=""143"">南宁市</td>"  &  vbCrLf  & _
              "<td width=""58"">区  县</td>"  &  vbCrLf  & _
              "<td width=""142"">江南区</td>"  &  vbCrLf  & _
              "<td width=""62"">房源编号 </td>"  &  vbCrLf  & _
              "<td width=""99"">82011234607</td></tr>"  &  vbCrLf  & _
              "<tr bgcolor=""#FFFFFF"">"  &  vbCrLf  & _
              "<td height=""22"">地 址 </td>"  &  vbCrLf  & _
              "<td colspan=""5"">白沙大道龙光·普罗旺斯</td></tr>"  &  vbCrLf  & _
              "<tr bgcolor=""#FFFFFF"">"  &  vbCrLf  & _
              "<td height=""22"">户 型 </td>"  &  vbCrLf  & _
              "<td>三房二厅</td>"  &  vbCrLf  & _
              "<td>建筑面积</td>"  &  vbCrLf  & _
              "<td>123平方米 </td>"  &  vbCrLf  & _
              "<td>使用面积</td>"  &  vbCrLf  & _
              "<td>0平方米</td></tr>"  &  vbCrLf  & _
              "<tr bgcolor=""#FFFFFF"">"  &  vbCrLf  & _
              "<td height=""22"">楼 层 </td>"

    Set reg = CreateObject("vbscript.regExp")
    reg.Global = True
    reg.IgnoreCase = True
    reg.MultiLine = True
    reg.Pattern = "<.*?>"
    Debug.Print reg.Replace(strData, "")
End Sub
'This code was generated by "RegTestTool v1.1.30", please call the sub TestReg.
Private Sub TestReg()
    Dim strData As String
    Dim reg As Object

    strData = "<tr bgcolor=""#FFFFFF""><td height=""30"" colspan=""6"" align=""center"">详细信息</td></tr>"  &  vbCrLf  & _
              "<tr bgcolor=""#FFFFFF"">"  &  vbCrLf  & _
              "<td width=""57"" height=""22"">城  市</td>"  &  vbCrLf  & _
              "<td width=""143"">南宁市</td>"  &  vbCrLf  & _
              "<td width=""58"">区  县</td>"  &  vbCrLf  & _
              "<td width=""142"">江南区</td>"  &  vbCrLf  & _
              "<td width=""62"">房源编号 </td>"  &  vbCrLf  & _
              "<td width=""99"">82011234607</td></tr>"  &  vbCrLf  & _
              "<tr bgcolor=""#FFFFFF"">"  &  vbCrLf  & _
              "<td height=""22"">地 址 </td>"  &  vbCrLf  & _
              "<td colspan=""5"">白沙大道龙光·普罗旺斯</td></tr>"  &  vbCrLf  & _
              "<tr bgcolor=""#FFFFFF"">"  &  vbCrLf  & _
              "<td height=""22"">户 型 </td>"  &  vbCrLf  & _
              "<td>三房二厅</td>"  &  vbCrLf  & _
              "<td>建筑面积</td>"  &  vbCrLf  & _
              "<td>123平方米 </td>"  &  vbCrLf  & _
              "<td>使用面积</td>"  &  vbCrLf  & _
              "<td>0平方米</td></tr>"  &  vbCrLf  & _
              "<tr bgcolor=""#FFFFFF"">"  &  vbCrLf  & _
              "<td height=""22"">楼 层 </td>"

    Set reg = CreateObject("vbscript.regExp")
    reg.Global = True
    reg.IgnoreCase = True
    reg.MultiLine = True
    reg.Pattern = "(?:<.*?>| )"'修改了下表达式
    Debug.Print reg.Replace(strData, "")
End Sub
'This code was generated by "RegTestTool v1.1.30", please call the sub TestReg.
Private Sub TestReg()
    Dim strData As String
    Dim reg As Object

    strData = "<tr bgcolor=""#FFFFFF""><td height=""30"" colspan=""6"" align=""center"">详细信息</td></tr>"  &  vbCrLf  & _
              "<tr bgcolor=""#FFFFFF"">"  &  vbCrLf  & _
              "<td width=""57"" height=""22"">城  市</td>"  &  vbCrLf  & _
              "<td width=""143"">南宁市</td>"  &  vbCrLf  & _
              "<td width=""58"">区  县</td>"  &  vbCrLf  & _
              "<td width=""142"">江南区</td>"  &  vbCrLf  & _
              "<td width=""62"">房源编号 </td>"  &  vbCrLf  & _
              "<td width=""99"">82011234607</td></tr>"  &  vbCrLf  & _
              "<tr bgcolor=""#FFFFFF"">"  &  vbCrLf  & _
              "<td height=""22"">地 址 </td>"  &  vbCrLf  & _
              "<td colspan=""5"">白沙大道龙光·普罗旺斯</td></tr>"  &  vbCrLf  & _
              "<tr bgcolor=""#FFFFFF"">"  &  vbCrLf  & _
              "<td height=""22"">户 型 </td>"  &  vbCrLf  & _
              "<td>三房二厅</td>"  &  vbCrLf  & _
              "<td>建筑面积</td>"  &  vbCrLf  & _
              "<td>123平方米 </td>"  &  vbCrLf  & _
              "<td>使用面积</td>"  &  vbCrLf  & _
              "<td>0平方米</td></tr>"  &  vbCrLf  & _
              "<tr bgcolor=""#FFFFFF"">"  &  vbCrLf  & _
              "<td height=""22"">楼 层 </td>"

    Set reg = CreateObject("vbscript.regExp")
    reg.Global = True
    reg.IgnoreCase = True
    reg.MultiLine = True
    reg.Pattern = "(?:<.*?>| )"'修改了下表达式
    Debug.Print reg.Replace(strData, "")
End Sub
正则大师来了……楼主有福
引用 9 楼 yiguangqiang88 的回复:
正则大师来了……楼主有福
不敢当,那个兔子才是 视乎还不行哦,,,我要获取的地址是:http://08fang.com/show.aspx?t=d&zid=112054&typeto=Sale

继续求助。。。辛苦了,兔子,但问题还没解决。 上不了外网,只能试试:
'This code was generated by "RegTestTool v1.1.30", please call the sub TestReg.
Private Sub TestReg()
    Dim strData As String
    Dim reg As Object

    strData = getHtmlStr("http://08fang.com/show.aspx?t=d&zid=112054&typeto=Sale")

    Set reg = CreateObject("vbscript.regExp")
    reg.Global = True
    reg.IgnoreCase = True
    reg.MultiLine = True
    reg.Pattern = "(?:<.*?>| )"
    Debug.Print reg.Replace(strData, "")
End Sub

Private Function getHtmlStr(strUrl As String) As String
    Dim XmlHttp As Object
    Set XmlHttp = CreateObject("Microsoft.XMLHTTP")
    XmlHttp.Open "GET", strUrl, False
    XmlHttp.send
    getHtmlStr = StrConv(XmlHttp.ResponseBody, vbUnicode)
    Set XmlHttp = Nothing
End Function
还是不行哦 lz 去下载个火车头采集  不用谢得麻烦用现有的就好 出钱找人做算了,愿意的话米我 打开网址看了下,太多了,估计没人愿意搞的。这里是学习交流的地方,建议不要当做免费劳动力市场。
补充:VB ,  网络编程
CopyRight © 2012 站长网 编程知识问答 www.zzzyk.com All Rights Reserved
部份技术文章来自网络,