当前位置:编程学习 > C#/ASP.NET >>

要采集 哪位老大帮看看

要采集 哪位老大帮看看 

 http://news.51yala.com/list/list_151_1.html

这个网页的 :
列表开始代码:
列表结束代码:
链接开始代码:
链接结束代码:
--------------------编程问答-------------------- 你要采集什么呢? --------------------编程问答-------------------- 我要采集这些信息呀   哪位老大直接给出结果   万分感谢

·故宫文物明年亮相法国 珍贵文物展出12-09
·中国紫禁城皇家服饰 走进伦敦博物馆12-08
·因物价上涨 2011年酒店价格预计上涨12-06
·大学生被易做图旅游 不去影响拿毕业证12-06
·中国国航企业 获西班牙旅游业最高奖12-05

--------------------编程问答-------------------- 结果如下:

·故宫文物明年亮相法国 珍贵文物展出12-09
·中国紫禁城皇家服饰 走进伦敦博物馆12-08
·因物价上涨 2011年酒店价格预计上涨12-06
·大学生被易做图旅游 不去影响拿毕业证12-06
·中国国航企业 获西班牙旅游业最高奖12-05

不用谢。

分析页面,正则匹配;采集器,自己想规则。 --------------------编程问答-------------------- mshtml 这个用没得。

里面的ihtmldocument3 这个类可以达到你的要求 --------------------编程问答-------------------- 各位老大 我是不会 所以那位老大直接给出结果谢 

列表开始代码:
列表结束代码:
链接开始代码:
链接结束代码: --------------------编程问答-------------------- 我介绍的那个东西,你引用下,把ihtmldocument3 这个对象打出来,里面有很多方法。直接找html控件的。你看下就知道怎么做了。 --------------------编程问答-------------------- 应该早就有专门采集软件了吧~楼主找找~ --------------------编程问答-------------------- 直接要代码是可耻的,通常也没人有那闲工夫...自己做吧,遇到具体问题再来问... --------------------编程问答-------------------- ihtmldocument3  这个是什么东西 怎么用呀 没听说过 呵呵 我是菜鸟 --------------------编程问答-------------------- --------------------编程问答-------------------- webclient,httpwebrequest抓取,根据规则正则获取
--------------------编程问答-------------------- WebRequest 获取网站内容。。

将获取下来的内容转换为IHTMLDocument3类型。

通过IHTMLElementCollection找到内容易做图定的标签。比如:DIV、span

定义一个IHTMLElement对象获取此标签的属性。

这样你就可以找到你所需要的东西了。



比如。你要采集的内容在一个Div id=div1 中。
你就可以找到这个标签。用他的innerText这个属性。获取他的文本内容了。


希望对您有帮助!!
补充:.NET技术 ,  ASP.NET
CopyRight © 2022 站长资源库 编程知识问答 zzzyk.com All Rights Reserved
部分文章来自网络,