要采集 哪位老大帮看看
要采集 哪位老大帮看看http://news.51yala.com/list/list_151_1.html
这个网页的 :
列表开始代码:
列表结束代码:
链接开始代码:
链接结束代码:
--------------------编程问答-------------------- 你要采集什么呢? --------------------编程问答-------------------- 我要采集这些信息呀 哪位老大直接给出结果 万分感谢
·故宫文物明年亮相法国 珍贵文物展出12-09
·中国紫禁城皇家服饰 走进伦敦博物馆12-08
·因物价上涨 2011年酒店价格预计上涨12-06
·大学生被易做图旅游 不去影响拿毕业证12-06
·中国国航企业 获西班牙旅游业最高奖12-05
--------------------编程问答-------------------- 结果如下:
·故宫文物明年亮相法国 珍贵文物展出12-09
·中国紫禁城皇家服饰 走进伦敦博物馆12-08
·因物价上涨 2011年酒店价格预计上涨12-06
·大学生被易做图旅游 不去影响拿毕业证12-06
·中国国航企业 获西班牙旅游业最高奖12-05
不用谢。
分析页面,正则匹配;采集器,自己想规则。 --------------------编程问答-------------------- mshtml 这个用没得。
里面的ihtmldocument3 这个类可以达到你的要求 --------------------编程问答-------------------- 各位老大 我是不会 所以那位老大直接给出结果谢
列表开始代码:
列表结束代码:
链接开始代码:
链接结束代码: --------------------编程问答-------------------- 我介绍的那个东西,你引用下,把ihtmldocument3 这个对象打出来,里面有很多方法。直接找html控件的。你看下就知道怎么做了。 --------------------编程问答-------------------- 应该早就有专门采集软件了吧~楼主找找~ --------------------编程问答-------------------- 直接要代码是可耻的,通常也没人有那闲工夫...自己做吧,遇到具体问题再来问... --------------------编程问答-------------------- ihtmldocument3 这个是什么东西 怎么用呀 没听说过 呵呵 我是菜鸟 --------------------编程问答-------------------- --------------------编程问答-------------------- webclient,httpwebrequest抓取,根据规则正则获取
--------------------编程问答-------------------- WebRequest 获取网站内容。。
将获取下来的内容转换为IHTMLDocument3类型。
通过IHTMLElementCollection找到内容易做图定的标签。比如:DIV、span
定义一个IHTMLElement对象获取此标签的属性。
这样你就可以找到你所需要的东西了。
比如。你要采集的内容在一个Div id=div1 中。
你就可以找到这个标签。用他的innerText这个属性。获取他的文本内容了。
希望对您有帮助!!
补充:.NET技术 , ASP.NET