C#编程，如何需要从网页采集数据？

答案：网页抓取/数据抽取/信息提取软件工具包MetaSeeker很适合做这个工作。MetaSeeker是一个Web页面信息抓取/抽取/提取工具包，能够按照用户的指导，从Web页面上筛选出需要的信息，将噪音信息过滤掉，将抓取/抽取/提取到的内容存储成XML文件，然后可以集成到其它网站上。该工具包有三个工具：1，MetaStudio，用于定制目标网页内容抓取/抽取/提取规则，完全免除编程和调试的麻烦，全图形界面，定制一个新网站的抓取/抽取/提取规则只需要几分钟2，DataScraper，用于连续且高效得从目标网站上抓取/抽取/提取内容，并滤除不需要的内容，存成XML文件3，SliceSearch，将抓取/抽取/提取到的内容存储到搜索引擎中，提供强大的搜索功能和内容管理功能，用于快速部署垂直搜索和商业推荐引擎。MetaSeeker采用专有的方法识别网页的语义结构，最适合提取结构化信息对象，例如，抽取商品和价格做比价服务。当然，提取新闻等大篇幅文字内容也是轻而易举。MetaSeeker工具除了自动识别网页结构产生抽取规则外，还支持两个级别的定制扩展：1，用XPath表达式指定页面元素的位置；2，用XSLT模板定制页面内容的提取范围和规则。使用这些扩展，用户可以任意定义特定的抽取规则，以应对各种复杂的页面结构。MetaSeeker工具包这种基于DOM+XPath+XSLT的数据抽取方案与基于正则表达式的方案相比，更灵活、适应性更强、更容易定制MetaSeeker工具包有两个版本：企业版和在线版，在线版是免费的，功能相同，但是，不能部署自己私有的服务器，使用公共的服务器，实际上更方便，下载地址：

给你介绍个方法

但是具体的我也没尝试过。

你可以通过获取网页的不同节点来获取数据。

然后再将数据保存到你自己定义的变量里面。

至于获取网页数据可以通过象获取XML数据那样获取

具体的需要你自己去试试哈。

上一个：javascript的语法和C#怎么那么像呢?
下一个：有点C语言基础，学好C#要多久？

更多图片编程知识: