金油条网页正文提取开发组件1.0发布
金油条网页正文提取开发组件1.0发布该组件包括一个开发用的DLL,用.net编写,里面有一个asp.net的DEMO文件(这个是时隔去年DEMO发布后的1年才发布,但是和1年前版本的算法,代码等是一样的,新版本暂不予发布)。
大家可以在非商业用途使用。
金油条正文提取器是基于文本距离去噪,精度默认是20,用于网站的新闻,文章等的正文提取,特别结合蜘蛛用处广泛。由于是一个算法demo,所以没有做过大的功能扩展,编码大部分可以自动识别。
下载:http://u.download.csdn.net/source/1622603
最新版本和在线演示。详见:
http://www.shoula.net/ParseContent
如果要最新版本,或者对这个感兴趣的。
可以和我联系或者加入
QQ群:50453294. QQ:6782435
金油条 --------------------编程问答-------------------- 金油条
==
这名字好啊 --------------------编程问答-------------------- 实在太感谢了,我这几天为这个要愁死了 --------------------编程问答-------------------- 太好了。终于发布了。 --------------------编程问答-------------------- 不懂 web 的飘过。支持楼主分享精神。
补充:.NET技术 , C#