当前位置:编程学习 > C#/ASP.NET >>

金油条网页正文提取开发组件1.0发布

金油条网页正文提取开发组件1.0发布 
该组件包括一个开发用的DLL,用.net编写,里面有一个asp.net的DEMO文件(这个是时隔去年DEMO发布后的1年才发布,但是和1年前版本的算法,代码等是一样的,新版本暂不予发布)。 
大家可以在非商业用途使用。 
金油条正文提取器是基于文本距离去噪,精度默认是20,用于网站的新闻,文章等的正文提取,特别结合蜘蛛用处广泛。由于是一个算法demo,所以没有做过大的功能扩展,编码大部分可以自动识别。 

下载:http://u.download.csdn.net/source/1622603 


最新版本和在线演示。详见: 
http://www.shoula.net/ParseContent 


如果要最新版本,或者对这个感兴趣的。 
可以和我联系或者加入 
QQ群:50453294. QQ:6782435 
金油条  --------------------编程问答-------------------- 金油条 

==
这名字好啊 --------------------编程问答-------------------- 实在太感谢了,我这几天为这个要愁死了 --------------------编程问答-------------------- 太好了。终于发布了。 --------------------编程问答-------------------- 不懂 web 的飘过。支持楼主分享精神。
补充:.NET技术 ,  C#
CopyRight © 2012 站长网 编程知识问答 www.zzzyk.com All Rights Reserved
部份技术文章来自网络,