求熟悉正则的朋友写个替换采集文章URL的规则代码
采集内容里经常出现明链:厦门网络http://xm.123.com/hh/1.html公司;类似这样的。 我要把网络****公司中间的URL替换成我表单里的值(www.abc.com);需注意的是:程序以.com/.cn/.net等相关域名后缀来进行判断文章中的明链然后以正则方式匹配该域名后缀的前后URL相关的,完整替换成我的网址;要注意的是有的网址可能没有http 有的可能也没有二级域名或二级目录,要完美匹配过滤掉URL相关的参数;最终可能替换成这样: 厦门网络www.abc.com公司; 求高手朋友写个,不胜感激!
正则
url
域名
网络
采集
--------------------编程问答--------------------
把数据倒出来用sed处理下 再导入
--------------------编程问答--------------------
为什么发到SQL版块?应该发程序版块的吧。给人有广告嫌疑
--------------------编程问答--------------------
补充:.NET技术 , C#