截取内容时碰到图片怎么办?
一个表里面存放了一篇文章,有图片,链接等html代码,我要在文章列表页显示大概100字左右的简介,但是会出现把图片和链接截取断了的情况,请问如何实现这样的效果:如果是文字,则到100字时截取,如果是图片或者链接 则截取到图片和链接的结束符。 --------------------编程问答-------------------- 正则过滤掉img src --------------------编程问答-------------------- 先清除这些标记
public static string RemoveHtml(this string input)
{
return Regex.Replace(input, "<[^>]*>|</[^>]*>", string.Empty, RegexOptions.IgnoreCase);
}
public static string RemoveHtml(this string input, string mark)
{
return Regex.Replace(input, "<" + mark + "[^>]*>|</[^>]*>", string.Empty, RegexOptions.IgnoreCase);
} --------------------编程问答-------------------- 建议:
不要想着截后还保留图片和链接,应该在截前就把html标签全抛弃再截取 --------------------编程问答-------------------- 别想着全自动分页啦。
如果是截取简介的话,何必在乎图片?把文章内容去掉html代码以后根据字数来取简介就得了。
你见过哪个网站的简介保留有正文的图片的?
#region 去除HTML标记--------------------编程问答-------------------- 先过滤掉HTML代码。。 --------------------编程问答-------------------- winner2050 你看看新浪博客 人人日志 都是可以在简介里面看到图片的,如果只是截取文字,那当然好办,就是想问,如何保留html代码? --------------------编程问答--------------------
/// <summary>
/// 去除HTML标记
/// </summary>
/// <param name="Htmlstring">包括HTML的源码 </param>
/// <returns>已经去除后的文字</returns>
public static string NoHTML(string Htmlstring)
{
if (string.IsNullOrEmpty(Htmlstring) == true)
{
return string.Empty;
}
Htmlstring = Regex.Replace(Htmlstring, @"<script[^>]*?>.*?</script>", "", RegexOptions.IgnoreCase);
Htmlstring = Regex.Replace(Htmlstring, @"<style[^>]*?>.*?</style>", "", RegexOptions.IgnoreCase);
Htmlstring = Regex.Replace(Htmlstring, @"-->", "", RegexOptions.IgnoreCase);
Htmlstring = Regex.Replace(Htmlstring, @"<!--.*", "", RegexOptions.IgnoreCase);
Htmlstring = Regex.Replace(Htmlstring, "<[^>]*>", "", RegexOptions.Compiled);
Htmlstring = Regex.Replace(Htmlstring, @"([\r\n])[\s]+", " ", RegexOptions.Compiled);
return Htmlstring.Replace(" ", " ");
}
#endregion
是呀.我也想知道! --------------------编程问答-------------------- 顶上去,谁能提供一下解决方法,要保留基本html代码的
补充:.NET技术 , ASP.NET