对文章内容进行分页
最近公司要在原来的Web网站发布的内容,也要在Wap上面显示。现有的文章内容是存放在一个字段里面,没有进行分页处理保存。因些在手机显示时,要对文章内容进行截取分页处理显示。
现在问题出来了,文章内容里面包含了很多HTML标签,用SubString进行截取那会把HTML标签也给截断,也在可能会在标签的属性中截开,这样我们得出来的字符串就是错乱的了。 因此在截取时,对HTML标签进行过滤。
自己的表达能力有限,直接上代码。
/// <summary>
/// 得到分页后的数据
/// </summary>
/// <param name="param">文章内容</param>
/// <param name="size">文章字数(不包含HTML)</param>
/// <returns></returns>
public static List<string> SubstringTo(string param, int size)
{
param = NoHTML(param);//过滤一些有Wap上面不能显示的HTML标签,你也不可不过滤
var length = param.ToCharArray().Length;
var being = 0;
var list = new List<string>();
while (true)
{
string str = SubstringToHTML(param, being, size, "", out being);
list.Add(str);
if (length <= being)
{
break;
}
}
return list;
}
/// <summary>
/// 按字节长度截取字符串(支持截取带HTML代码样式的字符串)
/// </summary>
/// <param name="param">将要截取的字符串参数</param>
/// <param name="length">截取的字节长度</param>
/// <param name="end">字符串末尾补上的字符串</param>
/// <returns>返回截取后的字符串</returns>
public static string SubstringToHTML(string param, int being, int length, string end, out int index)
{
string Pattern = null;
MatchCollection m = null;
StringBuilder result = new StringBuilder();
int n = 0;
char temp;
bool isCode = false; //是不是HTML代码
bool isHTML = false; //是不是HTML特殊字符,如
char[] pchar = param.ToCharArray();
int i = 0;
for (i = being; i < pchar.Length; i++)
{
temp = pchar[i];
if (temp == '<')
{
isCode = true;
}
else if (temp == '&')
{
isHTML = true;
}
else if (temp == '>' && isCode)
{
//n = n - 1;
isCode = false;
}
else if (isHTML)
{
isHTML = false;
}
if (!isCode && !isHTML)
{
n = n + 1;
//UNICODE码字符占两个字节
if (System.Text.Encoding.Default.GetBytes(temp + "").Length > 1)
{
n = n + 1;
}
 
补充:Web开发 , 其他 ,