对文章内容进行分页

最近公司要在原来的Web网站发布的内容，也要在Wap上面显示。现有的文章内容是存放在一个字段里面，没有进行分页处理保存。因些在手机显示时，要对文章内容进行截取分页处理显示。

现在问题出来了，文章内容里面包含了很多HTML标签，用SubString进行截取那会把HTML标签也给截断，也在可能会在标签的属性中截开，这样我们得出来的字符串就是错乱的了。因此在截取时，对HTML标签进行过滤。

自己的表达能力有限，直接上代码。

/// <summary>

        /// 得到分页后的数据
        /// </summary>
        /// <param name="param">文章内容</param>
        /// <param name="size">文章字数（不包含HTML）</param>
        /// <returns></returns>
        public static List<string> SubstringTo(string param, int size)
        {
            param = NoHTML(param);//过滤一些有Wap上面不能显示的HTML标签，你也不可不过滤
            var length = param.ToCharArray().Length;
            var being = 0;
            var list = new List<string>();
            while (true)
            {
                string str = SubstringToHTML(param, being, size, "", out being);
                list.Add(str);
                if (length <= being)
                {
                    break;
                }
            }
            return list;
        }

/// <summary>

        /// 按字节长度截取字符串(支持截取带HTML代码样式的字符串)
        /// </summary>
        /// <param name="param">将要截取的字符串参数</param>
        /// <param name="length">截取的字节长度</param>
        /// <param name="end">字符串末尾补上的字符串</param>
        /// <returns>返回截取后的字符串</returns>
        public static string SubstringToHTML(string param, int being, int length, string end, out int index)
        {
            string Pattern = null;
            MatchCollection m = null;
            StringBuilder result = new StringBuilder();
            int n = 0;
            char temp;
            bool isCode = false; //是不是HTML代码
            bool isHTML = false; //是不是HTML特殊字符,如
            char[] pchar = param.ToCharArray();
            int i = 0;
            for (i = being; i < pchar.Length; i++)
            {
                temp = pchar[i];
                if (temp == '<')
                {
                    isCode = true;
                }
                else if (temp == '&')
                {
                    isHTML = true;
                }
                else if (temp == '>' && isCode)
                {
                    //n = n - 1;
                    isCode = false;
                }
                else if (isHTML)
                {
                    isHTML = false;
                }
                if (!isCode && !isHTML)
                {
                    n = n + 1;
                    //UNICODE码字符占两个字节
                    if (System.Text.Encoding.Default.GetBytes(temp + "").Length > 1)
                    {
                        n = n + 1;
                    }

补充：Web开发 , 其他 ,