当前位置:编程学习 > C#/ASP.NET >>

正则表达式相关:C# RichTextBox显示html文本内容

 这两天做了一个功能,需要将抓取到的网页html中的文本按格式显示在richtextbox中。可是richtextbox不识别html标签。本打算自己写个html解释器,但是需要花费时间太多了。既然是个小功能还是找个捷径吧。想了两种办法。
1、不用richtextbox了,直接用webbrowser显示。
既然richtextbox不识别html,WebBrowser总该识别吧。用WebBrowser替换掉richtextbox吧。

[csharp]
            string testString = @"<FONT face=Verdana><FONT face=Verdana> 
<P><FONT face=Verdana>测试内容:</FONT></P> 
<P><FONT face=Verdana>    哈哈       <BR>    吃饭啦<BR>     下班啦   <BR>     回家<BR>     睡觉       </FONT></P> 
<P><FONT face=Verdana>呵呵呵<BR>神马</FONT></P> 
<P><FONT face=Verdana><BR></FONT> </P></FONT> 
<P><FONT face=Verdana><BR></FONT> </P></FONT>"; 
 
            webBrowser1.DocumentText = testString; 
            //不过似乎保险一点再加两句  
            webBrowser1.Document.Write(testString); 
 
            webBrowser1.Refresh(); 
            string testString = @"<FONT face=Verdana><FONT face=Verdana>
<P><FONT face=Verdana>测试内容:</FONT></P>
<P><FONT face=Verdana>    哈哈       <BR>    吃饭啦<BR>     下班啦   <BR>     回家<BR>     睡觉       </FONT></P>
<P><FONT face=Verdana>呵呵呵<BR>神马</FONT></P>
<P><FONT face=Verdana><BR></FONT> </P></FONT>
<P><FONT face=Verdana><BR></FONT> </P></FONT>";

            webBrowser1.DocumentText = testString;
            //不过似乎保险一点再加两句
            webBrowser1.Document.Write(testString);

            webBrowser1.Refresh();
2、由于一些原因必须要richtextbox显示。
既然这样就只好用个不伦不类的方法吧。还是利用WebBrowser。

[csharp]
            string testString = @"<FONT face=Verdana><FONT face=Verdana> 
<P><FONT face=Verdana>测试内容:</FONT></P> 
<P><FONT face=Verdana>    哈哈       <BR>    吃饭啦<BR>     下班啦   <BR>     回家<BR>     睡觉       </FONT></P> 
<P><FONT face=Verdana>呵呵呵<BR>神马</FONT></P> 
<P><FONT face=Verdana><BR></FONT> </P></FONT> 
<P><FONT face=Verdana><BR></FONT> </P></FONT>"; 
            using (WebBrowser webBrowser = new WebBrowser()) 
            { 
                webBrowser.Visible = false; 
 
                webBrowser.DocumentText = testString; 
 
                webBrowser.Document.Write(testString); 
 
                this.richTextBox1.Text = webBrowser.Document.Body.OuterText; 
            } 
            string testString = @"<FONT face=Verdana><FONT face=Verdana>
<P><FONT face=Verdana>测试内容:</FONT></P>
<P><FONT face=Verdana>    哈哈       <BR>    吃饭啦<BR>     下班啦   <BR>     回家<BR>     睡觉       </FONT></P>
<P><FONT face=Verdana>呵呵呵<BR>神马</FONT></P>
<P><FONT face=Verdana><BR></FONT> </P></FONT>
<P><FONT face=Verdana><BR></FONT> </P></FONT>";
            using (WebBrowser webBrowser = new WebBrowser())
            {
                webBrowser.Visible = false;

                webBrowser.DocumentText = testString;

                webBrowser.Document.Write(testString);

                this.richTextBox1.Text = webBrowser.Document.Body.OuterText;
            }
这样可以将纯文本内容取到,进行单独处理和应用在别的地方就方便了。
这样结果如下:

 \

说明:
1、这里之所以用webBrowser.Document.Write,因为只是 webBrowser.DocumentText = testString的话,webBrowser.Document.Body就是null,没法去文本;
2、过程有些慢;

 

 

摘自 白杨树

补充:软件开发 , C# ,
CopyRight © 2022 站长资源库 编程知识问答 zzzyk.com All Rights Reserved
部分文章来自网络,