当前位置:编程学习 > C#/ASP.NET >>

关于html格式文件的导入

我这里有一个html格式的文件,内容是一张表格,在网页中打开效果如下:

操作用户 操作日期 操作时间 
aaaaaaaa 20100831 16:37:08  
aaaaaaaa 20100830 10:11:46 
aaaaaaaa 20100829 10:46:17  



在记事本中打开效果如下:

<html>
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8">
<HEAD>
<TITLE></TITLE>
</HEAD>
<body >
  <table align="center">
    <tr>
      <td><b>操作用户</b></td>
      <td><b>操作日期</b></td>
      <td><b>操作时间</b></td>
    </tr>
      <tr>
        <td>aaaaaaaa</td>
        <td>20100831</td>
        <td>16:37:08</td>
      </tr>
      <tr>
        <td>aaaaaaaa</td>
        <td>20100830</td>
        <td>10:11:46</td>
      </tr>
      <tr>
        <td>aaaaaaaa</td>
        <td>20100829</td>
        <td>10:46:17</td>
      </tr>
  </table>
</body>    
</html>

我现在想把这个文件导入到数据库中,想问下要怎么做呢?
或者说怎么样把这个文件导入进去,转化成一个DataTable表呢?
谢谢啦! --------------------编程问答-------------------- 可以把整个页面的HTML转换一个字符串

然后执行插入数据库操作

数据库中用个字段来存。。

插入的时候要进行HTML转换。。
/// 去除HTML标记
        public static string NoHTML(string strHtml)
        {
            strHtml= Regex.Replace(strHtml, @"<script[^>]*?>.*?</script>", "", RegexOptions.IgnoreCase);           

 strHtml= Regex.Replace(strHtml, @"<(.[^>]*)>", "", RegexOptions.IgnoreCase);
            strHtml= Regex.Replace(strHtml, @"([\r\n])[\s]+", "", RegexOptions.IgnoreCase);
            strHtml= Regex.Replace(strHtml, @"-->", "", RegexOptions.IgnoreCase);
            strHtml= Regex.Replace(strHtml, @"<!--.*", "", RegexOptions.IgnoreCase);

            strHtml= Regex.Replace(strHtml, @"&(quot|#34);", "\"", RegexOptions.IgnoreCase);
            strHtml= Regex.Replace(strHtml, @"&(amp|#38);", "&", RegexOptions.IgnoreCase);
            strHtml= Regex.Replace(strHtml, @"&(lt|#60);", "<", RegexOptions.IgnoreCase);
            strHtml= Regex.Replace(strHtml, @"&(gt|#62);", ">", RegexOptions.IgnoreCase);
            strHtml= Regex.Replace(strHtml, @"&(nbsp|#160);", " ", RegexOptions.IgnoreCase);
            strHtml= Regex.Replace(strHtml, @"&(iexcl|#161);", "\xa1", RegexOptions.IgnoreCase);
            strHtml= Regex.Replace(strHtml, @"&(cent|#162);", "\xa2", RegexOptions.IgnoreCase);
            strHtml= Regex.Replace(strHtml, @"&(pound|#163);", "\xa3", RegexOptions.IgnoreCase);
            strHtml= Regex.Replace(strHtml, @"&(copy|#169);", "\xa9", RegexOptions.IgnoreCase);
            strHtml= Regex.Replace(strHtml, @"&#(\d+);", "", RegexOptions.IgnoreCase);

            strHtml.Replace("<", "");
            strHtml.Replace(">", "");
            strHtml.Replace("\r\n", "");
            strHtml= HttpContext.Current.Server.HtmlEncode(strHtml).Trim();

            return strHtml;
        }
--------------------编程问答-------------------- 用io拿到html .
用正则拿到你需要的信息 . --------------------编程问答--------------------
引用 1 楼 wxr0323 的回复:
可以把整个页面的HTML转换一个字符串

然后执行插入数据库操作

数据库中用个字段来存。。

插入的时候要进行HTML转换。。


数据库中用个字段来存。。
???
我想每行存成一条记录啊,
按上面的就是存成3条记录了。 --------------------编程问答--------------------
引用 2 楼 zell419 的回复:
用io拿到html .
用正则拿到你需要的信息 .


我技术很菜,能详细点吗? --------------------编程问答-------------------- 急急急,还有什么好方法吗?
补充:.NET技术 ,  ASP.NET
CopyRight © 2012 站长网 编程知识问答 www.zzzyk.com All Rights Reserved
部份技术文章来自网络,