怎么在C#中提取table值
<tbody><tr>
<td align="center"><a href="http://www.veryzhun.com/searchnum.asp?flightnum=CA5901" target=_blank style="color:#000">CA5901</a></td>
<td align="center">北京</td>
<td align="center">T3 </td>
<td align="center">上海虹桥</td>
<td align="center">T2 </td>
<td align="center">06:35</td>
<td align="center">06:45 </td>
<td align="center">08:33</td>
<td align="center">08:22 </td>
<td align="center"><a href="http://www.veryzhun.com/orderflightstatusnext.asp?flightno=CA5901" style="cursor:hand;float:right;padding-top:6px;" target=_blank > <img src='http://cdn.feeyo.com/fimg/vflight/images/mobile.gif' border='0' alt='航班动态跟踪飞常准服务'>免费订制</a></td>
<td align="center"> <span class="arrive">到达</span> </td>
<td style="padding-left:20px;"><img src="http://cdn.feeyo.com/fimg/ticket/img/air/CA.gif" width="15" height="15" alt="中国国际航空公司" border="0" > 中国国际航空公司</td>
</tr>
<tr>
<td align="center"><a href="http://www.veryzhun.com/searchnum.asp?flightnum=MU3926" target=_blank style="color:#000">MU3926</a></td>
<td align="center">北京</td>
<td align="center">T3 </td>
<td align="center">上海虹桥</td>
<td align="center">T2 </td>
<td align="center">06:35</td>
<td align="center">06:45 </td>
<td align="center">08:33</td>
<td align="center">08:22 </td>
<td align="center"><a href="http://www.veryzhun.com/orderflightstatusnext.asp?flightno=MU3926" style="cursor:hand;float:right;padding-top:6px;" target=_blank > <img src='http://cdn.feeyo.com/fimg/vflight/images/mobile.gif' border='0' alt='航班动态跟踪飞常准服务'>免费订制</a></td>
<td align="center"> <span class="arrive">到达</span> </td>
<td style="padding-left:20px;"><img src="http://cdn.feeyo.com/fimg/ticket/img/air/MU.gif" width="15" height="15" alt="中国东方航空公司" border="0" > 中国东方航空公司</td>
</tr>
</tbody>
table中包含<tbody>,里面有很多项数据,怎么提取出来:
MU3926
北京
T3
上海虹桥
T2
06:35
06:45
08:33
08:22
免费订制
到达
中国东方航空公司
问题:
1、使用C#编程,首先怎么将<tbody>提取出来,然后怎么采用正则表达式将数据项提取出来?提取的数据中怎样剔除> ?
2、或者使用别的编程手段将数据提取出来?
HTML 正则表达式 htmlparser --------------------编程问答-------------------- 从html里面提取,不如直接用IE打开这个页面,从页里面复制出内容,粘贴到Excel表格,内容全出来了 --------------------编程问答-------------------- http://bbs.csdn.net/topics/390241792 --------------------编程问答-------------------- 你要后台提取? --------------------编程问答-------------------- 把table的runat属性设成server,就是服务器可以读取
直接就可以用C#读取里面的值了
最后是用asp.net的表格控件,就更方便了 --------------------编程问答-------------------- table 加一个属性runat='server' 这样后台就可以取到了
<table runat='server'></table> --------------------编程问答-------------------- 在后台运行的,提取完后放到数据库,相当于做deep data --------------------编程问答-------------------- 顶一下,请各位高手帮帮忙.
给出用C#(后台形式的)编的程序. --------------------编程问答--------------------
这里面只提取一项内容,我这里面将有很多相同的内容,怎么提取? --------------------编程问答-------------------- http://bbs.csdn.net/topics/390212944 --------------------编程问答--------------------
public static string RegStr(string objStr)
{
string returnStr = "";
MatchCollection ml = Regex.Matches(objStr, @"(?is)<tr>(?:\s*<td [^>]*>(.*?)</td>)*\s*</tr>");
foreach (Match m in ml)
{
string str = m.Value.Replace("</td></tr>", ",");
str = str.Replace("</td>", "");
str = str.Replace(" ", "");
str = Regex.Replace(str, "<.*?>", "");
returnStr += str;
}
return returnStr;
}
=====
StreamReader sr = new StreamReader("test.txt", Encoding.GetEncoding("GB2312"));
string ss = sr.ReadToEnd();
textBox1.Text = RegStr(ss);
=====返回
CA5901
北京
T3
上海虹桥
T2
06:35
06:45
08:33
08:22
免费订制
到达
中国国际航空公司
MU3926
北京
T3
上海虹桥
T2
06:35
06:45
08:33
08:22
免费订制
到达
中国东方航空公司
补充:.NET技术 , C#