C#怎么解析html标签值
现在有一段html标签的代码,且这段代码中含有html标签,而我想做的就是取出这些标签内的值:比如:<table cellpadding="0" cellspacing="0" width="100%" border="1" bordercolor="#DCEAF8" class="Table Product_Detail"> <tr> <th class="tdTitle" colspan="2">主体</th> </tr> <tr> <td class="tdTitle">品牌</td> <td>火线竞技 HOTLINE GAMES</td> </tr> <tr> <td class="tdTitle">类型</td> <td>脚贴</td> </tr> <tr> <td class="tdTitle">型号</td> <td>罗技G5/G7/08款MX518</td> </tr> <tr> <td class="tdTitle">颜色</td> <td>透明</td> </tr> <tr> <th class="tdTitle" colspan="2">规格</th> </tr> <tr> <td class="tdTitle">尺寸</td> <td>脚贴厚度:0.18mm</td> </tr> <tr> <th class="tdTitle" colspan="2">特性</th> </tr> <tr> <td class="tdTitle">其他特性</td> <td>适合G5/G7以及类似形状鼠标脚, 08年的最新款518也适合<br /> 提供了超滑并且超强持久的耐磨性,贴上这种贴粒,可以使用半年左右甚至更久,让您长期获得滑翔般的畅快移动</td> </tr> </table>
希望能够得到<tr>标签内的值,但同时每组<td>标签内的值要分开,不能合在一起,希望得到每组<tr>标签内的值。请问各位大侠该怎么解析。。。 --------------------编程问答-------------------- 使用正则 --------------------编程问答-------------------- 1,正则
2,dom
3,substring慢慢搞 --------------------编程问答--------------------
Regex regExp = new Regex(@"(?is)(?<=<tr[^>]*>).*?(?=</tr>)");--------------------编程问答-------------------- 最好是用 XML 相关解析程序来分析。 --------------------编程问答-------------------- 能给个实例吗?
MatchCollection mc = regExp.Matches(yourHtml);
foreach(Match m in mc)
{
m.Value;//这个
}
--------------------编程问答-------------------- Regex reg= new Regex(@"(@is)<td[^>]*]>(.*?)</td>");
MatchCollection mc= reg.Matches("");
foreach (Match m in mc)
{
textbox1.Text+=m.Groups[1].Value + "\n";
}
或先获取tr中内容,再获取td内容
--------------------编程问答-------------------- 这样?
Regex regTR = new Regex(@"(?is)<tr[^>]*>(?:(?!</tr>).)*</tr>");
Regex regTD = new Regex(@"(?is)<t[dh][^>]*>((?:(?!</td>).)*)</t[dh]>");
MatchCollection mcTR = regTR.Matches(yourStr);
foreach (Match mTR in mcTR)
{
MatchCollection mcTD = regTD.Matches(mTR.Value);
foreach (Match mTD in mcTD)
{
richTextBox2.Text += mTD.Groups[1].Value + "\n";
}
richTextBox2.Text += "\n--------------------\n";
}
补充:.NET技术 , C#