【提问】文本处理的几个问题【在线放分】
读入一个HTML文件到STRING当中
例如:(HTML片段)
<li><a target="_blank" href="http://news.csdn.net/n/20080605/116517.html">鲍尔默当选福布斯全球最勤奋亿万富翁</a></li>
<li><a target="_blank" href="http://news.csdn.net/n/20080604/116500.html">雅虎员工谴散费计划易做图曝光</a></li>
我想用STRING.INDEXOF来定位
"</a></li>
<li><a target" 但是因为有换行和空格的原因,不知道如何使用INDEXOF
现在我想去掉所有的空格和所有的不可见字符(如:换行、回车等),让其变成一个连续的可见字符串。
不知道这样的思路是否正确?
此外,如何删除所有的空格和所有的不可见字符?
--------------------编程问答-------------------- trim()和repeat() 一个去空格一个替换。最好的方法是正则。 --------------------编程问答-------------------- 頂,美女..^_^ --------------------编程问答-------------------- trim只能去掉字符串开头和结尾的空格 那中间的空格呢? --------------------编程问答-------------------- 帮顶 --------------------编程问答-------------------- TextBox1.Text.ToString().Replace("",""); 不知道这个对你有没有用 Replace将什么换成什么 --------------------编程问答--------------------
我建议你将html文件内容作为xml文件处理,这样比较容易获取内容或值
如果靠检索字符来定位获取某些值,一旦处理不好会出现错误 --------------------编程问答-------------------- 同意 --------------------编程问答--------------------
没有明白 可以具体些吗? --------------------编程问答-------------------- 学习 --------------------编程问答-------------------- msdn 查找 xmldocument 类 --------------------编程问答-------------------- 直接用XMLDOCUMENT来处理HTML文件?
感觉还有点晕?
看看MSDN先~~~ --------------------编程问答-------------------- 最好用正则,
去掉所有空字符,换行,回车等
str = System.Text.RegularExpressions.Regex.Replace(str, @"[\s\S]*", ""); --------------------编程问答-------------------- trim()
replace() --------------------编程问答--------------------
我使用REPLACE 好像不好使,不知道为什么? --------------------编程问答-------------------- 你要使用replace的话,必须先将html文本统一成大写或小写格式,这样才能正确操作。因为html文本中可能大小写混合,处理起来很麻烦的 --------------------编程问答--------------------
如果要是替换掉所有的空格和换行回车之类的东西 应该怎么写这个REPLACE呢 --------------------编程问答-------------------- 学习,帮顶
补充:.NET技术 , ASP.NET