如何在网页中提取出QQ号码?
例如网页中有 “QQ:12345678”、“QQ号:876543210”,一个页面中有几个QQ号,并且号码长度都是不定的。如何提取出来?另外更深一些,还有的写着“QQ:12345678 876543210”,这里就同时有两个QQ…………我没什么分,刚进来,没什么分可以散给你们,希望不要见到分少就不帮助…… --------------------编程问答-------------------- 每个程序,都需要有一定的限制,必须找出那个限制才可以进行设计。
也就是说,需要大批量的数据采集,就必定要遵循某种规律,就算一时看不到,也必须要找出规律来。
这里说的QQ号,给一个思路。分析网页信息,找到一连串数字,6到9位,纪录下第一个数字的位置,然后截取这个位置以前的10个字符,看是否含有QQ字样,如果有,则该数字为QQ号码,如果这个位置以前10个字符包含数字,并且和已经纪录存在的QQ号码相同,则要分析这个号码和上一个号码之间的字符,看是否含有类似“电话”、“传真”之类的关键字,如果没有,则该号码也是一个QQ号码。 --------------------编程问答-------------------- try
using System.Text.RegularExpressions;
string yourStr = .................;
MatchCollection mc = Regex.Matches(yourStr, @"(?<=QQ号?:(\d+\s*)*)\d+", RegexOptions.IgnoreCase);
foreach (Match m in mc)
{
richTextBox2.Text += m.Value + "\n";
} --------------------编程问答-------------------- 关键字 查找 --------------------编程问答-------------------- try
using System.Text.RegularExpressions;
string yourStr = .................;
MatchCollection mc = Regex.Matches(yourStr, @"(?<=QQ号?:(\d+\s*)*)\d+", RegexOptions.IgnoreCase);
foreach (Match m in mc)
{
richTextBox2.Text += m.Value + "\n";
}
按照这样的方法去调试下。基本没问题,正则表达式对处理这样的操作是最有效果的。
--------------------编程问答-------------------- i(是QQ号)
{
提取QQ号();
} --------------------编程问答--------------------
string QQNo;
QQNo= GetNOFromWeb();
if ( SeekQQFromTencent_MaHuaTeng ( QQNo ) )
{
return true;
}
else
{
return false;
} --------------------编程问答-------------------- 路过 UP --------------------编程问答-------------------- 谢谢各位朋友的热心回答。我是新手,我的成长,离不开你们的点点滴滴教导。忠心感谢! --------------------编程问答-------------------- 你不是想易做图啊!~~ 路过 --------------------编程问答-------------------- 大侠们 能帮忙给个ASP的这个功能的函数么。 --------------------编程问答-------------------- 强大的正则啊...杂那么难呢?????????????? --------------------编程问答-------------------- 何谓正则?????????????????????
补充:.NET技术 , C#