c#抓取网页的内容不全
System.Net.WebRequest req = WebRequest.Create(str);WebResponse repo = req.GetResponse();
StreamReader oStreamRd = new StreamReader(repo.GetResponseStream(), Encoding.GetEncoding("utf-8"));
string view = oStreamRd.ReadToEnd();
this.textBox2.Text = view;
用这部分代码几乎可以得到全部内容。但有一些得不到。比如这个网址http://blog.sina.com.cn/u/1723173265 中的访客信息就取不到。直接在网页中查看源文件也看不到访客的信息。但是我想,既然浏览器客户端能看到,就应该能取出来。希望高手们指点指点,该用什么方法。谢谢! --------------------编程问答-------------------- 有的是ajax获取的 --------------------编程问答--------------------
有些是js 实现的 --------------------编程问答-------------------- 正则 , --------------------编程问答--------------------
能否帮我看下列子中的sina博客这个。看看它到底是怎么回事呢? --------------------编程问答-------------------- 不知道你说的个人信息是哪块内容?这些不是在源代码里吗
<div class="info_list">
<ul class="info_list1">
<li><span class="SG_txtc">博客等级:</span><span id="comp_901_grade"><img src="http://simg.sinajs.cn/blog7style/images/common/number/7.gif" /></span></li>
<li><span class="SG_txtc">博客积分:</span><span id="comp_901_score"><strong>396</strong> </span></li>
</ul>
<ul class="info_list2">
<li><span class="SG_txtc">博客访问:</span><span id="comp_901_pv"><strong>1,063</strong> </span></li>
<li><span class="SG_txtc">关注人气:</span><span id="comp_901_attention"><strong>1</strong> </span></li>
</ul></div>
--------------------编程问答-------------------- 访问信息很明显是ajax加载的
<div class="SG_connHead">
<span class="title" comp_title="访客">访客</span>
<span class="edit"></span>
</div>
<div class="SG_connBody">
<div class="wdtLoading"><img src="http://simg.sinajs.cn/blog7style/images/common/loading.gif" />加载中…</div>
</div>
<div class="SG_connFoot"></div>
</div>
--------------------编程问答-------------------- 正则表达式 --------------------编程问答-------------------- C#抓取不全
那你不会用而已啊。。。
你不会用Socket吗?
MS不是标注过了吗?要实现比较底层的,深层次的功能主张应该用Socket。。。OK?
即使.NET内置的Socket不行的话,你还可以用Win32系统函数啊。。。
--------------------编程问答--------------------
请给出详细代码,。。。感谢
补充:.NET技术 , .NET技术前瞻