当前位置:编程学习 > JAVA >>

Jsoup解析遇到问题

在解析URL地址时 有时会遇到解析出来的doc对象的text内容在结尾是...
是显示不全吧?
解析部分的代码我是这么写的。

doc = Jsoup.connect(url).userAgent("Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; WOW64; Trident/5.0").timeout(20000).get();

但是获取到的内容 的doc.text() 值就是一部分 最后的结尾是 ...
请高手指点。
回帖即给分! jsoup 解析 --------------------编程问答-------------------- 为什么呢,你得解析获取Elements 然后text 吧。 --------------------编程问答-------------------- 看看真实的数据是不是也是... --------------------编程问答--------------------
引用 1 楼 rui888 的回复:
为什么呢,你得解析获取Elements 然后text 吧。

比如说 我想获得这个页面上一个div对象 
但是解析出来之后,内容里边竟然没有。但是我根据URL 在浏览器里 是可以看到的。
我在debug时 看到doc.text所获得的内容,由于脚本内容太多,后边的内容竟然是省略号……
不知道有没有大神遇到过 --------------------编程问答--------------------
引用 2 楼 fangmingshijie 的回复:
看看真实的数据是不是也是...

真实的数据是有内容的。这个我非常的确定,只是解析之后,由于内容太多,后边的内容是省略号了,不知道是不是这个原因。
我非常确定的是 内容解析出来之后没有这个省略号 --------------------编程问答--------------------
text

public Element text(String text)
Set the text of the body of this document. Any existing nodes within the body will be cleared.
Overrides:
text in class Element
Parameters:
text - unencoded text
Returns:
this document


这个api是没有说大数据省略的,看看是否引用的document是否是jsoup的,是不是引用了jdk的 --------------------编程问答-------------------- 会不会是那个url网页上处理过了  多出来的就 省略号代替了。
--------------------编程问答--------------------
引用 5 楼 fangmingshijie 的回复:
text

public Element text(String text)
Set the text of the body of this document. Any existing nodes within the body will be cleared.
Overrides:
text in class Element
Parameters:
text - unencoded text
Returns:
this document


这个api是没有说大数据省略的,看看是否引用的document是否是jsoup的,是不是引用了jdk的

我引用的是
import org.jsoup.nodes.Document; --------------------编程问答--------------------
引用 6 楼 rui888 的回复:
会不会是那个url网页上处理过了  多出来的就 省略号代替了。

这个不太可能吧? --------------------编程问答-------------------- 能说下怎么解决的吗。。。楼主好人
补充:Java ,  Java EE
CopyRight © 2022 站长资源库 编程知识问答 zzzyk.com All Rights Reserved
部分文章来自网络,