当前位置:编程学习 > JAVA >>

关于使用pdfbox获取pdf内容

我需要用pdfbox获取pdf中的内容--我的需求是文字部分 
当然页面还包含了图片,线条(把文字框起来看表格)等是一个稍微复杂的页面格式
按照
 PDFTextStripper pts = new PDFTextStripper(); 
            pts.setStartPage(1);
            pts.setEndPage(1);
 String result = pts.getText(document);
            System.out.println("文字部分:"+result );
关键就在result那里,
如果我用简单格式的pdf获取正常,
但一用需求的那个稍微复杂的页面格式的pdf
就会报大段的java.lang.NullPointerException
然后接着
 *1234567892*
u
u
u
u
u
u

这段u是什么意思?实在不懂
*1234567892*这段是条形码获取出来了
希望用过的朋友能告知 --------------------编程问答-------------------- --------------------编程问答-------------------- 没人用过吗??
补充:Java ,  Java EE
CopyRight © 2012 站长网 编程知识问答 www.zzzyk.com All Rights Reserved
部份技术文章来自网络,