当前位置：编程学习 > JAVA >>

关于使用pdfbox获取pdf内容

我需要用pdfbox获取pdf中的内容--我的需求是文字部分
当然页面还包含了图片，线条(把文字框起来看表格)等是一个稍微复杂的页面格式
按照
PDFTextStripper pts = new PDFTextStripper();
            pts.setStartPage(1);
            pts.setEndPage(1);
String result = pts.getText(document);
            System.out.println("文字部分:"+result );
关键就在result那里，
如果我用简单格式的pdf获取正常，
但一用需求的那个稍微复杂的页面格式的pdf
就会报大段的java.lang.NullPointerException
然后接着
*1234567892*
u
u
u
u
u
u

这段u是什么意思？实在不懂
*1234567892*这段是条形码获取出来了
希望用过的朋友能告知 --------------------编程问答-------------------- --------------------编程问答-------------------- 没人用过吗？？

补充：Java ,  Java EE

上一个：关于登陆我问问弱弱的问题求达人解答
下一个：张孝祥一路走好

更多图片编程知识:

更多JAVA疑问解答：: java怎么在线读取ftp服务器上的文件内容; 关于程序员的职业规划; HTML和JSP矛盾吗？; java小程序如何打包？; java怎么split路径文件名？; jsp+javaBean中Column 'ordersPrice' specified twice的错误; Java TCP/IP Socket网络编程系列; 大家来讨论一下我到底该用什么好?Swing 还是 JavaFX; 关于Hibernate实体自身多对一的抓取问题; 关于apache2+tomcat群集出现的问题; spring 获取上下文问题; SSH 导入导出excel 谁有这块的资料吗?; Ext TreePanel 刷新问题; springmvc 加载一个jsp页面执行多个方法报404; checkbox数组action怎么向页面传值

站长资源库

微信小程序

如果你遇到编程学习难题：
访问www.zzzyk.com 试试

CopyRight © 2022 站长资源库编程知识问答 zzzyk.com All Rights Reserved
部分文章来自网络，