当前位置:编程学习 > C#/ASP.NET >>

关于PDFBox 中间数据对象的问题

这段是引用别人的 “ 花了两天多的时间,终于粗略地把用pdfbox抽取pdf文件的元数据信息这一块做完了,通过研究pdfbox的一些底层代码,还是颇有心得的。我主要用的是pdfbox的一个PDFTextStripper类,由于我的抽取工作需要用到文本的字体信息,而该类没有提供相应数据对象及方法,只好自已看其源码。后来发现了其中间数据对象Vector testByArticle,它的数据成员是position对象,就是这个对象包含了字体信息及相应方法。我使用了position的Font(BaseFont)及WordSpacing属性来进行判断。”


请问里面所说的 中间数据对象Vector testByArticle 是什么意思?  如何找到呢 怎么用?谢谢! --------------------编程问答-------------------- 帮LZ顶 --------------------编程问答-------------------- 请问楼主这个问题解决了吗?我现在也遇到了这个问题,就是不知道怎么才能获取到pdf文档里面的字体信息 --------------------编程问答-------------------- 我也是。
补充:.NET技术 ,  C#
CopyRight © 2022 站长资源库 编程知识问答 zzzyk.com All Rights Reserved
部分文章来自网络,