关于PDFBox 中间数据对象的问题
这段是引用别人的 “ 花了两天多的时间,终于粗略地把用pdfbox抽取pdf文件的元数据信息这一块做完了,通过研究pdfbox的一些底层代码,还是颇有心得的。我主要用的是pdfbox的一个PDFTextStripper类,由于我的抽取工作需要用到文本的字体信息,而该类没有提供相应数据对象及方法,只好自已看其源码。后来发现了其中间数据对象Vector testByArticle,它的数据成员是position对象,就是这个对象包含了字体信息及相应方法。我使用了position的Font(BaseFont)及WordSpacing属性来进行判断。”请问里面所说的 中间数据对象Vector testByArticle 是什么意思? 如何找到呢 怎么用?谢谢! --------------------编程问答-------------------- 帮LZ顶 --------------------编程问答-------------------- 请问楼主这个问题解决了吗?我现在也遇到了这个问题,就是不知道怎么才能获取到pdf文档里面的字体信息 --------------------编程问答-------------------- 我也是。
补充:.NET技术 , C#