当前位置:编程学习 > C#/ASP.NET >>

luncene.net 检索PDF显示部分内容

大家帮帮忙。问一个问题现在我用luncene.net根据关键字检索PDF,我想实现的效果是把PDF中关键字附近的字部分抽取出来能实现吗?例如:某个PDF中包含以下内容 我搜索 “石油”时把这一段抽取出来
石油又称原油,是从地下深处开采的棕黑色可燃粘稠液体。主要是各种烷烃、环烷烃、芳香烃的混合物。它是古代海洋或湖泊中的生物经过漫长的演化形成的混合物,与煤一样属于化石燃料。石油主要被用来作为燃油和汽油,燃料油和汽油组成目前世界上最重要的一次能源之一。石油也是许多化学工业产品如溶液、化肥、杀虫剂和塑料等的原料。
这样能实现吗?
--------------------编程问答-------------------- 能局部抽取吗?好像是不能吧。不清楚。帮顶 --------------------编程问答-------------------- 你可以搜索他的内容。。。 --------------------编程问答-------------------- PDF的内容我能检索出来。就是想搜索的关键字上下的一部分文本显示出来。不知道能不能实现。
实在不行的话只能按字符串截取了。如果一个PDF太大的话这样截取太耗时了吧!
补充:.NET技术 ,  ASP.NET
CopyRight © 2012 站长网 编程知识问答 www.zzzyk.com All Rights Reserved
部份技术文章来自网络,