最新文章专题视频专题问答1问答10问答100问答1000问答2000关键字专题1关键字专题50关键字专题500关键字专题1500TAG最新视频文章推荐1 推荐3 推荐5 推荐7 推荐9 推荐11 推荐13 推荐15 推荐17 推荐19 推荐21 推荐23 推荐25 推荐27 推荐29 推荐31 推荐33 推荐35 推荐37视频文章20视频文章30视频文章40视频文章50视频文章60 视频文章70视频文章80视频文章90视频文章100视频文章120视频文章140 视频2关键字专题关键字专题tag2tag3文章专题文章专题2文章索引1文章索引2文章索引3文章索引4文章索引5123456789101112131415文章专题3
当前位置: 首页 - 科技 - 知识百科 - 正文

使用pdfbox实现pdf文本提取和合并功能示例

来源:懂视网 责编:小采 时间:2020-11-27 22:40:13
文档

使用pdfbox实现pdf文本提取和合并功能示例

使用pdfbox实现pdf文本提取和合并功能示例:有时我们需要对PDF文件进行一些处理,提取文本、合并等。以前我们使用A-PDF Text Extractor免费工具,为什么不自己写一个呢 现在我们可以使用PDFBox-0.7.3这个开源类库. 下载解包后引用: 代码如下:PDFBox-0.7.3.dllIKVM.GNU.Classpa
推荐度:
导读使用pdfbox实现pdf文本提取和合并功能示例:有时我们需要对PDF文件进行一些处理,提取文本、合并等。以前我们使用A-PDF Text Extractor免费工具,为什么不自己写一个呢 现在我们可以使用PDFBox-0.7.3这个开源类库. 下载解包后引用: 代码如下:PDFBox-0.7.3.dllIKVM.GNU.Classpa

有时我们需要对PDF文件进行一些处理,提取文本、合并等。以前我们使用A-PDF Text Extractor免费工具,为什么不自己写一个呢?
现在我们可以使用PDFBox-0.7.3这个开源类库. 下载解包后引用:
代码如下:
PDFBox-0.7.3.dll
IKVM.GNU.Classpath.dll

新建一个项目,代码很简单:
代码如下:
public static string ParseToTxtStringUsingPDFBox(string filename){
PDDocument doc = PDDocument.load(filename);
PDFTextStripper stripper = new PDFTextStripper();
return stripper.getText(doc);
}

获得这个textString,再把它们写成磁盘文件就可以了, 像这样的方法:
代码如下:
public static void WriteToTextFile(string str,string txtpath)
{
if (string.IsNullOrEmpty(txtpath))
throw new ArgumentNullException("Output file path should not be Null");
using (var txtWriter = new StreamWriter(txtpath))
{
txtWriter.Write(str);
txtWriter.Close();
}
}

其它的功能您可以自行发挥了. 这个类库目前支持:

PDF to text extraction
Merge PDF Documents
PDF Document Encryption/Decryption
Lucene Search Engine Integration
Fill in form data FDF and XFDF
Create a PDF from a text file
Create images from PDF pages
Print a PDF

文档

使用pdfbox实现pdf文本提取和合并功能示例

使用pdfbox实现pdf文本提取和合并功能示例:有时我们需要对PDF文件进行一些处理,提取文本、合并等。以前我们使用A-PDF Text Extractor免费工具,为什么不自己写一个呢 现在我们可以使用PDFBox-0.7.3这个开源类库. 下载解包后引用: 代码如下:PDFBox-0.7.3.dllIKVM.GNU.Classpa
推荐度:
  • 热门焦点

最新推荐

猜你喜欢

热门推荐

专题
Top