博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Java 生成 PDF 文档
阅读量:6264 次
发布时间:2019-06-22

本文共 4873 字,大约阅读时间需要 16 分钟。

最近项目需要实现PDF下载的功能,由于没有这方面的经验,从网上花了很长时间才找到相关的资料。整理之后,发现有如下几个框架可以实现这个功能。

1. 开源框架支持

  • iText,生成PDF文档,还支持将XML、Html文件转化为PDF文件;
  • Apache PDFBox,生成、合并PDF文档;
  • docx4j,生成docx、pptx、xlsx文档,支持转换为PDF格式。

比较:

  • iText开源协议为AGPL,而其他两个框架协议均为Apache License v2.0。
  • 使用PDFBox生成PDF就像画图似的,文字和图像根据页面坐标画上去的,需要根据字数手动换行。
  • docx4j用来生成docx文档,提供了将WORD文档转换为PDF文档的功能,并不能直接生成PDF文档。

2. 实现方案

格式复杂 格式简单
数据量大 docx4j+freemarker docx4j或PDFBox
数据量小 docx4j PDFBox

2.1 纯数据生成PDF

1.docx4j,适用于生成格式简单或格式复杂且数据量小的PDF文档; 2.Apache PDFBox,适用于生成格式简单且数据量小的PDF文档。

1.docx4j docx4j是一个开源Java库,用于创建和操作Microsoft Open XML(Word docx,Powerpoint pptx和Excel xlsx)文件。它类似于Microsoft的OpenXML SDK,但适用于Java。docx4j使用JAXB来创建内存中的对象表示,程序员需要花时间了解JAXB和Open XML文件结构 。

// word对象WordprocessingMLPackage wordMLPackage = WordprocessingMLPackage.createPackage();// 文档主体MainDocumentPart mainDocumentPart = wordMLPackage.getMainDocumentPart();// 换行符Br br = objectFactory.createBr();// 段落P p = objectFactory.createP();// 段落设置PPr ppr = objectFactory.createPPr();// 文字位置Jc jc = new Jc();jc.setVal(je);ppr.setJc(jc);// 行设置RPr rpr = objectFactory.createRPr();// 字体设置RFonts rFonts = objectFactory.createRFonts();rFonts.setAscii("Times New Roman");rFonts.setEastAsia("宋体");rpr.setRFonts(rFonts);// 行R r = objectFactory.createR();// 文本Text text = objectFactory.createText();text.setValue("这是一段普通文本");r.setRPr(rpr);r.getContent().add(br);r.getContent().add(text);p.getContent().add(r);p.setPPr(ppr);// 添加到正文中mainDocumentPart.addObject(p);// 导出//..复制代码

2.Apache PDFBox Apache PDFBox是处理PDF文档的一个开源的Java工具。该项目允许创建新的PDF文档,处理现有文档以及从文档中提取内容的功能。Apache PDFBox还包括几个命令行实用程序。

String formTemplate = "/Users/xiaoming/Desktop/test_pdfbox.pdf";// 定义文档对象PDDocument document = new PDDocument();// 定义一页,大小A4PDPage page = new PDPage(PDRectangle.A4);document.addPage(page);// 获取字体PDType0Font font = PDType0Font.load(document, new File("/Users/xiaoming/work/tmp/simsun.ttf"));// 定义页面内容流PDPageContentStream stream = new PDPageContentStream(document, page);// 设置字体及文字大小stream.setFont(font, 12);// 设置画笔颜色stream.setNonStrokingColor(Color.BLACK);// 添加矩形stream.addRect(29, 797, 100, 14);// 填充矩形stream.fill();stream.setNonStrokingColor(Color.BLACK);// 文本填充开始stream.beginText();// 设置行距stream.setLeading(18f);// 设置文字位置stream.newLineAtOffset(30, 800);// 填充文字stream.showText("呵呵");// 换行stream.newLine();stream.showText("哈哈");stream.newLine();stream.showText("嘻嘻");// 文本填充结束stream.endText();// 关闭流stream.close();// 保存document.save(formTemplate);// 释放资源document.close();复制代码

2.2 模版+数据生成PDF

FreeMarker+docx4j,适用于生成格式复杂且数据量大的PDF文档

Apache FreeMarker是一个模板引擎,用于根据模板和更改数据生成文本输出(HTML网页,电子邮件,配置文件,源代码等)。模板是用FreeMarker模板语言(FTL)编写的,是一种简单的专用语言。

Office2003以上,Word是可以以XML文本格式存储的。先将要生成的PDF转换为Word文档 ,再将其保存为XML文本,通过模版引擎将数据填充到XML文本中,最后再反向转换为PDF文档。简单来说就是PDF->Word->XML->Word->PDF的流程。

步骤 描述 工具
1 word -> xml 手动
2 xml -> ftl 手动,参考
3 ftl + obj = xml freemarker
4 xml -> pdf docx4j
步骤
  • 1 把pdf文档对应的word(docx)制作出来
  • 2 把word文档另存为xml文件
  • 3 将xml文件制作为freemarker模版(ftl)文件
  • 4 将数据和ftl文件组装为xml文本
Map
map = new HashMap<>();map.put("name", "小明");map.put("address", "北京市朝阳区");map.put("email", "xiaoming@abc.com");StringWriter stringWriter = new StringWriter();BufferedWriter writer = new BufferedWriter(stringWriter);template.process(map, writer);String xmlStr = stringWriter.toString();复制代码
  • 5 使用docx4j将xml文本加载为word文档对象
ByteArrayInputStream in = new ByteArrayInputStream(xmlStr.getBytes());WordprocessingMLPackage wordMLPackage = WordprocessingMLPackage.load(in);复制代码
  • 6 使用docx4j将word文档转存为pdf文档
String outputfilepath = "/Users/xiaoming/简历.pdf";FileOutputStream os = new FileOutputStream(new File(outputFilePath));FOSettings foSettings = Docx4J.createFOSettings();foSettings.setWmlPackage(wordMLPackage);Docx4J.toFO(foSettings, os, Docx4J.FLAG_EXPORT_PREFER_XSL);// Docx4J.toPDF(wordMLPackage, new FileOutputStream(new File(outputfilepath)));复制代码

2.3 Word转PDF

docx4j

WordprocessingMLPackage mlPackage = WordprocessingMLPackage.load(new File("abc.docx"));Mapper fontMapper = new IdentityPlusMapper();  // fontMapper.put("华文行楷", PhysicalFonts.get("STXingkai"));  mlPackage.setFontMapper(fontMapper);  OutputStream os = new java.io.FileOutputStream("abc.pdf");    FOSettings foSettings = Docx4J.createFOSettings();  foSettings.setWmlPackage(mlPackage);  Docx4J.toFO(foSettings, os, Docx4J.FLAG_EXPORT_PREFER_XSL);  复制代码

2.4 合并多个PDF

Apache PDFBox,将多个PDF文档合并

String folderName = "/Users/xiaoming/pdfs";String destPath = "/Users/xiaoming/all.pdf";PDFMergerUtility mergePdf = new PDFMergerUtility();String[] filesInFolder = getFiles(folderName);Arrays.sort(filesInFolder, new Comparator
() { @Override public int compare(String o1, String o2) { return o1.compareTo(o2); }});for (int i = 0; i < filesInFolder.length; i++) { mergePdf.addSource(folderName + File.separator + filesInFolder[i]);}mergePdf.setDestinationFileName(destPath);mergePdf.mergeDocuments(MemoryUsageSetting.setupMainMemoryOnly());复制代码

示例代码

转载地址:http://jzjpa.baihongyu.com/

你可能感兴趣的文章
接口与抽象类的使用选择
查看>>
if __name__ == '__main__'
查看>>
CF 375D. Tree and Queries【莫队 | dsu on tree】
查看>>
Maven最佳实践 划分模块 配置多模块项目 pom modules
查看>>
Hadoop学习笔记——WordCount
查看>>
Unity应用架构设计(4)——设计可复用的SubView和SubViewModel(Part 1)
查看>>
Java-Spring-获取Request,Response对象
查看>>
opencv项目报错_pFirstBlock==pHead解决办法
查看>>
MySQL日志
查看>>
Oracle性能优化之Oracle里的执行计划
查看>>
电脑如何连接远程服务器?听语音
查看>>
使用Xcode 查看objective-C的汇编代码
查看>>
Vue.js——60分钟快速入门
查看>>
设计模式 - 模板方法模式(template method pattern) 具体解释
查看>>
mysql判断一个字符串是否包含某子串 【转】
查看>>
a bad dream
查看>>
FD_CLOEXEC用法及原因_转
查看>>
element UI 的学习一,路由跳转
查看>>
RabbitMQ三种Exchange模式(fanout,direct,topic)的性能比较
查看>>
Spring JavaBean属性值的注入方式( 属性注入, 特殊字符注入 <![CDATA[ 带有特殊字符的值 ]]> , 构造器注入 )...
查看>>