以编程方式反汇编PDF文档

您可以将PDF文档反汇编,方法是将其传递给Assembler服务。 通常,当PDF文档最初是从许多单个文档(如语句集合)创建时,此任务很有用。 在下图中,DocA被划分为多个生成文档,其中页面上的第一级书签标识新生成文档的开始。

pd_pd_pdf从书签

要反汇编PDF文档,请确保PDFsFromBookmarks元素位于DDX文档中。 PDFsFromBookmarks元素是生成元素,只能是DDX元素的子元素。 它没有result属性,因为它可能导致生成多个文档。

PDFsFromBookmarks元素使源文档中每个1级书签生成一个文档。

在此讨论中,假定使用以下DDX文档。

 <?xml version="1.0" encoding="UTF-8"?> 
 <DDX xmlns="https://ns.adobe.com/DDX/1.0/"> 
      <PDFsFromBookmarks prefix="stmt"> 
     <PDF source="AssemblerResultPDF.pdf"/> 
 </PDFsFromBookmarks> 
 </DDX>
注意

在阅读本节之前,建议您熟悉使用Assembler服务汇编PDF文档。 (请参阅以编程方式组合PDF文档。)

注意

将单个PDF文档传递到Assembler服务并返回单个文档时,可以调用invokeOneDocument操作。 但是,要反汇编PDF文档,请使用invokeDDX操作,因为尽管将一个输入的PDF文档传递给Assembler服务,但Assembler服务返回一个包含一个或多个文档的集合对象。

注意

有关Assembler服务的详细信息,请参阅AEM Forms的服务参考

注意

有关DDX文档的详细信息,请参阅Assembler Service和DDX Reference

步骤的摘要

要反汇编PDF文档,请执行以下任务:

  1. 包括项目文件。
  2. 创建PDF Assembler客户端。
  3. 引用现有DDX文档。
  4. 参考PDF文档以反汇编。
  5. 设置运行时选项。
  6. 反汇编PDF文档。
  7. 保存已拆解的PDF文档。

包括项目文件

在开发项目中包含必要的文件。 如果要使用Java创建客户端应用程序,请包含必要的JAR文件。 如果您使用Web服务,请确保包含代理文件。

必须将以下JAR文件添加到项目的类路径中:

  • adobe-livecycle-client.jar
  • adobe-usermanager-client.jar
  • adobe-assembler-client.jar
  • adobe-utilities.jar(在JBoss上部署AEM Forms时为必需)
  • jbossall-client.jar(如果在JBoss上部署了AEM Forms,则为必需)

如果AEM Forms部署在非JBoss的受支持J2EE应用程序服务器上,则必须将adobe-utilities.jar和jbossall-client.jar替换为特定于部署AEM Forms的J2EE应用程序服务器的JAR文件。

创建PDF Assembler客户端

在以编程方式执行Assembler操作之前,必须创建Assembler服务客户端。

引用现有DDX文档

必须引用DDX文档以反汇编PDF文档。 此DDX文档必须包含PDFsFromBookmarks元素。

参考PDF文档以反汇编

要反汇编PDF文档,请参考表示要反汇编的PDF文档的PDF文件。 传递到Assembler服务时,将为文档中的每个1级书签返回单独的PDF文档。

设置运行时选项

您可以设置运行时选项,以在Assembler服务执行作业时控制其行为。 例如,您可以设置一个选项,指示Assembler服务在遇到错误时继续处理作业。

反汇编PDF文档

在创建Assembler服务客户端后,请参考DDX文档,引用PDF文档以反汇编,并设置运行时选项,您可以通过调用invokeDDX方法反汇编PDF文档。 如果DDX文档包含反汇编PDF文档的说明,则Assembler服务会在集合对象中返回已分解的PDF文档。

保存已拆解的PDF文档

所有已拆卸的PDF文档都会在集合对象中返回。 遍历集合对象,将每个PDF文档另存为PDF文件。

另请参阅

包括AEM Forms Java库文件

设置连接属性

以编程方式组合PDF文档

使用Java API拆解PDF文档

使用Assembler Service API(Java)反汇编PDF文档:

  1. 包括项目文件。

    在Java项目的类路径中包含客户端JAR文件,如adobe-assembler-client.jar。

  2. 创建PDF Assembler客户端。

    • 创建包含连接属性的ServiceClientFactory对象。
    • 使用AssemblerServiceClient对象的构造函数并传递ServiceClientFactory对象,创建对象。
  3. 引用现有DDX文档。

    • 使用DDX文档的构造函数并传递一个指定DDX文件位置的字符串值,创建一个表示DDX文件的java.io.FileInputStream对象。
    • 使用com.adobe.idp.Document对象的构造函数并传递java.io.FileInputStream对象,创建对象。
  4. 参考PDF文档以反汇编。

    • 使用HashMap构造函数创建用于存储输入PDF文档的java.util.Map对象。

    • 使用java.io.FileInputStream对象的构造函数并将PDF文档的位置传递给反汇编。

    • 创建com.adobe.idp.Document对象,并将包含PDF文档的java.io.FileInputStream对象传递给反汇编。

    • 通过调用put方法并传递以下参数,向java.util.Map对象添加一个条目:

      • 表示键名的字符串值。 此值必须与在DDX文档中指定的PDF源元素的值匹配。
      • 一个com.adobe.idp.Document对象,其中包含要反汇编的PDF文档。
  5. 设置运行时选项。

    • 使用AssemblerOptionSpec的构造函数创建存储运行时选项的对象。
    • 通过调用属于AssemblerOptionSpec对象的方法,设置运行时选项以满足您的业务要求。 例如,要指示Assembler服务在发生错误时继续处理作业,请调用AssemblerOptionSpec对象的setFailOnError方法并传递false
  6. 反汇编PDF文档。

    调用AssemblerServiceClient对象的invokeDDX方法并传递以下必需值:

    • 一个com.adobe.idp.Document对象,它表示要使用的DDX文档
    • java.util.Map对象,其中包含要拆解的PDF文档
    • 一个com.adobe.livecycle.assembler.client.AssemblerOptionSpec对象,它指定运行时选项,包括默认字体和作业日志级别

    invokeDDX方法返回一个com.adobe.livecycle.assembler.client.AssemblerResult对象,其中包含已拆卸的PDF文档和发生的任何异常。

  7. 保存已拆解的PDF文档。

    要获取已拆解的PDF文档,请执行以下操作:

    • 调用AssemblerResult对象的getDocuments方法。 这返回一个java.util.Map对象。
    • 遍历java.util.Map对象,直到找到生成的com.adobe.idp.Document对象。
    • 调用com.adobe.idp.Document对象的copyToFile方法以提取PDF文档。

另请参阅

以编程方式反汇编PDF文档

快速开始(SOAP模式):使用Java API反汇编PDF文档

包括AEM Forms Java库文件

设置连接属性

使用Web服务API拆解PDF文档

使用Assembler Service API(Web服务)反汇编PDF文档:

  1. 包括项目文件。

    创建使用MTOM的Microsoft .NET项目。 请确保在设置服务引用时使用以下WSDL定义:http://localhost:8080/soap/services/AssemblerService?WSDL&lc_version=9.0.1

    注意

    localhost替换为承载AEM Forms的服务器的IP地址。

  2. 创建PDF Assembler客户端。

    • 使用AssemblerServiceClient对象的默认构造函数创建一个对象。

    • 使用System.ServiceModel.EndpointAddress构造函数创建AssemblerServiceClient.Endpoint.Address对象。 将指定WSDL的字符串值传递给AEM Forms服务(例如http://localhost:8080/soap/services/AssemblerService?blob=mtom)。 您无需使用lc_version属性。 在创建服务引用时使用此属性。

    • 通过获取AssemblerServiceClient.Endpoint.Binding字段的值,创建System.ServiceModel.BasicHttpBinding对象。 将返回值转换为BasicHttpBinding

    • System.ServiceModel.BasicHttpBinding对象的MessageEncoding字段设置为WSMessageEncoding.Mtom。 此值确保使用MTOM。

    • 通过执行以下任务,启用基本HTTP身份验证:

      • 为字段AssemblerServiceClient.ClientCredentials.UserName.UserName指定AEM表单用户名。
      • 为字段AssemblerServiceClient.ClientCredentials.UserName.Password分配相应的密码值。
      • 将常量值HttpClientCredentialType.Basic赋给字段BasicHttpBindingSecurity.Transport.ClientCredentialType
      • 将常量值BasicHttpSecurityMode.TransportCredentialOnly赋给字段BasicHttpBindingSecurity.Security.Mode
  3. 引用现有DDX文档。

    • 使用BLOB对象的构造函数创建对象。 BLOB对象用于存储DDX文档。
    • 通过调用其构造函数创建System.IO.FileStream对象。 传递一个字符串值,它表示DDX文档的文件位置以及打开文件的模式。
    • 创建一个字节数组,用于存储System.IO.FileStream对象的内容。 可以通过获取System.IO.FileStream对象的Length属性来确定字节数组的大小。
    • 通过调用System.IO.FileStream对象的Read方法并传递要读取的字节数组、开始位置和流长度,用流数据填充字节数组。
    • 通过将MTOM属性赋予字节数组的内容,填充BLOB对象。
  4. 参考PDF文档以反汇编。

    • 使用BLOB对象的构造函数创建对象。 BLOB对象用于存储输入的PDF文档。 此BLOB对象作为参数传递给invokeOneDocument
    • 通过调用System.IO.FileStream对象的构造函数并传递一个字符串值,该字符串值表示输入PDF文档的文件位置以及打开文件的模式。
    • 创建一个字节数组,用于存储System.IO.FileStream对象的内容。 可以通过获取System.IO.FileStream对象的Length属性来确定字节数组的大小。
    • 通过调用System.IO.FileStream对象的Read方法并传递要读取的字节数组、开始位置和流长度,用流数据填充字节数组。
    • 通过为MTOM字段指定字节数组的内容来填充BLOB对象。
    • 创建MyMapOf_xsd_string_To_xsd_anyType对象。 此集合对象用于存储要反汇编的PDF。
    • 创建MyMapOf_xsd_string_To_xsd_anyType_Item对象。
    • MyMapOf_xsd_string_To_xsd_anyType_Item对象的key字段指定表示键名的字符串值。 此值必须与在DDX文档中指定的PDF源元素的值匹配。
    • 将存储PDF文档的BLOB对象指定到MyMapOf_xsd_string_To_xsd_anyType_Item对象的value字段。
    • MyMapOf_xsd_string_To_xsd_anyType_Item对象添加到MyMapOf_xsd_string_To_xsd_anyType对象。 调用MyMapOf_xsd_string_To_xsd_anyType对象' Add方法并传递MyMapOf_xsd_string_To_xsd_anyType对象。
  5. 设置运行时选项。

    • 使用AssemblerOptionSpec的构造函数创建存储运行时选项的对象。
    • 通过为属于AssemblerOptionSpec对象的数据成员分配一个值,设置运行时选项以满足您的业务需求。 例如,要指示Assembler服务在发生错误时继续处理作业,请将false分配给AssemblerOptionSpec对象的failOnError字段。
  6. 反汇编PDF文档。

    调用AssemblerServiceClient对象的invokeDDX方法并传递以下值:

    • 一个BLOB对象,它表示分解PDF文档的DDX文档
    • 包含要反汇编的PDF文档的MyMapOf_xsd_string_To_xsd_anyType对象
    • 指定运行时选项的AssemblerOptionSpec对象

    invokeDDX方法返回一个AssemblerResult对象,其中包含作业结果和发生的任何异常。

  7. 保存已拆解的PDF文档。

    要获取新创建的PDF文档,请执行以下操作:

    • 访问AssemblerResult对象的documents字段,该字段是包含已拆解的PDF文档的Map对象。
    • 循环访问Map对象以获得每个生成文档。 然后,将该数组成员的value转换为BLOB
    • 通过访问PDF文档的BLOB对象的MTOM属性提取表示PDF数据的二进制数据。 这将返回可写入PDF文件的字节数组。

另请参阅

以编程方式反汇编PDF文档

使用MTOM调用AEM Forms

On this page

Adobe Maker Awards Banner

Time to shine!

Apply now for the 2021 Adobe Experience Maker Awards.

Apply now
Adobe Maker Awards Banner

Time to shine!

Apply now for the 2021 Adobe Experience Maker Awards.

Apply now