您可以将PDF文档反汇编到Assembler服务。 通常,当PDF任务最初是从许多单独的文档(如语句集合)创建时,此文档很有用。 在下图中,DocA被划分为多个生成文档,其中页面上的第一级书签标识新生成文档的开始。
要反汇编PDF文档,请确保PDFsFromBookmarks
元素位于DDX文档中。 PDFsFromBookmarks
元素是生成元素,只能是DDX
元素的子元素。 它没有result
属性,因为它可能导致生成多个文档。
PDFsFromBookmarks
元素导致为源文档中的每个1级书签生成单个文档。
在本讨论中,假定使用以下DDX文档。
<?xml version="1.0" encoding="UTF-8"?>
<DDX xmlns="https://ns.adobe.com/DDX/1.0/">
<PDFsFromBookmarks prefix="stmt">
<PDF source="AssemblerResultPDF.pdf"/>
</PDFsFromBookmarks>
</DDX>
在阅读本节之前,建议您熟悉使用Assembler服务来汇编PDF文档。 (请参阅以编程方式组合PDF文档。)
将单个PDF文档传递到Assembler服务并返回单个文档时,可以调用invokeOneDocument
操作。 但是,要反汇编PDF文档,请使用invokeDDX
操作,因为尽管一个输入的PDF文档被传递给Assembler服务,Assembler服务返回一个包含一个或多个文档的集合对象。
有关Assembler服务的详细信息,请参阅AEM Forms的服务参考。
有关DDX文档的详细信息,请参阅Assembler Service和DDX Reference。
要反汇编PDF文档,请执行以下任务:
包括项目文件
在开发项目中包含必要的文件。 如果您使用Java创建客户端应用程序,请包含必要的JAR文件。 如果您使用Web服务,请确保包含代理文件。
必须将以下JAR文件添加到项目的类路径中:
如果AEM Forms部署在非JBoss的受支持J2EE应用程序服务器上,则必须将adobe-utilities.jar和jbossall-client.jar替换为特定于部署了AEM Forms的J2EE应用程序服务器的JAR文件。
创建PDF Assembler客户端
在以编程方式执行Assembler操作之前,必须创建Assembler服务客户端。
引用现有DDX文档
必须引用DDX文档以反汇编PDF文档。 此DDX文档必须包含PDFsFromBookmarks
元素。
参考PDF文档进行反汇编
要反汇编PDF文档,请参考表示要反汇编的PDF文档的PDF文件。 传递到Assembler服务时,将为文档中的每个1级书签返回单独的PDF文档。
设置运行时选项
您可以设置运行时选项,这些选项在Assembler服务执行作业时控制其行为。 例如,您可以设置一个选项,指示Assembler服务在遇到错误时继续处理作业。
反汇编PDF文档
在创建Assembler服务客户端、引用DDX文档、引用PDF文档进行反汇编并设置运行时选项后,可以通过调用invokeDDX
方法来反汇编PDF文档。 如果DDX文档包含反汇编PDF文档的说明,则汇编服务会在集合对象中返回已分解的PDF文档。
保存已拆卸的PDF文档
所有已拆卸的PDF文档都会在集合对象中返回。 对集合对象进行迭代,并将每个PDF文档另存为PDF文件。
另请参阅
使用Assembler Service API(Java)反汇编PDF文档:
包括项目文件。
在Java项目的类路径中包含客户端JAR文件,如adobe-assembler-client.jar。
创建PDF Assembler客户端。
ServiceClientFactory
对象。AssemblerServiceClient
对象的构造函数创建ServiceClientFactory
对象。引用现有DDX文档。
java.io.FileInputStream
对象。com.adobe.idp.Document
对象的构造函数并传递java.io.FileInputStream
对象,创建对象。参考PDF文档进行反汇编。
使用HashMap
构造函数创建用于存储输入PDF文档的java.util.Map
对象。
使用java.io.FileInputStream
对象的构造函数创建一个对象,并将PDF文档的位置传递给反汇编。
创建com.adobe.idp.Document
对象,并将包含PDF文档的java.io.FileInputStream
对象传递给反汇编。
通过调用put
方法并传递以下参数,向java.util.Map
对象添加一个条目:
com.adobe.idp.Document
对象,它包含要反汇编的PDF文档。设置运行时选项。
AssemblerOptionSpec
对象。AssemblerOptionSpec
对象的方法,设置运行时选项以满足业务要求。 例如,要指示Assembler服务在出现错误时继续处理作业,请调用AssemblerOptionSpec
对象的setFailOnError
方法并传递false
。反汇编PDF文档。
调用AssemblerServiceClient
对象的invokeDDX
方法并传递以下必需值:
com.adobe.idp.Document
对象,它表示要使用的DDX文档java.util.Map
对象com.adobe.livecycle.assembler.client.AssemblerOptionSpec
对象,它指定运行时选项,包括默认字体和作业日志级别invokeDDX
方法返回一个com.adobe.livecycle.assembler.client.AssemblerResult
对象,其中包含已分解的PDF文档和发生的任何异常。
保存已拆解的PDF文档。
要获取已分解的PDF文档,请执行以下操作:
AssemblerResult
对象的getDocuments
方法。 这将返回java.util.Map
对象。java.util.Map
对象进行迭代,直到找到生成的com.adobe.idp.Document
对象。com.adobe.idp.Document
对象的copyToFile
方法以提取PDF文档。另请参阅
快速开始(SOAP模式):使用Java API反汇编PDF文档
使用Assembler Service API(Web服务)反汇编PDF文档:
包括项目文件。
创建使用MTOM的Microsoft .NET项目。 请确保在设置服务引用时使用以下WSDL定义:http://localhost:8080/soap/services/AssemblerService?WSDL&lc_version=9.0.1
。
将localhost
替换为承载AEM Forms的服务器的IP地址。
创建PDF Assembler客户端。
使用其默认构造函数创建AssemblerServiceClient
对象。
使用System.ServiceModel.EndpointAddress
构造函数创建AssemblerServiceClient.Endpoint.Address
对象。 将指定WSDL的字符串值传递给AEM Forms服务(例如http://localhost:8080/soap/services/AssemblerService?blob=mtom
)。 您无需使用lc_version
属性。 此属性在您创建服务引用时使用。
通过获取AssemblerServiceClient.Endpoint.Binding
字段的值创建System.ServiceModel.BasicHttpBinding
对象。 将返回值转换为BasicHttpBinding
。
将System.ServiceModel.BasicHttpBinding
对象的MessageEncoding
字段设置为WSMessageEncoding.Mtom
。 此值确保使用MTOM。
通过执行以下任务启用基本HTTP身份验证:
AssemblerServiceClient.ClientCredentials.UserName.UserName
指定AEM表单用户名。AssemblerServiceClient.ClientCredentials.UserName.Password
分配相应的口令值。HttpClientCredentialType.Basic
指定到字段BasicHttpBindingSecurity.Transport.ClientCredentialType
。BasicHttpSecurityMode.TransportCredentialOnly
指定到字段BasicHttpBindingSecurity.Security.Mode
。引用现有DDX文档。
BLOB
对象的构造函数创建对象。 BLOB
对象用于存储DDX文档。System.IO.FileStream
对象。 传递一个字符串值,它表示DDX文档的文件位置以及打开文件的模式。System.IO.FileStream
对象内容的字节数组。 通过获取System.IO.FileStream
对象的Length
属性,可以确定字节数组的大小。System.IO.FileStream
对象的Read
方法并传递要读取的字节数组、开始位置和流长度,用流数据填充字节数组。MTOM
对象的属性指定字节数组的内容,填充BLOB
对象。参考PDF文档进行反汇编。
BLOB
对象的构造函数创建对象。 BLOB
对象用于存储输入的PDF文档。 此BLOB
对象作为参数传递给invokeOneDocument
。System.IO.FileStream
对象的构造函数并传递一个字符串值,该字符串值表示输入PDF文档的文件位置以及打开文件的模式。System.IO.FileStream
对象内容的字节数组。 通过获取System.IO.FileStream
对象的Length
属性,可以确定字节数组的大小。System.IO.FileStream
对象的Read
方法并传递要读取的字节数组、开始位置和流长度,用流数据填充字节数组。MTOM
字段分配字节数组的内容,填充BLOB
对象。MyMapOf_xsd_string_To_xsd_anyType
对象。 此集合对象用于存储要反汇编的PDF。MyMapOf_xsd_string_To_xsd_anyType_Item
对象。MyMapOf_xsd_string_To_xsd_anyType_Item
对象的key
字段指定表示键名的字符串值。 此值必须与在DDX文档中指定的PDF源元素值匹配。BLOB
对象分配给MyMapOf_xsd_string_To_xsd_anyType_Item
对象的value
字段。MyMapOf_xsd_string_To_xsd_anyType_Item
对象添加到MyMapOf_xsd_string_To_xsd_anyType
对象。 调用MyMapOf_xsd_string_To_xsd_anyType
对象Add
方法并传递MyMapOf_xsd_string_To_xsd_anyType
对象。设置运行时选项。
AssemblerOptionSpec
对象。AssemblerOptionSpec
对象的数据成员分配一个值,设置运行时选项以满足您的业务要求。 例如,要指示Assembler服务在出现错误时继续处理作业,请将false
分配给AssemblerOptionSpec
对象的failOnError
字段。反汇编PDF文档。
调用AssemblerServiceClient
对象的invokeDDX
方法并传递以下值:
BLOB
对象,它表示分解PDF文档的DDX文档MyMapOf_xsd_string_To_xsd_anyType
对象AssemblerOptionSpec
对象invokeDDX
方法返回一个AssemblerResult
对象,该对象包含作业结果和发生的任何异常。
保存已拆解的PDF文档。
要获取新创建的PDF文档,请执行以下操作:
AssemblerResult
对象的documents
字段,该字段是一个Map
对象,包含已拆解的PDF文档。Map
对象进行迭代以获得每个生成文档。 然后,将该数组成员的value
转换为BLOB
。BLOB
对象的MTOM
属性,提取表示PDF数据的二进制数据。 这将返回可写入PDF文件的字节数组。另请参阅