本文档中的示例和示例仅适用于AEM Forms on JEE环境。
通过将PDF文档传递给Assembler服务,可以分解文档。 通常,当PDF文档最初由许多单个文档(如语句集合)创建时,此任务非常有用。 在下图中,DocA被分为多个结果文档,其中页面上的第一个级别1书签标识了新结果文档的开始。
要拆分PDF文档,请确保 PDFsFromBookmarks
元素位于DDX文档中。 此 PDFsFromBookmarks
元素是一个结果元素,并且只能是 DDX
元素。 它没有 result
属性,因为它可能导致生成多个文档。
此 PDFsFromBookmarks
元素导致为源文档中的每个1级书签生成一个文档。
为了进行此讨论,假定使用以下DDX文档。
<?xml version="1.0" encoding="UTF-8"?>
<DDX xmlns="https://ns.adobe.com/DDX/1.0/">
<PDFsFromBookmarks prefix="stmt">
<PDF source="AssemblerResultPDF.pdf"/>
</PDFsFromBookmarks>
</DDX>
在阅读本节之前,建议您熟悉使用Assembler服务组合PDF文档。 (请参阅 以编程方式组合PDF文档.)
将单个PDF文档传递到Assembler服务并取回单个文档时,您可以调用 invokeOneDocument
操作。 但是,要拆分PDF文档,请使用 invokeDDX
操作的原因是,虽然一个输入PDF文档被传递到Assembler服务,但Assembler服务返回包含一个或多个文档的集合对象。
有关汇编程序服务的详细信息,请参见 AEM Forms的服务参考.
有关DDX文档的详细信息,请参见 汇编程序服务和DDX参考.
要拆分PDF文档,请执行以下任务:
包括项目文件
在开发项目中包含必要的文件。 如果要使用Java创建客户端应用程序,请包含必要的JAR文件。 如果使用Web服务,请确保包含代理文件。
必须将以下JAR文件添加到项目的类路径中:
如果将AEM Forms部署在非JBoss的受支持J2EE应用程序服务器上,则必须将adobe-utilities.jar和jbossall-client.jar替换为特定于部署AEM Forms的J2EE应用程序服务器的JAR文件。
创建PDF汇编程序客户端
必须先创建一个Assembler服务客户端,然后才能以编程方式执行Assembler操作。
引用现有DDX文档
要拆分PDF文档,必须引用DDX文档。 此DDX文档必须包含 PDFsFromBookmarks
元素。
引用要拆解的PDF文档
要拆分PDF文档,请引用表示要拆分PDF文档的PDF文件。 当传递到Assembler服务时,会为文档中的每个1级书签返回一个单独的PDF文档。
设置运行时选项
您可以设置运行时选项,以控制Assembler服务执行作业时的行为。 例如,您可以设置一个选项,指示汇编程序服务在遇到错误时继续处理作业。
拆分PDF文档
创建Assembler服务客户端、引用DDX文档、引用PDFPDF文档进行拆分,并设置运行时选项后,可通过调用 invokeDDX
方法。 只要DDX文档包含拆分PDF文档的指令,Assembler服务就会返回收集对象中已拆解的PDF文档。
保存已拆解的PDF文档
所有已拆解的PDF文档都会在集合对象中返回。 循环访问集合对象并将每个PDF文档另存为PDF文件。
另请参阅
使用Assembler服务API (Java)拆分PDF文档:
包括项目文件。
在Java项目的类路径中包含客户端JAR文件,例如adobe-assembler-client.jar。
创建PDF汇编程序客户端。
ServiceClientFactory
包含连接属性的对象。AssemblerServiceClient
对象,使用它的构造函数传递 ServiceClientFactory
对象。引用现有DDX文档。
java.io.FileInputStream
对象,通过使用其构造函数并传递指定DDX文件位置的字符串值来表示DDX文档。com.adobe.idp.Document
对象,使用它的构造函数传递 java.io.FileInputStream
对象。引用要拆解的PDF文档。
创建 java.util.Map
用于存储输入PDF文档的对象 HashMap
构造函数。
创建 java.io.FileInputStream
对象通过构造函数传递PDF文件的位置进行拆分。
创建 com.adobe.idp.Document
对象并传递 java.io.FileInputStream
包含要拆解的PDF文档的对象。
将条目添加到 java.util.Map
对象,调用其 put
方法,并传递以下参数:
com.adobe.idp.Document
包含要拆解的PDF文档的对象。设置运行时选项。
AssemblerOptionSpec
使用其构造函数存储运行时选项的对象。AssemblerOptionSpec
对象。 例如,要指示Assembler服务在发生错误时继续处理作业,请调用 AssemblerOptionSpec
对象的 setFailOnError
方法和路径 false
.拆分PDF文档。
调用 AssemblerServiceClient
对象的 invokeDDX
方法,并传递以下必需值:
com.adobe.idp.Document
表示要使用的DDX文档的对象java.util.Map
包含要拆解的PDF文档的对象com.adobe.livecycle.assembler.client.AssemblerOptionSpec
指定运行时选项(包括默认字体和作业日志级别)的对象此 invokeDDX
方法返回 com.adobe.livecycle.assembler.client.AssemblerResult
包含已拆卸PDF文档和发生的任何异常的对象。
保存已拆解的PDF文档。
要获取已拆解的PDF文档,请执行以下步骤:
AssemblerResult
对象的 getDocuments
方法。 这会返回 java.util.Map
对象。java.util.Map
对象,直到找到结果 com.adobe.idp.Document
对象。com.adobe.idp.Document
对象的 copyToFile
用于提取PDF文档的方法。另请参阅
快速入门(SOAP模式):使用Java API反汇编PDF文档
使用Assembler服务API(Web服务)拆分PDF文档:
包括项目文件。
创建使用MTOM的Microsoft .NET项目。 在设置服务引用时,请确保使用以下WSDL定义: http://localhost:8080/soap/services/AssemblerService?WSDL&lc_version=9.0.1
.
Replace localhost
包含托管AEM Forms的服务器的IP地址。
创建PDF汇编程序客户端。
创建 AssemblerServiceClient
对象。
创建 AssemblerServiceClient.Endpoint.Address
对象 System.ServiceModel.EndpointAddress
构造函数。 将指定WSDL的字符串值传递给AEM Forms服务(例如, http://localhost:8080/soap/services/AssemblerService?blob=mtom
)。 您无需使用 lc_version
属性。 创建服务引用时使用此属性。
创建 System.ServiceModel.BasicHttpBinding
对象,方法是获取 AssemblerServiceClient.Endpoint.Binding
字段。 将返回值强制转换为 BasicHttpBinding
.
设置 System.ServiceModel.BasicHttpBinding
对象的 MessageEncoding
字段至 WSMessageEncoding.Mtom
. 此值可确保使用MTOM。
通过执行以下任务启用基本HTTP身份验证:
AssemblerServiceClient.ClientCredentials.UserName.UserName
.AssemblerServiceClient.ClientCredentials.UserName.Password
.HttpClientCredentialType.Basic
到字段 BasicHttpBindingSecurity.Transport.ClientCredentialType
.BasicHttpSecurityMode.TransportCredentialOnly
到字段 BasicHttpBindingSecurity.Security.Mode
.引用现有DDX文档。
BLOB
对象。 此 BLOB
对象用于存储DDX文档。System.IO.FileStream
对象。 传递一个字符串值,该值表示DDX文档的文件位置和打开文件的模式。System.IO.FileStream
对象。 您可以通过获取 System.IO.FileStream
对象的 Length
属性。System.IO.FileStream
对象的 Read
方法,并传递字节数组、起始位置和要读取的流长度。BLOB
对象(通过指定其 MTOM
属性与字节数组的内容。引用要拆解的PDF文档。
BLOB
对象。 此 BLOB
对象用于存储输入PDF文档。 此 BLOB
对象传递到 invokeOneDocument
作为论据。System.IO.FileStream
对象,方法是调用其构造函数并传递一个字符串值,该字符串值表示输入PDF文档的文件位置和打开文件的模式。System.IO.FileStream
对象。 您可以通过获取 System.IO.FileStream
对象的 Length
属性。System.IO.FileStream
对象的 Read
方法,并传递字节数组、起始位置和要读取的流长度。BLOB
对象(通过指定其 MTOM
字段字节数组的内容。MyMapOf_xsd_string_To_xsd_anyType
对象。 此集合对象用于存储要拆解的PDF。MyMapOf_xsd_string_To_xsd_anyType_Item
对象。MyMapOf_xsd_string_To_xsd_anyType_Item
对象的 key
字段。 此值必须与DDX文档中指定的PDF源元素的值匹配。BLOB
将PDF文档存储到的对象 MyMapOf_xsd_string_To_xsd_anyType_Item
对象的 value
字段。MyMapOf_xsd_string_To_xsd_anyType_Item
对象 MyMapOf_xsd_string_To_xsd_anyType
对象。 调用 MyMapOf_xsd_string_To_xsd_anyType
对象' Add
方法并传递 MyMapOf_xsd_string_To_xsd_anyType
对象。设置运行时选项。
AssemblerOptionSpec
使用其构造函数存储运行时选项的对象。AssemblerOptionSpec
对象。 例如,要指示Assembler服务在发生错误时继续处理作业,请分配 false
到 AssemblerOptionSpec
对象的 failOnError
字段。拆分PDF文档。
调用 AssemblerServiceClient
对象的 invokeDDX
方法,并传递以下值:
BLOB
表示拆分PDF文档的DDX文档的对象MyMapOf_xsd_string_To_xsd_anyType
包含要拆解的PDF文档的对象AssemblerOptionSpec
指定运行时选项的对象此 invokeDDX
方法返回 AssemblerResult
包含作业结果和发生的任何异常的对象。
保存已拆解的PDF文档。
要获取新创建的PDF文档,请执行以下步骤:
AssemblerResult
对象的 documents
字段,即 Map
包含已拆卸PDF文档的对象。Map
对象以获取每个生成文档。 然后,强制转换该数组成员的 value
到 BLOB
.BLOB
对象的 MTOM
属性。 这会返回一个字节数组,您可以将其写出到PDF文件。另请参阅