确定文档是否符合PDF/A规范

您可以使用Assembler服务确定PDF文档是否符合PDF/A规范。 PDF/A文档作为存档格式存在,用于长期保留文档的内容。 字体嵌入在文档中,且文件未压缩。 因此,PDF/A文档通常大于标准PDF文档。 此外,PDF/A文档不包含音频和视频内容。

PDF/A-1规范由两个符合性级别组成,即A和B。两个级别之间的主要区别是逻辑结构(辅助功能)支持,这是符合性级别B不需要的。无论符合性级别如何,PDF/A-1都指示所有字体都嵌入到生成的PDF/A文档中。 目前,验证(和转换)只支持PDF/A-1b。

在此讨论中,假定使用以下DDX文档。

 <?xml version="1.0" encoding="UTF-8"?> 
 <DDX xmlns="https://ns.adobe.com/DDX/1.0/"> 
         <DocumentInformation source="Loan.pdf" result="Loan_result.xml"> 
         <PDFAValidation compliance="PDF/A-1b" resultLevel="Detailed"                       ignoreUnusedResources="true" allowCertificationSignatures="true" /> 
     </DocumentInformation> 
 </DDX>

在此DDX文档中,DocumentInformation元素指示Assembler服务返回有关输入PDF文档的信息。 在DocumentInformation元素中,PDFAValidation元素指示Assembler服务指示输入的PDF文档是否与PDF/A兼容。

Assembler服务返回一个信息,该信息指定输入的PDF文档在包含PDFAConformance元素的XML文档中是否与PDF/A兼容。 如果输入的PDF文档符合PDF/A规范,则PDFAConformance元素的isCompliant属性的值为true。 如果PDF文档不符合PDF/A规范,则PDFAConformance元素的isCompliant属性的值为false

注意

由于本节中指定的DDX文档包含DocumentInformation元素,Assembler服务返回XML数据而非PDF文档。 即,Assembler服务不会汇编或反汇编PDF文档;它返回有关XML文档中输入的PDF文档的信息。

注意

有关Assembler服务的详细信息,请参阅AEM Forms的服务参考

注意

有关DDX文档的详细信息,请参阅Assembler Service和DDX Reference

步骤的摘要

要确定PDF文档是否符合PDF/A规范,请执行以下任务:

  1. 包括项目文件。
  2. 创建PDF Assembler客户端。
  3. 引用现有DDX文档。
  4. 参考用于确定PDF/A兼容性的PDF文档。
  5. 设置运行时选项。
  6. 检索有关PDF文档的信息。
  7. 保存返回的XML文档。

包括项目文件

在开发项目中包含必要的文件。 如果要使用Java创建客户端应用程序,请包含必要的JAR文件。 如果您使用Web服务,请确保包含代理文件。

必须将以下JAR文件添加到项目的类路径中:

  • adobe-livecycle-client.jar
  • adobe-usermanager-client.jar
  • adobe-assembler-client.jar
  • adobe-utilities.jar(在JBoss上部署AEM Forms时为必需)
  • jbossall-client.jar(如果在JBoss上部署了AEM Forms,则为必需)

如果AEM Forms部署在JBoss以外的受支持的J2EE应用程序服务器上,则必须将adobe-utilities.jar和jbossall-client.jar文件替换为特定于AEM Forms部署在的J2EE应用程序服务器的JAR文件。 有关所有AEM Forms JAR文件位置的信息,请参阅包括AEM Forms Java库文件

创建PDF Assembler客户端

在以编程方式执行Assembler操作之前,必须创建Assembler服务客户端。

引用现有DDX文档

必须引用DDX文档才能执行Assembler服务操作。 要确定输入的PDF文档是否符合PDF/A规范,请确保DDX文档包含DocumentInformation元素中的PDFAValidation元素。 PDFAValidation元素指示Assembler服务返回一个XML文档,该XML文档指定输入的PDF是否与PDF/A兼容。

参考用于确定PDF/A兼容性的PDF文档

必须引用PDF文档并将其传递给Assembler服务,以确定PDF文档是否符合PDF/A规范。

设置运行时选项

您可以设置运行时选项,以在Assembler服务执行作业时控制其行为。 例如,您可以设置一个选项,指示Assembler服务在遇到错误时继续处理作业。 有关可以设置的运行时选项的信息,请参阅AEM Forms API Reference中的AssemblerOptionSpec类引用。

检索有关PDF文档的信息

创建Assembler服务客户端后,请引用DDX文档、引用交互式PDF文档并设置运行时选项,您可以调用invokeDDX操作。 由于DDX文档包含DocumentInformation元素,Assembler服务返回XML数据而非PDF文档。

保存返回的XML文档

Assembler服务返回的XML文档指定输入的PDF文档是否与PDF/A兼容。 例如,如果输入的PDF文档与PDF/A不兼容,Assembler服务将返回一个包含以下元素的XML文档:

 <PDFAConformance isCompliant="false" compliance="PDF/A-1b" resultLevel="Detailed" ignoreUnusedResources="true" allowCertificationSignatures="true">

将XML文档另存为XML文件,以便打开文件并视图结果。

另请参阅

使用Java API确定文档是否符合PDF/A规范

使用Web服务API确定文档是否符合PDF/A规范

包括AEM Forms Java库文件

设置连接属性

以编程方式组合PDF文档

使用Java API确定文档是否符合PDF/A规范

通过使用Assembler Service API(Java)确定PDF文档是否符合PDF/A规范:

  1. 包括项目文件。

    在Java项目的类路径中包含客户端JAR文件,如adobe-assembler-client.jar。

  2. 创建PDF Assembler客户端。

    • 创建包含连接属性的ServiceClientFactory对象。
    • 使用AssemblerServiceClient对象的构造函数并传递ServiceClientFactory对象,创建对象。
  3. 引用现有DDX文档。

    • 使用DDX文档的构造函数并传递一个指定DDX文件位置的字符串值,创建一个表示DDX文件的java.io.FileInputStream对象。 要确定PDF文档是否符合PDF/A规范,请确保DDX文档包含PDFAValidation元素,该元素包含在DocumentInformation元素中。
    • 使用com.adobe.idp.Document对象的构造函数并传递java.io.FileInputStream对象,创建对象。
  4. 参考用于确定PDF/A兼容性的PDF文档。

    • 使用java.io.FileInputStream对象的构造函数创建一个对象,并传递用于确定PDF/A规范的PDF文档的位置。

    • 通过使用其构造函数并传递包含PDF文档的java.io.FileInputStream对象,创建com.adobe.idp.Document对象。

    • 使用HashMap构造函数创建用于存储输入PDF文档的java.util.Map对象。

    • 通过调用put方法并传递以下参数,向java.util.Map对象添加一个条目:

      • 表示键名的字符串值。 此值必须与在DDX文档中指定的源元素的值匹配。 例如,本节介绍的DDX文档中的源元素的值为Loan.pdf。
      • 包含输入PDF文档的com.adobe.idp.Document对象。
  5. 设置运行时选项。

    • 使用AssemblerOptionSpec的构造函数创建存储运行时选项的对象。
    • 通过调用属于AssemblerOptionSpec对象的方法,设置运行时选项以满足您的业务要求。 例如,要指示Assembler服务在发生错误时继续处理作业,请调用AssemblerOptionSpec对象的setFailOnError方法并传递false
  6. 检索有关PDF文档的信息。

    调用AssemblerServiceClient对象的invokeDDX方法并传递以下必需值:

    • 一个com.adobe.idp.Document对象,它表示要使用的DDX文档
    • 一个java.util.Map对象,其中包含用于确定PDF/A兼容性的输入PDF文件
    • 指定运行时选项的com.adobe.livecycle.assembler.client.AssemblerOptionSpec对象

    invokeDDX方法返回一个com.adobe.livecycle.assembler.client.AssemblerResult对象,该对象包含指定输入PDF文档是否与PDF/A兼容的XML数据。

  7. 保存返回的XML文档。

    要获取指定输入PDF文档是否为PDF/A文档的XML数据,请执行以下操作:

    • 调用AssemblerResult对象的getDocuments方法。 这返回一个java.util.Map对象。
    • 遍历java.util.Map对象,直到找到生成的com.adobe.idp.Document对象。
    • 调用com.adobe.idp.Document对象的copyToFile方法以提取XML文档。 确保将XML数据另存为XML文件。

另请参阅

快速开始(SOAP模式):使用Java API(SOAP模式)确定文档是否符合 PDF/A规范

包括AEM Forms Java库文件

设置连接属性

使用Web服务API确定文档是否符合PDF/A规范

通过使用Assembler Service API(Web服务)确定PDF文档是否符合PDF/A规范:

  1. 包括项目文件。

    创建使用MTOM的Microsoft .NET项目。 确保使用以下WSDL定义:http://localhost:8080/soap/services/AssemblerService?WSDL&lc_version=9.0.1

    注意

    localhost替换为承载AEM Forms的服务器的IP地址。

  2. 创建PDF Assembler客户端。

    • 使用AssemblerServiceClient对象的默认构造函数创建一个对象。

    • 使用System.ServiceModel.EndpointAddress构造函数创建AssemblerServiceClient.Endpoint.Address对象。 将指定WSDL的字符串值传递给AEM Forms服务(例如http://localhost:8080/soap/services/AssemblerService?blob=mtom)。 您无需使用lc_version属性。 此属性在您创建服务引用时使用。)

    • 通过获取AssemblerServiceClient.Endpoint.Binding字段的值,创建System.ServiceModel.BasicHttpBinding对象。 将返回值转换为BasicHttpBinding

    • System.ServiceModel.BasicHttpBinding对象的MessageEncoding字段设置为WSMessageEncoding.Mtom。 此值确保使用MTOM。

    • 通过执行以下任务,启用基本HTTP身份验证:

      • 为字段AssemblerServiceClient.ClientCredentials.UserName.UserName指定AEM表单用户名。
      • 为字段AssemblerServiceClient.ClientCredentials.UserName.Password分配相应的密码值。
      • 将常量值HttpClientCredentialType.Basic赋给字段BasicHttpBindingSecurity.Transport.ClientCredentialType
      • 将常量值BasicHttpSecurityMode.TransportCredentialOnly赋给字段BasicHttpBindingSecurity.Security.Mode
  3. 引用现有DDX文档。

    • 使用BLOB对象的构造函数创建对象。 BLOB对象用于存储DDX文档。
    • 通过调用System.IO.FileStream对象的构造函数并传递一个字符串值,该字符串值表示DDX文档的文件位置以及在中打开文件的模式。
    • 创建一个字节数组,用于存储System.IO.FileStream对象的内容。 可以通过获取System.IO.FileStream对象的Length属性来确定字节数组的大小。
    • 通过调用System.IO.FileStream对象的Read方法并传递要读取的字节数组、开始位置和流长度,用流数据填充字节数组。
    • BLOB对象的MTOM字段指定为字节数组的内容,从而填充该对象。
  4. 参考用于确定PDF/A兼容性的PDF文档。

    • 使用BLOB对象的构造函数创建对象。 BLOB对象用于存储输入的PDF文档。
    • 通过调用System.IO.FileStream对象的构造函数并传递一个字符串值,该字符串值表示输入PDF文档的文件位置以及打开文件的模式。
    • 创建一个字节数组,用于存储System.IO.FileStream对象的内容。 可以通过获取System.IO.FileStream对象的Length属性来确定字节数组的大小。
    • 通过调用System.IO.FileStream对象的Read方法并传递要读取的字节数组、开始位置和流长度,用流数据填充字节数组。
    • 通过将MTOM属性赋予字节数组的内容,填充BLOB对象。
    • 创建MyMapOf_xsd_string_To_xsd_anyType对象。 此集合对象用于存储PDF文档。
    • 创建MyMapOf_xsd_string_To_xsd_anyType_Item对象。
    • MyMapOf_xsd_string_To_xsd_anyType_Item对象的key字段指定表示键名的字符串值。 此值必须与在DDX文档中指定的PDF源元素的值匹配。
    • 将存储PDF文档的BLOB对象指定到MyMapOf_xsd_string_To_xsd_anyType_Item对象的value字段。
    • MyMapOf_xsd_string_To_xsd_anyType_Item对象添加到MyMapOf_xsd_string_To_xsd_anyType对象。 调用MyMapOf_xsd_string_To_xsd_anyType对象' Add方法并传递MyMapOf_xsd_string_To_xsd_anyType对象。
  5. 设置运行时选项。

    • 使用AssemblerOptionSpec的构造函数创建存储运行时选项的对象。
    • 通过为属于AssemblerOptionSpec对象的数据成员分配一个值,设置运行时选项以满足您的业务需求。 例如,要指示Assembler服务在发生错误时继续处理作业,请将false分配给AssemblerOptionSpec对象的failOnError数据成员。
  6. 检索有关PDF文档的信息。

    调用AssemblerServiceService对象的invoke方法并传递以下值:

    • 表示DDX文档的BLOB对象。
    • 包含输入PDF文档的MyMapOf_xsd_string_To_xsd_anyType对象。 其键必须与PDF源文件的名称匹配,其值必须是与输入PDF文件对应的BLOB对象。
    • 指定运行时选项的AssemblerOptionSpec对象。

    invoke方法返回一个AssemblerResult对象,该对象包含指定输入PDF文档是否为PDF/A文档的XML数据。

  7. 保存返回的XML文档。

    要获取指定输入PDF文档是否为PDF/A文档的XML数据,请执行以下操作:

    • 访问AssemblerResult对象的documents字段,该字段是一个Map对象,其中包含指定输入PDF文档是否为PDF/A文档的XML数据。
    • 循环访问Map对象以获得每个生成文档。 然后,将该数组成员的值转换为BLOB
    • 通过访问XML数据的BLOB对象的MTOM字段提取表示XML数据的二进制数据。 此字段存储可以作为XML文件写入的字节数组。

另请参阅

使用MTOM调用AEM Forms

On this page

Adobe Summit Banner

A virtual event April 27-28.

Expand your skills and get inspired.

Register for free
Adobe Summit Banner

A virtual event April 27-28.

Expand your skills and get inspired.

Register for free
Adobe Maker Awards Banner

Time to shine!

Apply now for the 2021 Adobe Experience Maker Awards.

Apply now
Adobe Maker Awards Banner

Time to shine!

Apply now for the 2021 Adobe Experience Maker Awards.

Apply now