确定文档是否符合PDF/A规范

您可以使用Assembler服务确定PDF文档是否符合PDF/A规范。 PDF/A文档以存档格式存在,用于长期保留文档的内容。 字体嵌入在文档中,且文件未压缩。 因此,PDF/A文档通常大于标准PDF文档。 此外,PDF/A文档不包含音频和视频内容。

PDF/A-1规范由两个符合性级别组成,即A和B。两个级别之间的主要区别是逻辑结构(辅助功能)支持,这是符合性级别B所不要求的。无论符合性级别如何,PDF/A-1都指示所有字体嵌入到生成的PDF/A文档中。 目前,验证(和转换)只支持PDF/A-1b。

在本讨论中,假定使用以下DDX文档。

 <?xml version="1.0" encoding="UTF-8"?> 
 <DDX xmlns="https://ns.adobe.com/DDX/1.0/"> 
         <DocumentInformation source="Loan.pdf" result="Loan_result.xml"> 
         <PDFAValidation compliance="PDF/A-1b" resultLevel="Detailed"                       ignoreUnusedResources="true" allowCertificationSignatures="true" /> 
     </DocumentInformation> 
 </DDX>

在此DDX文档中,DocumentInformation元素指示Assembler服务返回有关输入PDF文档的信息。 在DocumentInformation元素中,PDFAValidation元素指示Assembler服务指示输入的PDF文档符合PDF/A标准。

Assembler服务返回的信息指定输入的PDF文档在包含PDFAConformance元素的XML文档中是否符合PDF/A规范。 如果输入的PDF文档符合PDF/A规范,则PDFAConformance元素的isCompliant属性的值为true。 如果PDF文档不符合PDF/A规范,则PDFAConformance元素的isCompliant属性的值为false

注意

由于本节中指定的DDX文档包含DocumentInformation元素,Assembler服务返回XML数据而不是PDF文档。 即,汇编服务不会汇编或反汇编PDF文档;它返回有关XML文档中输入PDF文档的信息。

注意

有关Assembler服务的详细信息,请参阅AEM Forms的服务参考

注意

有关DDX文档的详细信息,请参阅Assembler Service和DDX Reference

步骤的摘要

要确定PDF文档是否符合PDF/A规范,请执行以下任务:

  1. 包括项目文件。
  2. 创建PDF Assembler客户端。
  3. 引用现有DDX文档。
  4. 参考用于确定PDF/A兼容性的PDF文档。
  5. 设置运行时选项。
  6. 检索有关PDF文档的信息。
  7. 保存返回的XML文档。

包括项目文件

在开发项目中包含必要的文件。 如果您使用Java创建客户端应用程序,请包含必要的JAR文件。 如果您使用Web服务,请确保包含代理文件。

必须将以下JAR文件添加到项目的类路径中:

  • adobe-livecycle-client.jar
  • adobe-usermanager-client.jar
  • adobe-assembler-client.jar
  • adobe-utilities.jar(如果AEM Forms部署在JBoss上,则为必需)
  • jbossall-client.jar(如果在JBoss上部署了AEM Forms,则此为必需)

如果AEM Forms部署在JBoss以外的受支持J2EE应用程序服务器上,则必须将adobe-utilities.jar和jbossall-client.jar文件替换为特定于AEM Forms部署的J2EE应用程序服务器的JAR文件。 有关所有AEM FormsJAR文件的位置的信息,请参阅包括AEM FormsJava库文件

创建PDF Assembler客户端

在以编程方式执行Assembler操作之前,必须创建Assembler服务客户端。

引用现有DDX文档

必须引用DDX文档才能执行Assembler服务操作。 要确定输入的PDF文档是否符合PDF/A规范,请确保DDX文档包含DocumentInformation元素中的PDFAValidation元素。 PDFAValidation元素指示Assembler服务返回一个XML文档,它指定输入的PDF文档是否与PDF/A兼容。

参考用于确定PDF/A兼容性的PDF文档

必须引用PDF文档并将其传递给Assembler服务,以确定PDF文档是否符合PDF/A规范。

设置运行时选项

您可以设置运行时选项,这些选项在Assembler服务执行作业时控制其行为。 例如,您可以设置一个选项,指示Assembler服务在遇到错误时继续处理作业。 有关可以设置的运行时选项的信息,请参见AEM FormsAPI参考中的AssemblerOptionSpec类引用。

检索有关PDF文档的信息

在创建Assembler服务客户端、引用DDX文档、引用交互式PDF文档并设置运行时选项后,可以调用invokeDDX操作。 由于DDX文档包含DocumentInformation元素,Assembler服务返回XML数据而不是PDF文档。

保存返回的XML文档

Assembler服务返回的XML文档指定输入的PDF文档是否与PDF/A兼容。 例如,如果输入的PDF文档符不符合PDF/A规范,Assembler服务将返回一个包含以下元素的XML文档符:

 <PDFAConformance isCompliant="false" compliance="PDF/A-1b" resultLevel="Detailed" ignoreUnusedResources="true" allowCertificationSignatures="true">

将XML文档另存为XML文件,以便打开文件并视图结果。

另请参阅

使用Java API确定文档是否符合PDF/A规范

使用Web服务API确定文档是否符合PDF/A规范

包括AEM FormsJava库文件

设置连接属性

以编程方式组合PDF文档

使用Java API确定文档是否符合PDF/A规范

使用Assembler Service API(Java)确定PDF文档是否符合PDF/A规范:

  1. 包括项目文件。

    在Java项目的类路径中包含客户端JAR文件,如adobe-assembler-client.jar。

  2. 创建PDF Assembler客户端。

    • 创建包含连接属性的ServiceClientFactory对象。
    • 使用AssemblerServiceClient对象的构造函数创建ServiceClientFactory对象。
  3. 引用现有DDX文档。

    • 通过使用DDX文档的构造函数并传递一个指定DDX文件位置的字符串值,创建一个表示DDX文件的java.io.FileInputStream对象。 要确定PDF文档是否符合PDF/A规范,请确保DDX文档包含PDFAValidation元素,该元素包含在DocumentInformation元素中。
    • 使用com.adobe.idp.Document对象的构造函数并传递java.io.FileInputStream对象,创建<a0/>对象。
  4. 参考用于确定PDF/A兼容性的PDF文档。

    • 使用java.io.FileInputStream对象的构造函数创建一个<a0/>对象,并传递用于确定PDF/A兼容性的PDF文档的位置。

    • 使用com.adobe.idp.Document对象的构造函数创建java.io.FileInputStream对象,并传递包含PDF文档的<a1/>对象。

    • 使用HashMap构造函数创建用于存储输入PDF文档的java.util.Map对象。

    • 通过调用put方法并传递以下参数,向java.util.Map对象添加一个条目:

      • 表示键名称的字符串值。 此值必须与在DDX文档中指定的源元素值匹配。 例如,本节引入的DDX文档中的源元素的值为Loan.pdf。
      • 一个com.adobe.idp.Document对象,它包含输入PDF文档。
  5. 设置运行时选项。

    • 使用其构造函数创建存储运行时选项的AssemblerOptionSpec对象。
    • 通过调用属于AssemblerOptionSpec对象的方法,设置运行时选项以满足业务要求。 例如,要指示Assembler服务在出现错误时继续处理作业,请调用AssemblerOptionSpec对象的setFailOnError方法并传递false
  6. 检索有关PDF文档的信息。

    调用AssemblerServiceClient对象的invokeDDX方法并传递以下必需值:

    • 一个com.adobe.idp.Document对象,它表示要使用的DDX文档
    • 一个java.util.Map对象,它包含用于确定PDF/A兼容性的输入PDF文件
    • 指定运行时选项的com.adobe.livecycle.assembler.client.AssemblerOptionSpec对象

    invokeDDX方法返回一个com.adobe.livecycle.assembler.client.AssemblerResult对象,该对象包含指定输入PDF文档是否符合PDF/A规范的XML数据。

  7. 保存返回的XML文档。

    要获取指定输入PDF文档是否为PDF/A文档的XML数据,请执行以下操作:

    • 调用AssemblerResult对象的getDocuments方法。 这将返回java.util.Map对象。
    • java.util.Map对象进行迭代,直到找到生成的com.adobe.idp.Document对象。
    • 调用com.adobe.idp.Document对象的copyToFile方法以提取XML文档。 确保将XML数据另存为XML文件。

另请参阅

快速开始(SOAP模式):使用Java API(SOAP模式)确定文档是否符合 PDF/A规范

包括AEM FormsJava库文件

设置连接属性

使用Web服务API确定文档是否符合PDF/A规范

使用Assembler Service API(Web服务)确定PDF文档是否符合PDF/A规范:

  1. 包括项目文件。

    创建使用MTOM的Microsoft .NET项目。 确保使用以下WSDL定义:http://localhost:8080/soap/services/AssemblerService?WSDL&lc_version=9.0.1

    注意

    localhost替换为承载AEM Forms的服务器的IP地址。

  2. 创建PDF Assembler客户端。

    • 使用其默认构造函数创建AssemblerServiceClient对象。

    • 使用System.ServiceModel.EndpointAddress构造函数创建AssemblerServiceClient.Endpoint.Address对象。 将指定WSDL的字符串值传递给AEM Forms服务(例如http://localhost:8080/soap/services/AssemblerService?blob=mtom)。 您无需使用lc_version属性。 此属性在您创建服务引用时使用。)

    • 通过获取AssemblerServiceClient.Endpoint.Binding字段的值创建System.ServiceModel.BasicHttpBinding对象。 将返回值转换为BasicHttpBinding

    • System.ServiceModel.BasicHttpBinding对象的MessageEncoding字段设置为WSMessageEncoding.Mtom。 此值确保使用MTOM。

    • 通过执行以下任务启用基本HTTP身份验证:

      • 为字段AssemblerServiceClient.ClientCredentials.UserName.UserName指定AEM表单用户名。
      • 为字段AssemblerServiceClient.ClientCredentials.UserName.Password分配相应的口令值。
      • 将常量值HttpClientCredentialType.Basic指定到字段BasicHttpBindingSecurity.Transport.ClientCredentialType
      • 将常量值BasicHttpSecurityMode.TransportCredentialOnly指定到字段BasicHttpBindingSecurity.Security.Mode
  3. 引用现有DDX文档。

    • 使用BLOB对象的构造函数创建<a0/>对象。 BLOB对象用于存储DDX文档。
    • 通过调用System.IO.FileStream对象的构造函数并传递一个字符串值,该字符串值表示DDX文档的文件位置以及在中打开文件的模式。
    • 创建存储System.IO.FileStream对象内容的字节数组。 通过获取System.IO.FileStream对象的Length属性,可以确定字节数组的大小。
    • 通过调用System.IO.FileStream对象的Read方法并传递要读取的字节数组、开始位置和流长度,用流数据填充字节数组。
    • 通过为MTOM字段指定字节数组的内容,填充BLOB对象。
  4. 参考用于确定PDF/A兼容性的PDF文档。

    • 使用BLOB对象的构造函数创建<a0/>对象。 BLOB对象用于存储输入的PDF文档。
    • 通过调用System.IO.FileStream对象的构造函数并传递一个字符串值,该字符串值表示输入PDF文档的文件位置以及打开文件的模式。
    • 创建存储System.IO.FileStream对象内容的字节数组。 通过获取System.IO.FileStream对象的Length属性,可以确定字节数组的大小。
    • 通过调用System.IO.FileStream对象的Read方法并传递要读取的字节数组、开始位置和流长度,用流数据填充字节数组。
    • 通过为MTOM对象的<a1/>属性指定字节数组的内容,填充BLOB对象。
    • 创建MyMapOf_xsd_string_To_xsd_anyType对象。 此集合对象用于存储PDF文档。
    • 创建MyMapOf_xsd_string_To_xsd_anyType_Item对象。
    • MyMapOf_xsd_string_To_xsd_anyType_Item对象的key字段指定表示键名的字符串值。 此值必须与在DDX文档中指定的PDF源元素值匹配。
    • 将存储PDF文档的BLOB对象分配给MyMapOf_xsd_string_To_xsd_anyType_Item对象的value字段。
    • MyMapOf_xsd_string_To_xsd_anyType_Item对象添加到MyMapOf_xsd_string_To_xsd_anyType对象。 调用MyMapOf_xsd_string_To_xsd_anyType对象' Add方法并传递MyMapOf_xsd_string_To_xsd_anyType对象。
  5. 设置运行时选项。

    • 使用其构造函数创建存储运行时选项的AssemblerOptionSpec对象。
    • 通过为属于AssemblerOptionSpec对象的数据成员分配一个值,设置运行时选项以满足您的业务要求。 例如,要指示Assembler服务在出现错误时继续处理作业,请将false分配给AssemblerOptionSpec对象的failOnError数据成员。
  6. 检索有关PDF文档的信息。

    调用AssemblerServiceService对象的invoke方法并传递以下值:

    • 表示DDX文档的BLOB对象。
    • 包含输入PDF文档的MyMapOf_xsd_string_To_xsd_anyType对象。 其键必须与PDF源文件的名称匹配,其值必须是与输入PDF文件对应的BLOB对象。
    • 指定运行时选项的AssemblerOptionSpec对象。

    invoke方法返回一个AssemblerResult对象,该对象包含指定输入PDF文档是否为PDF/A文档的XML数据。

  7. 保存返回的XML文档。

    要获取指定输入PDF文档是否为PDF/A文档的XML数据,请执行以下操作:

    • 访问AssemblerResult对象的documents字段,该字段是一个Map对象,它包含指定输入PDF文档是否为PDF/A文档的XML数据。
    • Map对象进行迭代以获得每个生成文档。 然后,将该数组成员的值转换为BLOB
    • 通过访问XML对象的BLOB字段提取表示XML数据的二进制数据。 MTOM此字段存储可以作为XML文件写入的字节数组。

另请参阅

使用MTOM调用AEM Forms

在此页面上