您可以使用汇编程序服务确定PDF文档是否符合PDF/A规范。 PDF/A文档作为存档格式存在,用于长期保存文档的内容。 字体嵌入在文档中,且文件未压缩。 因此,PDF/A文档通常比标准PDF文档大。 此外,PDF/A文档不包含音频和视频内容。
PDF/A-1规范由两个符合性级别组成,即A和B。两个级别之间的主要区别在于逻辑结构(无障碍)支持,这是符合性级别B不需要的。无论符合性级别如何,PDF/A-1都指示所有字体都嵌入在生成的PDF/A文档中。 目前,验证(和转换)仅支持PDF/A-1b。
在本讨论中,假定使用了以下DDX文档。
<?xml version="1.0" encoding="UTF-8"?>
<DDX xmlns="https://ns.adobe.com/DDX/1.0/">
<DocumentInformation source="Loan.pdf" result="Loan_result.xml">
<PDFAValidation compliance="PDF/A-1b" resultLevel="Detailed" ignoreUnusedResources="true" allowCertificationSignatures="true" />
</DocumentInformation>
</DDX>
在此DDX文档中,DocumentInformation
元素指示汇编程序服务返回有关输入PDF文档的信息。 在DocumentInformation
元素中,PDFAValidation
元素指示汇编程序服务指示输入的PDF文档是否符合PDF/A。
汇编程序服务返回信息,该信息指定输入的PDF文档在包含PDFAConformance
元素的XML文档中是否符合PDF/A。 如果输入的PDF文档符合PDF/A,则PDFAConformance
元素的isCompliant
属性的值为true
。 如果PDF文档不符合PDF/A,则PDFAConformance
元素的isCompliant
属性的值为false
。
由于本节中指定的DDX文档包含DocumentInformation
元素,因此汇编程序服务会返回XML数据而不是PDF文档。 即汇编程序服务不会汇编或反汇编PDF文档;它返回有关XML文档中输入的PDF文档的信息。
有关汇编程序服务的更多信息,请参阅AEM Forms的服务参考。
有关DDX文档的更多信息,请参阅汇编程序服务和DDX参考。
要确定PDF文档是否符合PDF/A,请执行以下任务:
包含项目文件
在开发项目中包含必需的文件。 如果您使用Java创建客户端应用程序,请包含必需的JAR文件。 如果您使用的是Web服务,请确保包含代理文件。
必须将以下JAR文件添加到项目的类路径中:
如果AEM Forms部署在除JBoss之外的受支持J2EE应用程序服务器上,则必须将adobe-utilities.jar和jbossall-client.jar文件替换为特定于AEM Forms所部署的J2EE应用程序服务器的JAR文件。 有关所有AEM Forms JAR文件位置的信息,请参阅包括AEM Forms Java库文件。
创建PDF汇编程序客户端
在以编程方式执行汇编程序操作之前,必须创建汇编程序服务客户端。
引用现有DDX文档
必须引用DDX文档才能执行汇编程序服务操作。 要确定输入的PDF文档是否符合PDF/A规范,请确保DDX文档包含DocumentInformation
元素中的PDFAValidation
元素。 PDFAValidation
元素指示汇编程序服务返回一个XML文档,该文档指定输入的PDF文档是否符合PDF/A。
引用用于确定PDF/A合规性的PDF文档
必须引用PDF文档并将其传递到汇编程序服务,以确定PDF文档是否符合PDF/A。
设置运行时选项
您可以设置运行时选项,以在汇编程序服务执行作业时控制其行为。 例如,您可以设置一个选项,指示汇编程序服务在遇到错误时继续处理作业。 有关可设置的运行时选项的信息,请参阅AEM Forms API引用中的AssemblerOptionSpec
类引用。
检索有关PDF文档的信息
在创建汇编程序服务客户端、引用DDX文档、引用交互式PDF文档并设置运行时选项后,可以调用invokeDDX
操作。 由于DDX文档包含DocumentInformation
元素,因此汇编程序服务会返回XML数据而不是PDF文档。
保存返回的XML文档
汇编程序服务返回的XML文档指定输入的PDF文档是否符合PDF/A。 例如,如果输入的PDF文档不符合PDF/A,汇编程序服务将返回包含以下元素的XML文档:
<PDFAConformance isCompliant="false" compliance="PDF/A-1b" resultLevel="Detailed" ignoreUnusedResources="true" allowCertificationSignatures="true">
将XML文档另存为XML文件,以便打开该文件并查看结果。
另请参阅
使用汇编程序服务API(Java)确定PDF文档是否符合PDF/A规范:
包括项目文件。
在Java项目的类路径中包含客户端JAR文件,如adobe-assembler-client.jar。
创建PDF汇编程序客户端。
ServiceClientFactory
对象。AssemblerServiceClient
对象,并传递ServiceClientFactory
对象。引用现有DDX文档。
java.io.FileInputStream
对象。 要确定PDF文档是否符合PDF/A规范,请确保DDX文档包含PDFAValidation
元素,该元素包含在DocumentInformation
元素中。com.adobe.idp.Document
对象,并传递java.io.FileInputStream
对象。引用用于确定PDF/A合规性的PDF文档。
使用java.io.FileInputStream
对象的构造函数创建一个对象,并传递用于确定PDF/A合规性的PDF文档的位置。
使用其构造函数创建com.adobe.idp.Document
对象,并传递包含PDF文档的java.io.FileInputStream
对象。
使用HashMap
构造函数创建用于存储输入PDF文档的java.util.Map
对象。
通过调用put
方法并传递以下参数,向java.util.Map
对象添加一个条目:
com.adobe.idp.Document
对象。设置运行时选项。
AssemblerOptionSpec
的构造函数创建一个用于存储运行时选项的对象。AssemblerOptionSpec
对象的方法来设置运行时选项以满足您的业务要求。 例如,要指示汇编程序服务在发生错误时继续处理作业,请调用AssemblerOptionSpec
对象的setFailOnError
方法并传递false
。检索有关PDF文档的信息。
调用AssemblerServiceClient
对象的invokeDDX
方法并传递以下必需值:
com.adobe.idp.Document
对象java.util.Map
对象,其中包含用于确定PDF/A合规性的输入PDF文件com.adobe.livecycle.assembler.client.AssemblerOptionSpec
对象invokeDDX
方法返回一个com.adobe.livecycle.assembler.client.AssemblerResult
对象,该对象包含指定输入PDF文档是否符合PDF/A的XML数据。
保存返回的XML文档。
要获取指定输入PDF文档是否为PDF/A文档的XML数据,请执行以下操作:
AssemblerResult
对象的getDocuments
方法。 这会返回java.util.Map
对象。java.util.Map
对象,直到找到结果com.adobe.idp.Document
对象。com.adobe.idp.Document
对象的copyToFile
方法以提取XML文档。 确保将XML数据另存为XML文件。另请参阅
快速入门(SOAP模式):使用Java API(SOAP模式)确定文档是否符合PDF /A规范
使用汇编程序服务API(Web服务)确定PDF文档是否符合PDF/A规范:
包括项目文件。
创建使用MTOM的Microsoft .NET项目。 确保使用以下WSDL定义:http://localhost:8080/soap/services/AssemblerService?WSDL&lc_version=9.0.1
。
将localhost
替换为托管AEM Forms的服务器的IP地址。
创建PDF汇编程序客户端。
使用AssemblerServiceClient
对象的默认构造函数创建对象。
使用System.ServiceModel.EndpointAddress
构造函数创建AssemblerServiceClient.Endpoint.Address
对象。 将指定WSDL的字符串值传递给AEM Forms服务(例如http://localhost:8080/soap/services/AssemblerService?blob=mtom
)。 您无需使用lc_version
属性。 在创建服务引用时,会使用此属性。)
通过获取AssemblerServiceClient.Endpoint.Binding
字段的值,创建System.ServiceModel.BasicHttpBinding
对象。 将返回值转换为BasicHttpBinding
。
将System.ServiceModel.BasicHttpBinding
对象的MessageEncoding
字段设置为WSMessageEncoding.Mtom
。 此值可确保使用MTOM。
通过执行以下任务,启用基本HTTP身份验证:
AssemblerServiceClient.ClientCredentials.UserName.UserName
。AssemblerServiceClient.ClientCredentials.UserName.Password
分配相应的密码值。HttpClientCredentialType.Basic
分配给字段BasicHttpBindingSecurity.Transport.ClientCredentialType
。BasicHttpSecurityMode.TransportCredentialOnly
分配给字段BasicHttpBindingSecurity.Security.Mode
。引用现有DDX文档。
BLOB
对象的构造函数创建对象。 BLOB
对象用于存储DDX文档。System.IO.FileStream
对象的构造函数并传递一个字符串值,该字符串值表示DDX文档的文件位置以及在中打开文件的模式,可创建对象。System.IO.FileStream
对象内容的字节数组。 您可以通过获取System.IO.FileStream
对象的Length
属性来确定字节数组的大小。System.IO.FileStream
对象的Read
方法并传递要读取的字节数组、开始位置和流长度,用流数据填充字节数组。BLOB
对象的MTOM
字段分配字节数组的内容来填充该对象。引用用于确定PDF/A合规性的PDF文档。
BLOB
对象的构造函数创建对象。 BLOB
对象用于存储输入的PDF文档。System.IO.FileStream
对象的构造函数并传递一个字符串值来创建对象,该字符串值表示输入PDF文档的文件位置以及打开文件的模式。System.IO.FileStream
对象内容的字节数组。 您可以通过获取System.IO.FileStream
对象的Length
属性来确定字节数组的大小。System.IO.FileStream
对象的Read
方法并传递要读取的字节数组、开始位置和流长度,用流数据填充字节数组。BLOB
对象的MTOM
属性分配字节数组的内容来填充该对象。MyMapOf_xsd_string_To_xsd_anyType
对象。 此收集对象用于存储PDF文档。MyMapOf_xsd_string_To_xsd_anyType_Item
对象。MyMapOf_xsd_string_To_xsd_anyType_Item
对象的key
字段分配表示键名称的字符串值。 此值必须匹配DDX文档中指定的PDF源元素的值。BLOB
对象分配给MyMapOf_xsd_string_To_xsd_anyType_Item
对象的value
字段。MyMapOf_xsd_string_To_xsd_anyType_Item
对象添加到MyMapOf_xsd_string_To_xsd_anyType
对象。 调用MyMapOf_xsd_string_To_xsd_anyType
对象“ Add
方法并传递MyMapOf_xsd_string_To_xsd_anyType
对象。设置运行时选项。
AssemblerOptionSpec
的构造函数创建一个用于存储运行时选项的对象。AssemblerOptionSpec
对象的数据成员分配一个值,设置运行时选项以满足您的业务要求。 例如,要指示汇编程序服务在发生错误时继续处理作业,请将false
分配给AssemblerOptionSpec
对象的failOnError
数据成员。检索有关PDF文档的信息。
调用AssemblerServiceService
对象的invoke
方法并传递以下值:
BLOB
对象。MyMapOf_xsd_string_To_xsd_anyType
对象。 其键必须与PDF源文件的名称匹配,其值必须是与输入PDF文件对应的BLOB
对象。AssemblerOptionSpec
对象。invoke
方法返回一个AssemblerResult
对象,该对象包含指定输入PDF文档是否为PDF/A文档的XML数据。
保存返回的XML文档。
要获取指定输入PDF文档是否为PDF/A文档的XML数据,请执行以下操作:
AssemblerResult
对象的documents
字段,该字段是一个Map
对象,其中包含指定输入PDF文档是否为PDF/A文档的XML数据。Map
对象以获取每个生成文档。 然后,将该数组成员的值转换为BLOB
。BLOB
对象的MTOM
字段,提取表示XML数据的二进制数据。 此字段存储一个字节数组,您可以将其作为XML文件写出。另请参阅