确定文档是否符合PDF/A determining-whether-documents-are-pdf-a-compliant
您可以使用汇编程序服务确定PDF文档是否符合PDF/A规范。 PDF/文档作为存档格式存在,用于长期保存文档的内容。 字体将嵌入到文档中,并且文件是未压缩的。因此,PDF/A 文档通常比标准 PDF 文档大。此外,PDF/A 文档不包含音频和视频内容。
PDF/A-1规范由两个符合性级别组成,即A和B。两个级别之间的主要区别在于逻辑结构(无障碍)支持,这是符合性级别B不需要的。无论符合性级别如何,PDF/A-1都指示所有字体都嵌入在生成的PDF/A文档中。 目前,验证(和转换)仅支持PDF/A-1b。
在本讨论中,假定使用了以下DDX文档。
<?xml version="1.0" encoding="UTF-8"?>
<DDX xmlns="https://ns.adobe.com/DDX/1.0/">
<DocumentInformation source="Loan.pdf" result="Loan_result.xml">
<PDFAValidation compliance="PDF/A-1b" resultLevel="Detailed" ignoreUnusedResources="true" allowCertificationSignatures="true" />
</DocumentInformation>
</DDX>
在此DDX文档中, DocumentInformation 元素指示汇编程序服务返回有关输入PDF文档的信息。 在 DocumentInformation 元素, PDFAValidation 元素指示汇编程序服务指示输入PDF文档是否符合PDF/A规范。
汇编程序服务返回信息,该信息指定输入PDF文档在包含PDF的XML文档中是否与汇编/A兼容 PDFAConformance 元素。 如果输入PDF文档符合PDF/A规范,则 PDFAConformance 元素 isCompliant 属性为 true. 如果PDF文档与PDF/A不兼容,则 PDFAConformance 元素 isCompliant 属性为 false.
DocumentInformation 元素,汇编程序服务会返回XML数据而不是PDF文档。 即汇编程序服务不会汇编或拆解PDF文档;它返回有关XML文档中输入PDF文档的信息。步骤摘要 summary-of-steps
要确定PDF文档是否符合PDF/A,请执行以下任务:
- 包括项目文件。
- 创建PDF汇编程序客户端。
- 引用现有DDX文档。
- 引用用于确定PDF/A符合性的PDF文档。
- 设置运行时选项。
- 检索有关PDF文档的信息。
- 保存返回的XML文档。
包含项目文件
在开发项目中包含必需的文件。 如果您使用Java创建客户端应用程序,请包含必需的JAR文件。 如果您使用的是Web服务,请确保包含代理文件。
必须将以下JAR文件添加到项目的类路径中:
- adobe-livecycle-client.jar
- adobe-usermanager-client.jar
- adobe-assembler-client.jar
- adobe-utilities.jar(在JBoss上部署AEM Forms时必需)
- jbossall-client.jar(如果在JBoss上部署了AEM Forms,则此变量为必需变量)
如果AEM Forms部署在除JBoss之外的受支持J2EE应用程序服务器上,则必须将adobe-utilities.jar和jbossall-client.jar文件替换为特定于AEM Forms所部署的J2EE应用程序服务器的JAR文件。 有关所有AEM Forms JAR文件的位置的信息,请参阅 包括AEM Forms Java库文件.
创建PDF汇编程序客户端
在以编程方式执行汇编程序操作之前,必须创建汇编程序服务客户端。
引用现有DDX文档
必须引用DDX文档才能执行汇编程序服务操作。 要确定输入PDF文档是否符合PDF/A,请确保DDX文档包含 PDFAValidation 元素 DocumentInformation 元素。 的 PDFAValidation 元素指示汇编程序服务返回一个XML文档,该文档指定输入PDF文档是否与PDF/A兼容。
引用用于确定PDF/A符合性的PDF文档
必须引用PDF文档并将其传递到汇编程序服务,以确定PDF文档是否符合PDF/A。
设置运行时选项
您可以设置运行时选项,以在汇编程序服务执行作业时控制其行为。 例如,您可以设置一个选项,指示汇编程序服务在遇到错误时继续处理作业。 有关可设置的运行时选项的信息,请参阅 AssemblerOptionSpec 类引用 AEM Forms API参考.
检索有关PDF文档的信息
在创建汇编程序服务客户端、引用DDX文档、引用交互式PDF文档并设置运行时选项后,可以调用 invokeDDX 操作。 因为DDX文档包含 DocumentInformation 元素,汇编程序服务会返回XML数据而不是PDF文档。
保存返回的XML文档
汇编程序服务返回的XML文档指定输入PDF文档是否与PDF/A兼容。 例如,如果输入PDF文档不符合PDF/A规范,汇编程序服务将返回包含以下元素的XML文档:
<PDFAConformance isCompliant="false" compliance="PDF/A-1b" resultLevel="Detailed" ignoreUnusedResources="true" allowCertificationSignatures="true">
将XML文档另存为XML文件,以便打开该文件并查看结果。
另请参阅
使用Java API确定文档是否符合PDF/A规范 determine-whether-a-document-is-pdf-a-compliant-using-the-java-api
使用汇编程序服务API(Java)确定PDF文档是否符合PDF/A规范:
-
包括项目文件。
在Java项目的类路径中包含客户端JAR文件,如adobe-assembler-client.jar。
-
创建PDF汇编程序客户端。
- 创建
ServiceClientFactory包含连接属性的对象。 - 创建
AssemblerServiceClient对象,并使用其构造函数进行传递ServiceClientFactory对象。
- 创建
-
引用现有DDX文档。
- 创建
java.io.FileInputStream使用其构造函数并传递指定DDX文件位置的字符串值来表示DDX文档的对象。 要确定PDF文档是否符合PDF/A,请确保DDX文档包含PDFAValidation包含在DocumentInformation元素。 - 创建
com.adobe.idp.Document对象,并使用其构造函数进行传递java.io.FileInputStream对象。
- 创建
-
引用用于确定PDF/A符合性的PDF文档。
-
创建
java.io.FileInputStream对象,并传递用于确定PDF/A合规性的PDF文档的位置。 -
创建
com.adobe.idp.Document对象,并使用其构造函数进行传递java.io.FileInputStream包含PDF文档的对象。 -
创建
java.util.Map用于通过使用HashMap构造函数。 -
在
java.util.Map通过调用对象put方法和传递以下参数:- 表示键名称的字符串值。 此值必须匹配DDX文档中指定的源元素值。 例如,本节介绍的DDX文档中的源元素值为Loan.pdf。
- A
com.adobe.idp.Document包含输入PDF文档的对象。
-
-
设置运行时选项。
- 创建
AssemblerOptionSpec使用其构造函数存储运行时选项的对象。 - 通过调用属于
AssemblerOptionSpec对象。 例如,要指示汇编程序服务在发生错误时继续处理作业,请调用AssemblerOptionSpec对象setFailOnError方法和传递false.
- 创建
-
检索有关PDF文档的信息。
调用
AssemblerServiceClient对象invokeDDX方法,并传递以下必需值:- A
com.adobe.idp.Document表示要使用的DDX文档的对象 - A
java.util.Map包含用于确定PDF/A符合性的输入PDF文件的对象 - A
com.adobe.livecycle.assembler.client.AssemblerOptionSpec指定运行时选项的对象
的
invokeDDX方法返回com.adobe.livecycle.assembler.client.AssemblerResult包含XML数据的对象,该数据指定输入PDF文档是否与PDF/A兼容。 - A
-
保存返回的XML文档。
要获取指定输入PDF文档是否为PDF/A文档的XML数据,请执行以下操作:
- 调用
AssemblerResult对象getDocuments方法。 这会返回java.util.Map对象。 - 循环访问
java.util.Map对象,直到找到结果com.adobe.idp.Document对象。 - 调用
com.adobe.idp.Document对象copyToFile方法提取XML文档。 确保将XML数据另存为XML文件。
- 调用
另请参阅
使用Web服务API确定文档是否符合PDF/A规范 determine-whether-a-document-is-pdf-a-compliant-using-the-web-service-api
通过使用汇编程序服务API(Web服务)确定PDF文档是否符合PDF/A规范:
-
包括项目文件。
创建使用MTOM的Microsoft .NET项目。 确保使用以下WSDL定义:
http://localhost:8080/soap/services/AssemblerService?WSDL&lc_version=9.0.1.note note NOTE 替换 localhost具有托管AEM Forms的服务器的IP地址。 -
创建PDF汇编程序客户端。
-
创建
AssemblerServiceClient对象。 -
创建
AssemblerServiceClient.Endpoint.Address对象System.ServiceModel.EndpointAddress构造函数。 将指定WSDL的字符串值传递到AEM Forms服务(例如,http://localhost:8080/soap/services/AssemblerService?blob=mtom)。 您无需使用lc_version属性。 在创建服务引用时,会使用此属性。) -
创建
System.ServiceModel.BasicHttpBinding对象,方法是获取AssemblerServiceClient.Endpoint.Binding字段。 将返回值转换为BasicHttpBinding. -
设置
System.ServiceModel.BasicHttpBinding对象MessageEncoding字段WSMessageEncoding.Mtom. 此值可确保使用MTOM。 -
通过执行以下任务,启用基本HTTP身份验证:
- 将AEM表单用户名分配给字段
AssemblerServiceClient.ClientCredentials.UserName.UserName. - 为字段分配相应的密码值
AssemblerServiceClient.ClientCredentials.UserName.Password. - 指定常量值
HttpClientCredentialType.Basic到字段BasicHttpBindingSecurity.Transport.ClientCredentialType. - 指定常量值
BasicHttpSecurityMode.TransportCredentialOnly到字段BasicHttpBindingSecurity.Security.Mode.
- 将AEM表单用户名分配给字段
-
-
引用现有DDX文档。
- 创建
BLOB对象。 的BLOB对象用于存储DDX文档。 - 创建
System.IO.FileStream对象,方法是调用其构造函数并传递一个字符串值,该字符串值表示DDX文档的文件位置以及在中打开文件的模式。 - 创建用于存储
System.IO.FileStream对象。 您可以通过获取System.IO.FileStream对象Length属性。 - 通过调用
System.IO.FileStream对象Read方法及传递要读取的字节数组、起始位置及流长度。 - 填充
BLOB通过指定对象MTOM字段中,显示字节数组的内容。
- 创建
-
引用用于确定PDF/A符合性的PDF文档。
- 创建
BLOB对象。 的BLOB对象用于存储输入PDF文档。 - 创建
System.IO.FileStream对象,方法是调用其构造函数并传递一个字符串值,该字符串值表示输入PDF文档的文件位置和打开文件的模式。 - 创建用于存储
System.IO.FileStream对象。 您可以通过获取System.IO.FileStream对象Length属性。 - 通过调用
System.IO.FileStream对象Read方法及传递要读取的字节数组、起始位置及流长度。 - 填充
BLOB通过指定对象MTOM属性。 - 创建
MyMapOf_xsd_string_To_xsd_anyType对象。 此集合对象用于存储PDF文档。 - 创建
MyMapOf_xsd_string_To_xsd_anyType_Item对象。 - 为分配表示键名称的字符串值
MyMapOf_xsd_string_To_xsd_anyType_Item对象key字段。 此值必须匹配DDX文档中指定的PDF源元素的值。 - 分配
BLOB将PDF文档存储到MyMapOf_xsd_string_To_xsd_anyType_Item对象value字段。 - 添加
MyMapOf_xsd_string_To_xsd_anyType_Item对象MyMapOf_xsd_string_To_xsd_anyType对象。 调用MyMapOf_xsd_string_To_xsd_anyType对象'Add方法和通过MyMapOf_xsd_string_To_xsd_anyType对象。
- 创建
-
设置运行时选项。
- 创建
AssemblerOptionSpec使用其构造函数存储运行时选项的对象。 - 通过为属于
AssemblerOptionSpec对象。 例如,要指示汇编程序服务在发生错误时继续处理作业,请指定false到AssemblerOptionSpec对象failOnError数据成员。
- 创建
-
检索有关PDF文档的信息。
调用
AssemblerServiceService对象invoke方法并传递以下值:- A
BLOB表示DDX文档的对象。 - 的
MyMapOf_xsd_string_To_xsd_anyType包含输入PDF文档的对象。 其键必须匹配PDF源文件的名称,并且其值必须为BLOB对应于输入PDF文件的对象。 - 安
AssemblerOptionSpec指定运行时选项的对象。
的
invoke方法返回AssemblerResult包含XML数据的对象,该数据指定输入PDF文档是否为PDF/A文档。 - A
-
保存返回的XML文档。
要获取指定输入PDF文档是否为PDF/A文档的XML数据,请执行以下操作:
- 访问
AssemblerResult对象documents字段,Map包含XML数据的对象,该数据指定输入PDF文档是否为PDF/A文档。 - 循环访问
Map对象来获取每个生成文档。 然后,将该数组成员的值转换为BLOB. - 通过访问表示XML数据的二进制数据
BLOB对象MTOM字段。 此字段存储一个字节数组,您可以将其作为XML文件写出。
- 访问
另请参阅