以寫程式方式分解PDF文檔

本檔案中的範例和範例僅適用於JEE環境上的AEM Forms。

通過將PDF文檔傳遞到組合器服務,可以拆解該文檔。 通常,當PDF文檔最初從許多單獨文檔(如語句集合)建立時,此任務非常有用。 在下圖中,DocA被分為多個結果文檔,其中頁面上的第一級書籤標識新結果文檔的開始。

pd_pd_pdf從書籤

要拆解PDF文檔,請確保PDFsFromBookmarks元素位於DDX文檔中。 PDFsFromBookmarks元素是結果元素,只能是DDX元素的子元素。 它沒有result屬性,因為它可能導致生成多個文檔。

PDFsFromBookmarks元素會為源文檔中的每個1級書籤生成單個文檔。

在本討論中,假設使用了以下DDX文檔。

 <?xml version="1.0" encoding="UTF-8"?>
 <DDX xmlns="https://ns.adobe.com/DDX/1.0/">
      <PDFsFromBookmarks prefix="stmt">
     <PDF source="AssemblerResultPDF.pdf"/>
 </PDFsFromBookmarks>
 </DDX>
注意

閱讀本節之前,建議您熟悉使用組合器服務來組合PDF文檔。 (請參閱以程式設計方式組合PDF文檔。)

注意

將單個PDF文檔傳遞到組合器服務並返回單個文檔時,可以調用invokeOneDocument操作。 但是,要拆解PDF文檔,請使用invokeDDX操作,因為雖然一個輸入的PDF文檔被傳遞到組合器服務,但組合器服務返回一個包含一個或多個文檔的集合對象。

注意

有關組合器服務的詳細資訊,請參閱AEM Forms的服務參考

注意

有關DDX文檔的詳細資訊,請參閱組合器服務和DDX引用

步驟的摘要

要拆解PDF文檔,請執行以下任務:

  1. 包含專案檔案。
  2. 建立PDF組合器客戶端。
  3. 參考現有的DDX文檔。
  4. 參考要拆卸的PDF文檔。
  5. 設定運行時選項。
  6. 反匯編PDF文檔。
  7. 儲存已拆解的PDF檔案。

包含項目檔案

在您的開發專案中加入必要的檔案。 如果您是使用Java建立客戶端應用程式,請包括必要的JAR檔案。 如果您使用Web服務,請確定您包含Proxy檔案。

必須將以下JAR檔案添加到項目的類路徑中:

  • adobe-livecycle-client.jar
  • adobe-usermanager-client.jar
  • adobe-assembler-client.jar
  • adobe-utilities.jar(若AEM Forms部署在JBoss上則為必要)
  • jbossall-client.jar(若AEM Forms部署在JBoss上則為必要)

如果AEM Forms部署在非JBoss的支援J2EE應用程式伺服器上,您必須將adobe-utilities.jar和jbossall-client.jar取代為部署AEM Forms的J2EE應用程式伺服器專屬的JAR檔案。

建立PDF組合器客戶端

在以寫程式方式執行組合器操作之前,必須建立組合器服務客戶端。

參考現有的DDX文檔

必須參考DDX文檔才能拆解PDF文檔。 此DDX文檔必須包含PDFsFromBookmarks元素。

參考要拆卸的PDF文檔

要拆解PDF文檔,請參照表示要拆解的PDF文檔的PDF檔案。 當傳遞到組合器服務時,將為文檔中的每個級別1書籤返回一個單獨的PDF文檔。

設定運行時選項

您可以設定運行時選項,以控制組合器服務在執行作業時的行為。 例如,您可以設定一個選項,指示組合器服務在遇到錯誤時繼續處理作業。

反匯編PDF文檔

建立組合器服務客戶端後,參考DDX文檔,參考要拆解的PDF文檔,並設定運行時選項,可以通過調用invokeDDX方法來拆解PDF文檔。 如果DDX文檔包含拆解PDF文檔的說明,則組合器服務會在收集對象中返回已拆解的PDF文檔。

儲存已拆解的PDF檔案

所有已拆解的PDF文檔都在收集對象中返回。 逐一查看集合物件,並將每個PDF檔案儲存為PDF檔案。

另請參閱

包含AEM Forms Java程式庫檔案

設定連接屬性

以程式設計方式組合PDF檔案

使用Java API拆解PDF文檔

使用組合器服務API(Java)拆解PDF文檔:

  1. 包含專案檔案。

    在Java項目的類路徑中包含客戶端JAR檔案,如adobe-assembler-client.jar。

  2. 建立PDF組合器客戶端。

    • 建立包含連接屬性的ServiceClientFactory對象。
    • 使用其建構子並傳遞ServiceClientFactory物件,以建立AssemblerServiceClient物件。
  3. 參考現有的DDX文檔。

    • 使用DDX文檔的建構子並傳遞指定DDX檔案位置的字串值,建立代表DDX文檔的java.io.FileInputStream對象。
    • 使用其建構子並傳遞java.io.FileInputStream物件,以建立com.adobe.idp.Document物件。
  4. 參考要拆卸的PDF文檔。

    • 使用HashMap建構子建立用於儲存輸入PDF文檔的java.util.Map對象。

    • 使用其建構子並將PDF檔案的位置傳遞至反匯編,以建立java.io.FileInputStream物件。

    • 建立com.adobe.idp.Document對象,並傳遞包含要拆解的PDF文檔的java.io.FileInputStream對象。

    • 調用put方法並傳遞以下參數,將條目添加到java.util.Map對象中:

      • 代表索引鍵名稱的字串值。 此值必須與DDX文檔中指定的PDF源元素的值匹配。
      • com.adobe.idp.Document物件,包含要拆解的PDF檔案。
  5. 設定運行時選項。

    • 使用其建構子建立AssemblerOptionSpec物件,以儲存執行時選項。
    • 通過調用屬於AssemblerOptionSpec對象的方法來設定運行時選項以滿足您的業務要求。 例如,要指示組合器服務在發生錯誤時繼續處理作業,請調用AssemblerOptionSpec對象的setFailOnError方法並傳遞false
  6. 反匯編PDF文檔。

    調用AssemblerServiceClient對象的invokeDDX方法並傳遞以下必需值:

    • 表示要使用的DDX文檔的com.adobe.idp.Document對象
    • 包含要拆解的PDF文檔的java.util.Map對象
    • com.adobe.livecycle.assembler.client.AssemblerOptionSpec對象,它指定運行時選項,包括預設字型和作業日誌級別

    invokeDDX方法返回一個com.adobe.livecycle.assembler.client.AssemblerResult對象,該對象包含已拆解的PDF文檔以及發生的任何異常。

  7. 儲存已拆解的PDF檔案。

    要獲取已拆解的PDF文檔,請執行以下操作:

    • 調用AssemblerResult對象的getDocuments方法。 這會傳回java.util.Map物件。
    • java.util.Map對象進行迭代,直到找到結果com.adobe.idp.Document對象。
    • 調用com.adobe.idp.Document對象的copyToFile方法以提取PDF文檔。

另請參閱

以程式設計方式解譯PDF檔案

快速入門(SOAP模式):使用Java API解譯PDF檔案

包含AEM Forms Java程式庫檔案

設定連接屬性

使用Web服務API拆解PDF文檔

使用組合器服務API(web服務)拆解PDF文檔:

  1. 包含專案檔案。

    建立使用MTOM的Microsoft .NET項目。 在設定服務引用時,請確保使用以下WSDL定義:http://localhost:8080/soap/services/AssemblerService?WSDL&lc_version=9.0.1

    注意

    localhost取代為托管AEM Forms之伺服器的IP位址。

  2. 建立PDF組合器客戶端。

    • 使用其預設建構子建立AssemblerServiceClient物件。

    • 使用System.ServiceModel.EndpointAddress建構子建立AssemblerServiceClient.Endpoint.Address物件。 將指定WSDL的字串值傳遞到AEM Forms服務(例如http://localhost:8080/soap/services/AssemblerService?blob=mtom)。 您不需要使用lc_version屬性。 建立服務參考時,會使用此屬性。

    • 獲取AssemblerServiceClient.Endpoint.Binding欄位的值,建立System.ServiceModel.BasicHttpBinding對象。 將傳回值轉換為BasicHttpBinding

    • System.ServiceModel.BasicHttpBinding物件的MessageEncoding欄位設為WSMessageEncoding.Mtom。 此值可確保使用MTOM。

    • 通過執行以下任務來啟用基本HTTP身份驗證:

      • 將AEM表單使用者名稱指派給欄位AssemblerServiceClient.ClientCredentials.UserName.UserName
      • 將相應的密碼值分配給欄位AssemblerServiceClient.ClientCredentials.UserName.Password
      • 將常數值HttpClientCredentialType.Basic指派給欄位BasicHttpBindingSecurity.Transport.ClientCredentialType
      • 將常數值BasicHttpSecurityMode.TransportCredentialOnly指派給欄位BasicHttpBindingSecurity.Security.Mode
  3. 參考現有的DDX文檔。

    • 使用其建構子建立BLOB物件。 BLOB對象用於儲存DDX文檔。
    • 調用System.IO.FileStream對象的建構子以建立對象。 傳遞一個字串值,該字串值表示DDX文檔的檔案位置以及開啟檔案的模式。
    • 建立儲存System.IO.FileStream對象內容的位元組陣列。 通過獲取System.IO.FileStream對象的Length屬性,可以確定位元組陣列的大小。
    • 調用System.IO.FileStream對象的Read方法並傳遞要讀取的位元組陣列、啟動位置和流長度,以流資料填充位元組陣列。
    • MTOM物件指派包含位元組陣列內容的屬性,以填入BLOB物件。
  4. 參考要拆卸的PDF文檔。

    • 使用其建構子建立BLOB物件。 BLOB對象用於儲存輸入的PDF文檔。 此BLOB物件會以引數的形式傳遞至invokeOneDocument
    • 通過調用其建構子並傳遞一個字串值來建立System.IO.FileStream對象,該字串值表示輸入PDF文檔的檔案位置以及開啟檔案的模式。
    • 建立儲存System.IO.FileStream對象內容的位元組陣列。 通過獲取System.IO.FileStream對象的Length屬性,可以確定位元組陣列的大小。
    • 調用System.IO.FileStream對象的Read方法並傳遞要讀取的位元組陣列、啟動位置和流長度,以流資料填充位元組陣列。
    • MTOM欄位指定位元組陣列的內容,以填入BLOB物件。
    • 建立MyMapOf_xsd_string_To_xsd_anyType物件。 此集合對象用於儲存要拆解的PDF。
    • 建立MyMapOf_xsd_string_To_xsd_anyType_Item物件。
    • MyMapOf_xsd_string_To_xsd_anyType_Item對象的key欄位分配表示鍵名的字串值。 此值必須與DDX文檔中指定的PDF源元素的值匹配。
    • 將儲存PDF文檔的BLOB對象指派給MyMapOf_xsd_string_To_xsd_anyType_Item對象的value欄位。
    • MyMapOf_xsd_string_To_xsd_anyType_Item物件新增至MyMapOf_xsd_string_To_xsd_anyType物件。 調用MyMapOf_xsd_string_To_xsd_anyType對象' Add方法並傳遞MyMapOf_xsd_string_To_xsd_anyType對象。
  5. 設定運行時選項。

    • 使用其建構子建立AssemblerOptionSpec物件,以儲存執行時選項。
    • 為屬於AssemblerOptionSpec對象的資料成員分配值,以設定運行時選項以滿足您的業務要求。 例如,要指示組合器服務在發生錯誤時繼續處理作業,請將false分配給AssemblerOptionSpec對象的failOnError欄位。
  6. 反匯編PDF文檔。

    調用AssemblerServiceClient對象的invokeDDX方法並傳遞以下值:

    • BLOB對象,表示拆分PDF文檔的DDX文檔
    • 包含要反匯編的PDF文檔的MyMapOf_xsd_string_To_xsd_anyType對象
    • 指定運行時選項的AssemblerOptionSpec對象

    invokeDDX方法返回一個AssemblerResult對象,該對象包含作業結果和發生的任何異常。

  7. 儲存已拆解的PDF檔案。

    要獲取新建立的PDF文檔,請執行以下操作:

    • 訪問AssemblerResult對象的documents欄位,該欄位是包含已拆解的PDF文檔的Map對象。
    • 逐一查看Map對象,以獲取每個結果文檔。 然後,將該陣列成員的value轉換為BLOB
    • 通過訪問其BLOB對象的MTOM屬性來提取表示PDF文檔的二進位資料。 這會傳回可寫出為PDF檔案的位元組陣列。

另請參閱

以程式設計方式解譯PDF檔案

使用MTOM叫用AEM Forms

本頁內容