以程式設計方式解譯PDF檔案

本文中的範例和範例僅適用於AEM Forms的JEE環境。

您可以將PDF檔案傳遞至Assembler服務,以反匯編檔案。 通常,當PDF檔案最初是由許多個別檔案(例如陳述式集合)建立時,這項工作很有用。 在下圖中,DocA被分成多個結果文檔,其中頁面上的第一級書籤標識新結果文檔的開始。

pd_pd_pdf來自書籤

若要拆解PDF檔案,請確定PDFsFromBookmarks元素位於DDX檔案中。 PDFsFromBookmarks元素是合成元素,只能是DDX元素的子元素。 它沒有result屬性,因為它可導致生成多個文檔。

PDFsFromBookmarks元素會針對來源檔案中的每個1級書籤產生單一檔案。

在本討論中,假設使用了以下DDX文檔。

 <?xml version="1.0" encoding="UTF-8"?>
 <DDX xmlns="https://ns.adobe.com/DDX/1.0/">
      <PDFsFromBookmarks prefix="stmt">
     <PDF source="AssemblerResultPDF.pdf"/>
 </PDFsFromBookmarks>
 </DDX>
注意

在閱讀本節之前,建議您熟悉使用Assembler服務來組合PDF檔案。 (請參閱程式設計匯整PDF檔案。)

注意

將單一PDF文檔傳遞至Assembler服務並返回單一文檔時,可以調用invokeOneDocument操作。 但是,要反匯編PDF文檔,請使用invokeDDX操作,因為雖然一個輸入的PDF文檔被傳遞到Assembler服務,但Assembler服務返回包含一個或多個文檔的集合對象。

注意

有關Assembler服務的詳細資訊,請參見AEM Forms的服務參考

注意

有關DDX文檔的詳細資訊,請參閱匯編器服務和DDX參考

步驟摘要

要拆解PDF文檔,請執行以下任務:

  1. 包含專案檔案。
  2. 建立PDF匯寫程式式用戶端。
  3. 參考現有的DDX檔案。
  4. 參考要反匯編的PDF文檔。
  5. 設定執行時期選項。
  6. 反匯編PDF檔案。
  7. 儲存已拆解的PDF檔案。

包含專案檔案

在您的開發專案中加入必要的檔案。 如果要使用Java建立客戶端應用程式,請包括必要的JAR檔案。 如果您使用web services,請確定您包含proxy檔案。

必須將下列JAR檔案添加到項目的類路徑中:

  • adobe-livecycle-client.jar
  • adobe-usermanager-client.jar
  • adobe-assembler-client.jar
  • adobe-utilities.jar(如果AEM Forms部署在JBoss上,則為必要)
  • jbossall-client.jar(如果AEM Forms部署在JBoss上,則為必需)

如果AEM Forms部署在非JBoss的受支援J2EE應用程式伺服器上,則必須將adobe-utilities.jar和jbossall-client.jar替換為特定於部署了AEM Forms的J2EE應用程式伺服器的JAR檔案。

建立PDF匯寫程式式用戶端

在以寫程式方式執行匯編器操作之前,必須建立匯編器服務客戶端。

參考現有的DDX檔案

必須參考DDX檔案,才能反匯編PDF檔案。 此DDX文檔必須包含PDFsFromBookmarks元素。

參考PDF檔案以反匯編

要反匯編PDF文檔,請參考表示要反匯編的PDF文檔的PDF檔案。 傳遞至Assembler服務時,會針對檔案中的每個第1級書籤傳回個別的PDF檔案。

設定執行時期選項

您可以設定運行時選項,以控制Assembler服務在執行作業時的行為。 例如,您可以設定一個選項,指示Assembler服務在遇到錯誤時繼續處理作業。

反匯編PDF檔案

在您建立Assembler服務用戶端、參考DDX檔案、參考要反匯編的PDF檔案,並設定執行時期選項後,您就可以叫用invokeDDX方法來反匯編PDF檔案。 如果DDX檔案包含反匯編PDF檔案的指示,Assembler服務會在收集物件中傳回已拆解的PDF檔案。

儲存已拆解的PDF檔案

所有已拆解的PDF檔案都會傳回至系列物件中。 逐步處理系列物件,並將每個PDF檔案儲存為PDF檔案。

另請參閱

包含AEM FormsJava庫檔案

設定連接屬性

以程式設計方式組合PDF檔案

使用Java API解譯PDF檔案

使用Assembler Service API(Java)拆解PDF檔案:

  1. 包含專案檔案。

    在Java專案的類別路徑中包含用戶端JAR檔案,例如adobe-assembler-client.jar。

  2. 建立PDF匯寫程式式用戶端。

    • 建立包含連接屬性的ServiceClientFactory對象。
    • 使用其建構子並傳遞ServiceClientFactory對象,建立AssemblerServiceClient對象。
  3. 參考現有的DDX檔案。

    • 使用DDX文檔的建構子並傳遞指定DDX檔案位置的字串值,建立代表DDX文檔的java.io.FileInputStream對象。
    • 使用其建構子並傳遞java.io.FileInputStream對象,建立com.adobe.idp.Document對象。
  4. 參考要反匯編的PDF文檔。

    • 使用HashMap建構函式建立java.util.Map物件,用來儲存輸入的PDF檔案。

    • 使用其建構函式建立java.io.FileInputStream物件,並將PDF檔案的位置傳遞至反匯編。

    • 建立com.adobe.idp.Document物件,並傳遞包含要反匯編之PDF檔案的java.io.FileInputStream物件。

    • 通過調用put方法並傳遞以下參數,將條目添加到java.util.Map對象:

      • 代表索引鍵名稱的字串值。 此值必須與DDX檔案中指定之PDF來源元素的值相符。
      • 包含要反匯編的PDF文檔的com.adobe.idp.Document對象。
  5. 設定執行時期選項。

    • 使用其建構子建立一個AssemblerOptionSpec對象,該對象儲存運行時選項。
    • 通過調用屬於AssemblerOptionSpec對象的方法,設定運行時選項以滿足您的業務要求。 例如,若要指示Assembler服務在發生錯誤時繼續處理作業,請叫用AssemblerOptionSpec物件的setFailOnError方法並傳遞false
  6. 反匯編PDF檔案。

    叫用AssemblerServiceClient物件的invokeDDX方法並傳遞下列必要值:

    • com.adobe.idp.Document物件,代表要使用的DDX檔案
    • 包含要反匯編的PDF文檔的java.util.Map對象
    • com.adobe.livecycle.assembler.client.AssemblerOptionSpec物件,指定執行時間選項,包括預設字型和工作記錄層級

    invokeDDX方法會傳回com.adobe.livecycle.assembler.client.AssemblerResult物件,其中包含已拆解的PDF檔案和發生的任何例外。

  7. 儲存已拆解的PDF檔案。

    要獲取已拆解的PDF文檔,請執行以下操作:

    • 叫用AssemblerResult物件的getDocuments方法。 這會傳回java.util.Map物件。
    • 重複java.util.Map物件,直到找到結果com.adobe.idp.Document物件。
    • 叫用com.adobe.idp.Document物件的copyToFile方法來擷取PDF檔案。

另請參閱

以程式設計方式解譯PDF檔案

快速入門(SOAP模式):使用Java API解譯PDF檔案

包含AEM FormsJava庫檔案

設定連接屬性

使用web service API解譯PDF檔案

使用Assembler Service API(web service)拆解PDF檔案:

  1. 包含專案檔案。

    建立使用MTOM的Microsoft .NET專案。 在設定服務引用時,請確保使用以下WSDL定義:http://localhost:8080/soap/services/AssemblerService?WSDL&lc_version=9.0.1

    注意

    localhost取代為代管AEM Forms的伺服器的IP位址。

  2. 建立PDF匯寫程式式用戶端。

    • 使用其預設建構子建立AssemblerServiceClient對象。

    • 使用System.ServiceModel.EndpointAddress建構函式建立AssemblerServiceClient.Endpoint.Address物件。 將指定WSDL的字串值傳遞給AEM Forms服務(例如http://localhost:8080/soap/services/AssemblerService?blob=mtom)。 您不需要使用lc_version屬性。 建立服務參考時,將使用此屬性。

    • 獲取AssemblerServiceClient.Endpoint.Binding欄位的值,建立System.ServiceModel.BasicHttpBinding對象。 將返回值轉換為BasicHttpBinding

    • System.ServiceModel.BasicHttpBinding物件的MessageEncoding欄位設為WSMessageEncoding.Mtom。 此值可確保使用MTOM。

    • 執行下列工作以啟用基本HTTP驗證:

      • 將表AEM單用戶名分配給欄位AssemblerServiceClient.ClientCredentials.UserName.UserName
      • 將相應的口令值分配給欄位AssemblerServiceClient.ClientCredentials.UserName.Password
      • 將常數值HttpClientCredentialType.Basic分配給欄位BasicHttpBindingSecurity.Transport.ClientCredentialType
      • 將常數值BasicHttpSecurityMode.TransportCredentialOnly分配給欄位BasicHttpBindingSecurity.Security.Mode
  3. 參考現有的DDX檔案。

    • 使用其建構子建立BLOB對象。 BLOB物件用來儲存DDX檔案。
    • 通過調用System.IO.FileStream對象的建構子建立對象。 傳遞一個字串值,該值代表DDX檔案的檔案位置以及開啟檔案的模式。
    • 建立儲存System.IO.FileStream對象內容的位元組陣列。 您可以取得System.IO.FileStream物件的Length屬性,以判斷位元組陣列的大小。
    • 調用System.IO.FileStream物件的Read方法,並傳遞要讀取的位元組陣列、開始位置和串流長度,以串流資料填入位元組陣列。
    • 通過為MTOM對象的屬性指定位元組陣列的內容來填充BLOB對象。
  4. 參考要反匯編的PDF文檔。

    • 使用其建構子建立BLOB對象。 BLOB物件用來儲存輸入的PDF檔案。 此BLOB對象作為參數傳遞給invokeOneDocument
    • 通過調用其建構子並傳遞一個字串值來建立System.IO.FileStream對象,該字串值表示輸入PDF文檔的檔案位置以及開啟檔案的模式。
    • 建立儲存System.IO.FileStream對象內容的位元組陣列。 您可以取得System.IO.FileStream物件的Length屬性,以判斷位元組陣列的大小。
    • 調用System.IO.FileStream物件的Read方法,並傳遞要讀取的位元組陣列、開始位置和串流長度,以串流資料填入位元組陣列。
    • 通過為MTOM對象的欄位分配位元組陣列的內容,填充BLOB對象。
    • 建立MyMapOf_xsd_string_To_xsd_anyType對象。 此收集物件用來儲存要反匯編的PDF。
    • 建立MyMapOf_xsd_string_To_xsd_anyType_Item對象。
    • MyMapOf_xsd_string_To_xsd_anyType_Item物件的key欄位指派代表索引鍵名稱的字串值。 此值必須與DDX檔案中指定之PDF來源元素的值相符。
    • 將儲存PDF檔案的BLOB物件指派至MyMapOf_xsd_string_To_xsd_anyType_Item物件的value欄位。
    • MyMapOf_xsd_string_To_xsd_anyType_Item對象添加到MyMapOf_xsd_string_To_xsd_anyType對象。 調用MyMapOf_xsd_string_To_xsd_anyType對象Add方法並傳遞MyMapOf_xsd_string_To_xsd_anyType對象。
  5. 設定執行時期選項。

    • 使用其建構子建立一個AssemblerOptionSpec對象,該對象儲存運行時選項。
    • 通過為屬於AssemblerOptionSpec對象的資料成員分配值,設定運行時選項以滿足您的業務要求。 例如,要指示Assembler服務在出現錯誤時繼續處理作業,請將false分配給AssemblerOptionSpec對象的failOnError欄位。
  6. 反匯編PDF檔案。

    叫用AssemblerServiceClient物件的invokeDDX方法並傳遞下列值:

    • BLOB物件,代表DDX檔案,該檔案會分解PDF檔案
    • 包含要反匯編的PDF文檔的MyMapOf_xsd_string_To_xsd_anyType對象
    • 指定運行時選項的AssemblerOptionSpec對象

    invokeDDX方法返回一個AssemblerResult對象,該對象包含作業結果和發生的任何例外。

  7. 儲存已拆解的PDF檔案。

    若要取得新建立的PDF檔案,請執行下列動作:

    • 存取AssemblerResult物件的documents欄位,此欄位是包含已拆解PDF檔案的Map物件。
    • 重複Map物件,以取得每個結果檔案。 然後,將該陣列成員的value轉換為BLOB
    • 存取PDF檔案的BLOB物件的MTOM屬性,擷取代表PDF檔案的二進位資料。 這會傳回可寫出至PDF檔案的位元組陣列。

另請參閱

以程式設計方式解譯PDF檔案

使用MTOM叫用AEM Forms

本頁內容