以程式分解的PDF檔案 programmatically-disassembling-pdf-documents
本檔案中的範例和範例僅適用於JEE環境上的AEM Forms。
您可以將PDF檔案傳遞至組合器服務來分解它。 通常,當PDF檔案最初是由許多個別檔案(例如陳述式集合)建立時,這項工作會很有用。 在下圖中,DocA會分成多個結果檔案,其中頁面上的第一個第1層書籤會識別新結果檔案的開頭。
若要分解PDF檔案,請確定PDFsFromBookmarks
元素在DDX檔案中。 PDFsFromBookmarks
專案是結果專案,而且只能是DDX
專案的子專案。 它沒有result
屬性,因為它可能導致產生多個檔案。
PDFsFromBookmarks
元素會針對來原始檔中的每個層級1書籤產生單一檔案。
為了進行此討論,假設使用下列DDX檔案。
<?xml version="1.0" encoding="UTF-8"?>
<DDX xmlns="https://ns.adobe.com/DDX/1.0/">
<PDFsFromBookmarks prefix="stmt">
<PDF source="AssemblerResultPDF.pdf"/>
</PDFsFromBookmarks>
</DDX>
invokeOneDocument
作業。 不過,若要拆解PDF檔案,請使用invokeDDX
作業,因為雖然已將一個輸入PDF檔案傳遞給Assembler服務,但Assembler服務會傳回包含一個或多個檔案的集合物件。步驟摘要 summary-of-steps
若要拆解PDF檔案,請執行下列工作:
- 包含專案檔案。
- 建立PDF組合器使用者端。
- 參考現有的DDX檔案。
- 參照要拆解的PDF檔案。
- 設定執行階段選項。
- 拆解PDF檔案。
- 儲存已拆解的PDF檔案。
包含專案檔
在您的開發專案中包含必要的檔案。 如果您使用Java建立使用者端應用程式,請包含必要的JAR檔案。 如果您使用Web服務,請確定您包含Proxy檔案。
必須將下列JAR檔案新增至專案的類別路徑:
- adobe-livecycle-client.jar
- adobe-usermanager-client.jar
- adobe-assembler-client.jar
- adobe-utilities.jar (如果AEM Forms部署在JBoss上,則為必要)
- jbossall-client.jar (如果AEM Forms部署在JBoss上,則為必要)
如果將AEM Forms部署在受支援的J2EE應用程式伺服器(不是JBoss)上,則必須將adobe-utilities.jar和jbossall-client.jar取代為特定於已部署AEM Forms之J2EE應用程式伺服器的JAR檔案。
建立PDF組合器使用者端
您必須先建立組合器服務使用者端,才能以程式設計方式執行組合器作業。
參考現有的DDX檔案
必須參考DDX檔案才能分解PDF檔案。 此DDX檔案必須包含PDFsFromBookmarks
專案。
參考PDF檔案以拆解
若要拆解PDF檔案,請參照代表要拆解PDF檔案的PDF檔案。 當傳遞至Assembler服務時,會針對檔案中的每個1級書籤傳回個別的PDF檔案。
設定執行階段選項
您可以設定執行階段選項,控制Assembler服務執行工作時的行為。 例如,您可以設定一個選項,在遇到錯誤時指示Assembler服務繼續處理工作。
拆解PDF檔案
在您建立Assembler服務使用者端、參考DDX檔案、參考PDF檔案以進行拆解,以及設定執行階段選項之後,您可以透過叫用invokeDDX
方法來拆解PDF檔案。 只要DDX檔案包含解組PDF檔案的指示,組裝程式服務就會傳回集合物件中已解組的PDF檔案。
儲存已解譯的PDF檔案
所有已拆解的PDF檔案都會在集合物件中傳回。 逐一檢視集合物件,並將每個PDF檔案儲存為PDF檔案。
另請參閱
使用Java API分解PDF檔案 disassemble-a-pdf-document-using-the-java-api
使用組合器服務API (Java)分解PDF檔案:
-
包含專案檔案。
在您的Java專案的類別路徑中包含使用者端JAR檔案,例如adobe-assembler-client.jar。
-
建立PDF組合器使用者端。
- 建立包含連線屬性的
ServiceClientFactory
物件。 - 使用它的建構函式並傳遞
ServiceClientFactory
物件來建立AssemblerServiceClient
物件。
- 建立包含連線屬性的
-
參考現有的DDX檔案。
- 使用它的建構函式並傳遞指定DDX檔案位置的字串值,建立代表DDX檔案的
java.io.FileInputStream
物件。 - 使用它的建構函式並傳遞
java.io.FileInputStream
物件來建立com.adobe.idp.Document
物件。
- 使用它的建構函式並傳遞指定DDX檔案位置的字串值,建立代表DDX檔案的
-
參照要拆解的PDF檔案。
-
使用
HashMap
建構函式建立用來儲存輸入PDF檔案的java.util.Map
物件。 -
使用物件的建構函式並傳遞PDF檔案的位置來建立
java.io.FileInputStream
物件以進行拆解。 -
建立
com.adobe.idp.Document
物件並傳遞包含PDF檔案的java.io.FileInputStream
物件以拆解。 -
透過叫用物件的
put
方法並傳遞下列引數,將專案新增至java.util.Map
物件:- 代表索引鍵名稱的字串值。 此值必須符合DDX檔案中指定的PDF來源元素的值。
- 包含要拆解之PDF檔案的
com.adobe.idp.Document
物件。
-
-
設定執行階段選項。
- 使用建構函式建立儲存執行階段選項的
AssemblerOptionSpec
物件。 - 透過叫用屬於
AssemblerOptionSpec
物件的方法,設定執行階段選項以符合您的業務需求。 例如,若要指示Assembler服務在發生錯誤時繼續處理工作,請叫用AssemblerOptionSpec
物件的setFailOnError
方法,然後傳遞false
。
- 使用建構函式建立儲存執行階段選項的
-
拆解PDF檔案。
叫用
AssemblerServiceClient
物件的invokeDDX
方法,並傳遞下列必要值:- 代表要使用的DDX檔案的
com.adobe.idp.Document
物件 - 包含要分解之PDF檔案的
java.util.Map
物件 - 指定執行階段選項(包括預設字型和作業記錄層級)的
com.adobe.livecycle.assembler.client.AssemblerOptionSpec
物件
invokeDDX
方法傳回com.adobe.livecycle.assembler.client.AssemblerResult
物件,其中包含已解譯的PDF檔案以及發生的任何例外狀況。 - 代表要使用的DDX檔案的
-
儲存已拆解的PDF檔案。
若要取得已拆解的PDF檔案,請執行下列動作:
- 叫用
AssemblerResult
物件的getDocuments
方法。 這會傳回java.util.Map
物件。 - 逐一檢視
java.util.Map
物件,直到找到結果com.adobe.idp.Document
物件為止。 - 叫用
com.adobe.idp.Document
物件的copyToFile
方法來擷取PDF檔案。
- 叫用
另請參閱
使用Web服務API分解PDF檔案 disassemble-a-pdf-document-using-the-web-service-api
使用組合器服務API (Web服務)拆分PDF檔案:
-
包含專案檔案。
建立使用MTOM的Microsoft .NET專案。 確定您在設定服務參考時使用下列WSDL定義:
http://localhost:8080/soap/services/AssemblerService?WSDL&lc_version=9.0.1
。note note NOTE 將 localhost
取代為主控AEM Forms之伺服器的IP位址。 -
建立PDF組合器使用者端。
-
使用預設建構函式建立
AssemblerServiceClient
物件。 -
使用
System.ServiceModel.EndpointAddress
建構函式建立AssemblerServiceClient.Endpoint.Address
物件。 將指定WSDL的字串值傳遞至AEM Forms服務(例如,http://localhost:8080/soap/services/AssemblerService?blob=mtom
)。 您不需要使用lc_version
屬性。 當您建立服務參考時,會使用此屬性。 -
取得
AssemblerServiceClient.Endpoint.Binding
欄位的值,以建立System.ServiceModel.BasicHttpBinding
物件。 將傳回值轉換為BasicHttpBinding
。 -
將
System.ServiceModel.BasicHttpBinding
物件的MessageEncoding
欄位設為WSMessageEncoding.Mtom
。 此值可確保使用MTOM。 -
執行下列工作來啟用基本的HTTP驗證:
- 將AEM表單使用者名稱指派給欄位
AssemblerServiceClient.ClientCredentials.UserName.UserName
。 - 將對應的密碼值指派給欄位
AssemblerServiceClient.ClientCredentials.UserName.Password
。 - 將常數值
HttpClientCredentialType.Basic
指派給欄位BasicHttpBindingSecurity.Transport.ClientCredentialType
。 - 將常數值
BasicHttpSecurityMode.TransportCredentialOnly
指派給欄位BasicHttpBindingSecurity.Security.Mode
。
- 將AEM表單使用者名稱指派給欄位
-
-
參考現有的DDX檔案。
- 使用物件的建構函式建立
BLOB
物件。BLOB
物件是用來儲存DDX檔案。 - 透過叫用它的建構函式來建立
System.IO.FileStream
物件。 傳遞代表DDX檔案檔案位置以及開啟檔案的模式的字串值。 - 建立位元組陣列以儲存
System.IO.FileStream
物件的內容。 您可以取得System.IO.FileStream
物件的Length
屬性來決定位元組陣列的大小。 - 呼叫
System.IO.FileStream
物件的Read
方法,並傳遞要讀取的位元組陣列、起始位置和資料流長度,以資料流資料填入位元組陣列。 - 以位元組陣列的內容指派物件的
MTOM
屬性,填入BLOB
物件。
- 使用物件的建構函式建立
-
參照要拆解的PDF檔案。
- 使用物件的建構函式建立
BLOB
物件。BLOB
物件是用來儲存輸入PDF檔案。 此BLOB
物件會以引數的形式傳遞至invokeOneDocument
。 - 建立
System.IO.FileStream
物件,方法為叫用其建構函式,並傳遞代表輸入PDF檔案的檔案位置和開啟檔案的模式的字串值。 - 建立位元組陣列以儲存
System.IO.FileStream
物件的內容。 您可以取得System.IO.FileStream
物件的Length
屬性來決定位元組陣列的大小。 - 呼叫
System.IO.FileStream
物件的Read
方法,並傳遞要讀取的位元組陣列、起始位置和資料流長度,以資料流資料填入位元組陣列。 - 將位元組陣列的內容指派給其
MTOM
欄位,以填入BLOB
物件。 - 建立
MyMapOf_xsd_string_To_xsd_anyType
物件。 此集合物件是用來儲存要拆解的PDF。 - 建立
MyMapOf_xsd_string_To_xsd_anyType_Item
物件。 - 將代表索引鍵名稱的字串值指派給
MyMapOf_xsd_string_To_xsd_anyType_Item
物件的key
欄位。 此值必須符合DDX檔案中指定的PDF來源元素的值。 - 將儲存PDF檔案的
BLOB
物件指派給MyMapOf_xsd_string_To_xsd_anyType_Item
物件的value
欄位。 - 將
MyMapOf_xsd_string_To_xsd_anyType_Item
物件新增至MyMapOf_xsd_string_To_xsd_anyType
物件。 叫用MyMapOf_xsd_string_To_xsd_anyType
物件'Add
方法並傳遞MyMapOf_xsd_string_To_xsd_anyType
物件。
- 使用物件的建構函式建立
-
設定執行階段選項。
- 使用建構函式建立儲存執行階段選項的
AssemblerOptionSpec
物件。 - 將值指派給屬於
AssemblerOptionSpec
物件的資料成員,設定執行階段選項以符合您的業務需求。 例如,若要指示Assembler服務在發生錯誤時繼續處理工作,請將false
指派給AssemblerOptionSpec
物件的failOnError
欄位。
- 使用建構函式建立儲存執行階段選項的
-
拆解PDF檔案。
叫用
AssemblerServiceClient
物件的invokeDDX
方法,並傳遞下列值:- 代表解組PDF檔案的DDX檔案的
BLOB
物件 - 包含要拆解之PDF檔案的
MyMapOf_xsd_string_To_xsd_anyType
物件 - 指定執行階段選項的
AssemblerOptionSpec
物件
invokeDDX
方法傳回AssemblerResult
物件,其中包含工作結果和發生的任何例外狀況。 - 代表解組PDF檔案的DDX檔案的
-
儲存已拆解的PDF檔案。
若要取得新建立的PDF檔案,請執行下列動作:
- 存取
AssemblerResult
物件的documents
欄位,此欄位是包含已解除組裝PDF檔案的Map
物件。 - 逐一檢視
Map
物件以取得每個結果檔案。 然後,將該陣列成員的value
轉換為BLOB
。 - 存取其
BLOB
物件的MTOM
屬性,以擷取代表PDF檔案的二進位資料。 這會傳回您可以寫出至PDF檔案的位元組陣列。
- 存取
另請參閱