프로그래밍 방식으로 PDF 문서 분해하기

PDF 문서를 어셈블러 서비스로 전달하여 분해할 수 있습니다. 일반적으로 이 작업은 PDF 문서가 문 모음과 같은 여러 개별 문서에서 처음 작성된 경우에 유용합니다. 다음 그림에서 DocA는 페이지에 대한 첫 번째 수준 1 책갈피가 새 결과 문서의 시작을 식별하는 여러 결과 문서로 분할됩니다.

pd_pd_pdfsfrombookmarks

PDF 문서를 분해하려면 PDFsFromBookmarks 요소가 DCX 문서에 있는지 확인합니다. PDFsFromBookmarks 요소는 결과 요소이며 DDX 요소의 하위 요소일 수 있습니다. 여기에는 여러 문서를 생성할 수 있으므로 result 특성이 없습니다.

PDFsFromBookmarks 요소를 사용하면 소스 문서의 각 레벨 1 책갈피에 대해 단일 문서가 생성됩니다.

이 토론의 목적으로 다음 DDX 문서를 사용한다고 가정합니다.

 <?xml version="1.0" encoding="UTF-8"?> 
 <DDX xmlns="https://ns.adobe.com/DDX/1.0/"> 
      <PDFsFromBookmarks prefix="stmt"> 
     <PDF source="AssemblerResultPDF.pdf"/> 
 </PDFsFromBookmarks> 
 </DDX>
노트

이 섹션을 읽기 전에 Assembler 서비스를 사용하여 PDF 문서를 조합하는 것에 익숙해지는 것이 좋습니다. 자세한 내용은 프로그래밍 방식으로 PDF 문서 조합을 참조하십시오.

노트

단일 PDF 문서를 어셈블러 서비스로 전달하고 단일 문서를 다시 가져올 때 invokeOneDocument 작업을 호출할 수 있습니다. 그러나 PDF 문서를 분해하려면 한 개의 입력 PDF 문서가 어셈블러 서비스로 전달되지만 어셈블러 서비스는 하나 이상의 문서가 들어 있는 컬렉션 개체를 반환하므로 invokeDDX 작업을 사용합니다.

노트

어셈블러 서비스에 대한 자세한 내용은 AEM Forms용 서비스 참조를 참조하십시오.

노트

DCX 문서에 대한 자세한 내용은 어셈블러 서비스 및 DCX 참조를 참조하십시오.

단계 요약

PDF 문서를 분해하려면 다음 작업을 수행합니다.

  1. 프로젝트 파일 포함
  2. PDF Assembler 클라이언트를 만듭니다.
  3. 기존 DCX 문서를 참조합니다.
  4. 분해할 PDF 문서를 참조합니다.
  5. 런타임 옵션을 설정합니다.
  6. PDF 문서를 분해합니다.
  7. 분해된 PDF 문서를 저장합니다.

프로젝트 파일 포함

개발 프로젝트에 필요한 파일을 포함합니다. Java를 사용하여 클라이언트 응용 프로그램을 만드는 경우 필요한 JAR 파일을 포함합니다. 웹 서비스를 사용하는 경우 프록시 파일을 포함해야 합니다.

다음 JAR 파일을 프로젝트의 클래스 경로에 추가해야 합니다.

  • adobe-livecycle-client.jar
  • adobe-usermanager-client.jar
  • adobe-assembler-client.jar
  • adobe-utilities.jar (AEM Forms이 JBoss에 배포된 경우 필수)
  • jbossall-client.jar (AEM Forms이 JBoss에 배포된 경우 필수)

AEM Forms이 JBoss가 아닌 지원되는 J2EE 응용 프로그램 서버에 배포되는 경우 adobe-utilities.jar 및 jbossall-client.jar를 AEM Forms이 배포된 J2EE 응용 프로그램 서버에 해당하는 JAR 파일로 교체해야 합니다.

PDF Assembler 클라이언트 만들기

어셈블리 작업을 프로그래밍 방식으로 수행하려면 먼저 어셈블러 서비스 클라이언트를 만들어야 합니다.

기존 DCX 문서 참조

PDF 문서를 분해하려면 DCX 문서를 참조해야 합니다. 이 DCX 문서에는 PDFsFromBookmarks 요소가 포함되어야 합니다.

분해할 PDF 문서 참조

PDF 문서를 분해하려면 분해할 PDF 문서를 나타내는 PDF 파일을 참조하십시오. 어셈블리 서비스에 전달되면 문서의 각 레벨 1 책갈피에 대해 별도의 PDF 문서가 반환됩니다.

런타임 옵션 설정

작업을 수행하는 동안 어셈블리 서비스의 동작을 제어하는 런타임 옵션을 설정할 수 있습니다. 예를 들어 오류가 발생하면 어셈블리 서비스에 작업을 계속 처리하도록 하는 옵션을 설정할 수 있습니다.

PDF 문서 분해

Assembler 서비스 클라이언트를 만든 후 DCX 문서를 참조하고, 분해할 PDF 문서를 참조하고, 런타임 옵션을 설정한 후 invokeDDX 메서드를 호출하여 PDF 문서를 분해할 수 있습니다. DDX 문서에 PDF 문서를 분해하는 지침이 포함되어 있는 경우 어셈블러 서비스는 컬렉션 개체 내에서 분해된 PDF 문서를 반환합니다.

분해된 PDF 문서 저장

분해된 모든 PDF 문서는 컬렉션 개체 내에서 반환됩니다. 컬렉션 개체를 반복하여 각 PDF 문서를 PDF 파일로 저장합니다.

참고 항목

AEM Forms Java 라이브러리 파일 포함

연결 속성 설정

프로그래밍 방식으로 PDF 문서 취합

Java API를 사용하여 PDF 문서 정리

Assembler Service API(Java)를 사용하여 PDF 문서를 분해합니다.

  1. 프로젝트 파일 포함

    Java 프로젝트의 클래스 경로에 adobe-assembler-client.jar 등의 클라이언트 JAR 파일을 포함합니다.

  2. PDF Assembler 클라이언트를 만듭니다.

    • 연결 속성을 포함하는 ServiceClientFactory 개체를 만듭니다.
    • 생성자를 사용하여 AssemblerServiceClient 개체를 만들고 ServiceClientFactory 개체를 전달합니다.
  3. 기존 DCX 문서를 참조합니다.

    • 생성자를 사용하여 DCX 문서를 나타내는 java.io.FileInputStream 객체를 만들고 DCX 파일의 위치를 지정하는 문자열 값을 전달합니다.
    • 생성자를 사용하여 com.adobe.idp.Document 개체를 만들고 java.io.FileInputStream 개체를 전달합니다.
  4. 분해할 PDF 문서를 참조합니다.

    • HashMap 생성자를 사용하여 입력 PDF 문서를 저장하는 데 사용되는 java.util.Map 객체를 만듭니다.

    • 생성자를 사용하여 분해할 PDF 문서의 위치를 전달하여 java.io.FileInputStream 객체를 만듭니다.

    • com.adobe.idp.Document 개체를 만들고 분해할 PDF 문서가 포함된 java.io.FileInputStream 개체를 전달합니다.

    • put 메서드를 호출하고 다음 인수를 전달하여 java.util.Map 객체에 항목을 추가합니다.

      • 키 이름을 나타내는 문자열 값입니다. 이 값은 DCX 문서에 지정된 PDF 소스 요소의 값과 일치해야 합니다.
      • 분해할 PDF 문서를 포함하는 com.adobe.idp.Document 객체입니다.
  5. 런타임 옵션을 설정합니다.

    • 생성자를 사용하여 런타임 옵션을 저장하는 AssemblerOptionSpec 객체를 만듭니다.
    • AssemblerOptionSpec 개체에 속하는 메서드를 호출하여 비즈니스 요구 사항을 충족하도록 런타임 옵션을 설정합니다. 예를 들어 오류가 발생할 때 어셈블리 서비스에서 작업을 계속 처리하도록 하려면 AssemblerOptionSpec 개체의 setFailOnError 메서드를 호출하고 false를 전달합니다.
  6. PDF 문서를 분해합니다.

    AssemblerServiceClient 객체의 invokeDDX 메서드를 호출하고 다음 필수 값을 전달합니다.

    • 사용할 DCX 문서를 나타내는 com.adobe.idp.Document 개체
    • 분해할 PDF 문서를 포함하는 java.util.Map 개체
    • 기본 글꼴 및 작업 로그 수준을 포함하여 런타임 옵션을 지정하는 com.adobe.livecycle.assembler.client.AssemblerOptionSpec 개체

    invokeDDX 메서드는 분해된 PDF 문서와 발생한 모든 예외가 포함된 com.adobe.livecycle.assembler.client.AssemblerResult 개체를 반환합니다.

  7. 분해된 PDF 문서를 저장합니다.

    분해된 PDF 문서를 얻으려면 다음 작업을 수행합니다.

    • AssemblerResult 객체의 getDocuments 메서드를 호출합니다. java.util.Map 객체를 반환합니다.
    • 결과 com.adobe.idp.Document 개체를 찾을 때까지 java.util.Map 개체를 반복합니다.
    • com.adobe.idp.Document 개체의 copyToFile 메서드를 호출하여 PDF 문서를 추출합니다.

참고 항목

프로그래밍 방식으로 PDF 문서 분리

빠른 시작(SOAP 모드):Java API를 사용하여 PDF 문서 분리

AEM Forms Java 라이브러리 파일 포함

연결 속성 설정

웹 서비스 API를 사용하여 PDF 문서 정리

Assembler Service API(웹 서비스)를 사용하여 PDF 문서를 분해합니다.

  1. 프로젝트 파일 포함

    MTOM을 사용하는 Microsoft .NET 프로젝트를 만듭니다. 서비스 참조를 설정할 때 다음 WSDL 정의를 사용해야 합니다.http://localhost:8080/soap/services/AssemblerService?WSDL&lc_version=9.0.1.

    노트

    localhost을(를) AEM Forms을 호스팅하는 서버의 IP 주소로 바꿉니다.

  2. PDF Assembler 클라이언트를 만듭니다.

    • 기본 생성자를 사용하여 AssemblerServiceClient 객체를 만듭니다.

    • System.ServiceModel.EndpointAddress 생성자를 사용하여 AssemblerServiceClient.Endpoint.Address 객체를 만듭니다. WSDL을 지정하는 문자열 값을 AEM Forms 서비스(예: http://localhost:8080/soap/services/AssemblerService?blob=mtom)에 전달합니다. lc_version 특성을 사용할 필요가 없습니다. 이 속성은 서비스 참조를 만들 때 사용됩니다.

    • AssemblerServiceClient.Endpoint.Binding 필드의 값을 가져와서 System.ServiceModel.BasicHttpBinding 개체를 만듭니다. 반환 값을 BasicHttpBinding으로 캐스팅합니다.

    • System.ServiceModel.BasicHttpBinding 개체의 MessageEncoding 필드를 WSMessageEncoding.Mtom로 설정합니다. 이 값을 사용하면 MTOM이 사용됩니다.

    • 다음 작업을 수행하여 기본 HTTP 인증을 활성화합니다.

      • AEM 양식 사용자 이름을 AssemblerServiceClient.ClientCredentials.UserName.UserName 필드에 지정합니다.
      • 해당 암호 값을 AssemblerServiceClient.ClientCredentials.UserName.Password 필드에 지정합니다.
      • BasicHttpBindingSecurity.Transport.ClientCredentialType 필드에 상수 값 HttpClientCredentialType.Basic을 할당합니다.
      • BasicHttpBindingSecurity.Security.Mode 필드에 상수 값 BasicHttpSecurityMode.TransportCredentialOnly을 할당합니다.
  3. 기존 DCX 문서를 참조합니다.

    • 생성자를 사용하여 BLOB 객체를 만듭니다. BLOB 개체는 DCX 문서를 저장하는 데 사용됩니다.
    • 생성자를 호출하여 System.IO.FileStream 객체를 만듭니다. DCX 문서의 파일 위치와 파일을 열 모드를 나타내는 문자열 값을 전달합니다.
    • System.IO.FileStream 객체의 내용을 저장하는 바이트 배열을 만듭니다. System.IO.FileStream 객체의 Length 속성을 가져와 바이트 배열의 크기를 결정할 수 있습니다.
    • System.IO.FileStream 객체의 Read 메서드를 호출하고 바이트 배열, 시작 위치 및 읽을 스트림 길이를 전달하여 바이트 배열을 스트림 데이터로 채웁니다.
    • 바이트 배열의 내용으로 MTOM 속성을 할당하여 BLOB 객체를 채웁니다.
  4. 분해할 PDF 문서를 참조합니다.

    • 생성자를 사용하여 BLOB 객체를 만듭니다. BLOB 개체는 입력 PDF 문서를 저장하는 데 사용됩니다. 이 BLOB 개체는 invokeOneDocument에 인수로 전달됩니다.
    • 생성자를 호출하고 입력 PDF 문서의 파일 위치와 파일을 열 모드를 나타내는 문자열 값을 전달하여 System.IO.FileStream 객체를 만듭니다.
    • System.IO.FileStream 객체의 내용을 저장하는 바이트 배열을 만듭니다. System.IO.FileStream 객체의 Length 속성을 가져와 바이트 배열의 크기를 결정할 수 있습니다.
    • System.IO.FileStream 객체의 Read 메서드를 호출하고 바이트 배열, 시작 위치 및 읽을 스트림 길이를 전달하여 바이트 배열을 스트림 데이터로 채웁니다.
    • MTOM 필드에 바이트 배열의 내용을 할당하여 BLOB 객체를 채웁니다.
    • MyMapOf_xsd_string_To_xsd_anyType 개체를 만듭니다. 이 컬렉션 개체는 분해할 PDF를 저장하는 데 사용됩니다.
    • MyMapOf_xsd_string_To_xsd_anyType_Item 개체를 만듭니다.
    • 키 이름을 나타내는 문자열 값을 MyMapOf_xsd_string_To_xsd_anyType_Item 객체의 key 필드에 지정합니다. 이 값은 DCX 문서에 지정된 PDF 소스 요소의 값과 일치해야 합니다.
    • PDF 문서를 저장하는 BLOB 개체를 MyMapOf_xsd_string_To_xsd_anyType_Item 개체의 value 필드에 할당합니다.
    • MyMapOf_xsd_string_To_xsd_anyType_Item 개체를 MyMapOf_xsd_string_To_xsd_anyType 개체에 추가합니다. MyMapOf_xsd_string_To_xsd_anyType object' Add 메서드를 호출하고 MyMapOf_xsd_string_To_xsd_anyType 개체를 전달합니다.
  5. 런타임 옵션을 설정합니다.

    • 생성자를 사용하여 런타임 옵션을 저장하는 AssemblerOptionSpec 객체를 만듭니다.
    • AssemblerOptionSpec 개체에 속하는 데이터 멤버에 값을 할당하여 비즈니스 요구 사항에 맞게 런타임 옵션을 설정합니다. 예를 들어 오류가 발생할 때 어셈블리 서비스에서 작업을 계속 처리하도록 하려면 false을(를) AssemblerOptionSpec 개체의 failOnError 필드에 할당합니다.
  6. PDF 문서를 분해합니다.

    AssemblerServiceClient 객체의 invokeDDX 메서드를 호출하고 다음 값을 전달합니다.

    • PDF 문서를 분해하는 DCX 문서를 나타내는 BLOB 개체
    • 분해할 PDF 문서를 포함하는 MyMapOf_xsd_string_To_xsd_anyType 개체
    • 런타임 옵션을 지정하는 AssemblerOptionSpec 개체

    invokeDDX 메서드는 작업 결과와 발생한 모든 예외가 포함된 AssemblerResult 개체를 반환합니다.

  7. 분해된 PDF 문서를 저장합니다.

    새로 만든 PDF 문서를 얻으려면 다음 작업을 수행합니다.

    • 분해된 PDF 문서를 포함하는 Map 개체인 AssemblerResult 개체의 documents 필드에 액세스합니다.
    • 각 결과 문서를 얻으려면 Map 개체를 반복합니다. 그런 다음 해당 배열 멤버의 valueBLOB로 캐스팅합니다.
    • PDF 문서의 BLOB 개체의 MTOM 속성에 액세스하여 이진 데이터를 추출합니다. PDF 파일에 기록할 수 있는 바이트 배열을 반환합니다.

참고 항목

프로그래밍 방식으로 PDF 문서 분리

MTOM을 사용하여 AEM Forms 호출

이 페이지에서는

Adobe Summit Banner

A virtual event April 27-28.

Expand your skills and get inspired.

Register for free
Adobe Summit Banner

A virtual event April 27-28.

Expand your skills and get inspired.

Register for free
Adobe Maker Awards Banner

Time to shine!

Apply now for the 2021 Adobe Experience Maker Awards.

Apply now
Adobe Maker Awards Banner

Time to shine!

Apply now for the 2021 Adobe Experience Maker Awards.

Apply now