프로그래밍 방식으로 PDF 문서 분해하기

이 문서의 샘플 및 예제는 JEE 환경의 AEM Forms용입니다.

PDF 문서를 어셈블러 서비스에 전달하여 분해할 수 있습니다. 일반적으로 이 작업은 PDF 문서가 원래 문 컬렉션과 같은 여러 개별 문서에서 작성된 경우에 유용합니다. 다음 그림에서 DocA는 여러 결과 문서로 분할되며, 페이지의 첫 번째 수준 1 책갈피가 새 결과 문서의 시작을 나타냅니다.

pd_pd_pdfsofrombookmarks

PDF 문서를 분해하려면 PDFsFromBookmarks 요소가 DDX 문서에 있는지 확인합니다. PDFsFromBookmarks 요소는 결과 요소이며 DDX 요소의 하위 요소일 수 있습니다. 이로 인해 여러 문서가 생성될 수 있으므로 result 특성이 없습니다.

PDFsFromBookmarks 요소를 사용하면 소스 문서의 각 수준 1 책갈피에 대해 단일 문서가 생성됩니다.

이 토론을 위해 다음 DDX 문서가 사용된다고 가정하십시오.

 <?xml version="1.0" encoding="UTF-8"?>
 <DDX xmlns="https://ns.adobe.com/DDX/1.0/">
      <PDFsFromBookmarks prefix="stmt">
     <PDF source="AssemblerResultPDF.pdf"/>
 </PDFsFromBookmarks>
 </DDX>
노트

이 섹션을 읽기 전에 어셈블러 서비스를 사용하여 PDF 문서 작성을 숙지하는 것이 좋습니다. (프로그래밍 방식으로 PDF 문서 정리를 참조하십시오.)

노트

단일 PDF 문서를 어셈블러 서비스에 전달하여 단일 문서를 다시 가져오는 경우 invokeOneDocument 작업을 호출할 수 있습니다. 그러나 PDF 문서를 분해하려면 입력 PDF 문서가 어셈블러 서비스로 전달되더라도 어셈블러 서비스는 하나 이상의 문서가 포함된 수집 객체를 반환하므로 invokeDDX 작업을 사용하십시오.

노트

어셈블러 서비스에 대한 자세한 내용은 AEM Forms에 대한 서비스 참조를 참조하십시오.

노트

DDX 문서에 대한 자세한 내용은 어셈블러 서비스 및 DDX 참조를 참조하십시오.

단계 요약

PDF 문서를 분해하려면 다음 작업을 수행합니다.

  1. 프로젝트 파일을 포함합니다.
  2. PDF 어셈블러 클라이언트를 만듭니다.
  3. 기존 DDX 문서를 참조합니다.
  4. 분해할 PDF 문서를 참조합니다.
  5. 런타임 옵션을 설정합니다.
  6. PDF 문서를 분해합니다.
  7. 분해된 PDF 문서를 저장합니다.

프로젝트 파일 포함

개발 프로젝트에 필요한 파일을 포함하십시오. Java를 사용하여 클라이언트 응용 프로그램을 만드는 경우 필요한 JAR 파일을 포함하십시오. 웹 서비스를 사용하는 경우 프록시 파일을 포함해야 합니다.

프로젝트의 클래스 경로에 다음 JAR 파일을 추가해야 합니다.

  • adobe-livecycle-client.jar
  • adobe-usermanager-client.jar
  • adobe-assembler-client.jar
  • adobe-utilities.jar(AEM Forms이 JBoss에 배포된 경우 필수)
  • jbossall-client.jar(AEM Forms이 JBoss에 배포되는 경우 필요)

AEM Forms이 JBoss가 아닌 지원되는 J2EE 애플리케이션 서버에 배포된 경우, adobe-utilities.jar 및 jbossall-client.jar를 AEM Forms이 배포된 J2EE 애플리케이션 서버와 관련된 JAR 파일로 대체해야 합니다.

PDF 어셈블러 클라이언트 만들기

어셈블러 작업을 프로그래밍 방식으로 수행하려면 먼저 어셈블러 서비스 클라이언트를 만들어야 합니다.

기존 DDX 문서 참조

PDF 문서를 분해하려면 DDX 문서를 참조해야 합니다. 이 DDX 문서에는 PDFsFromBookmarks 요소가 포함되어야 합니다.

PDF 문서를 참조하여 디스어셈블합니다.

PDF 문서를 분해하려면 분해할 PDF 문서를 나타내는 PDF 파일을 참조합니다. 어셈블러 서비스에 전달되면 문서의 각 수준 1 책갈피에 대해 별도의 PDF 문서가 반환됩니다.

런타임 옵션 설정

작업을 수행하는 동안 어셈블러 서비스의 동작을 제어하는 런타임 옵션을 설정할 수 있습니다. 예를 들어 오류가 발생하면 어셈블러 서비스에 작업을 계속 처리하도록 지시하는 옵션을 설정할 수 있습니다.

PDF 문서 분해

어셈블러 서비스 클라이언트를 만든 후 DDX 문서를 참조하고, 분해할 PDF 문서를 참조하며, 런타임 옵션을 설정한 후에는 invokeDDX 메서드를 호출하여 PDF 문서를 분해할 수 있습니다. DDX 문서에 PDF 문서를 디스어셈블하는 지침이 포함되어 있는 경우 어셈블러 서비스는 컬렉션 객체 내의 디스어셈블된 PDF 문서를 반환합니다.

분해된 PDF 문서를 저장합니다

분해된 모든 PDF 문서는 컬렉션 개체 내에서 반환됩니다. 컬렉션 개체를 반복하여 각 PDF 문서를 PDF 파일로 저장합니다.

참고 항목

AEM Forms Java 라이브러리 파일 포함

연결 속성 설정

프로그래밍 방식으로 PDF 문서 조립

Java API를 사용하여 PDF 문서 분해

Assembler Service API(Java)를 사용하여 PDF 문서를 분해합니다.

  1. 프로젝트 파일을 포함합니다.

    Java 프로젝트의 클래스 경로에 adobe-assembler-client.jar와 같은 클라이언트 JAR 파일을 포함합니다.

  2. PDF 어셈블러 클라이언트를 만듭니다.

    • 연결 속성을 포함하는 ServiceClientFactory 개체를 만듭니다.
    • 생성자를 사용하여 AssemblerServiceClient 개체를 만들고 ServiceClientFactory 개체를 전달합니다.
  3. 기존 DDX 문서를 참조합니다.

    • 생성자를 사용하여 DDX 문서를 나타내는 java.io.FileInputStream 개체를 만들고 DDX 파일의 위치를 지정하는 문자열 값을 전달합니다.
    • 생성자를 사용하여 com.adobe.idp.Document 개체를 만들고 java.io.FileInputStream 개체를 전달합니다.
  4. 분해할 PDF 문서를 참조합니다.

    • HashMap 생성자를 사용하여 입력 PDF 문서를 저장하는 데 사용되는 java.util.Map 개체를 만듭니다.

    • 생성자를 사용하여 java.io.FileInputStream 개체를 만들고 PDF 문서의 위치를 전달하여 디스어셈블합니다.

    • com.adobe.idp.Document 개체를 만들고 PDF 문서가 포함된 java.io.FileInputStream 개체를 전달하여 디스어셈블합니다.

    • put 메서드를 호출하고 다음 인수를 전달하여 java.util.Map 개체에 항목을 추가합니다.

      • 키 이름을 나타내는 문자열 값입니다. 이 값은 DDX 문서에 지정된 PDF 소스 요소의 값과 일치해야 합니다.
      • 분해할 PDF 문서가 포함된 com.adobe.idp.Document 개체입니다.
  5. 런타임 옵션을 설정합니다.

    • 생성자를 사용하여 런타임 옵션을 저장하는 AssemblerOptionSpec 개체를 만듭니다.
    • AssemblerOptionSpec 개체에 속하는 메서드를 호출하여 비즈니스 요구 사항을 충족하도록 런타임 옵션을 설정합니다. 예를 들어 오류가 발생할 때 어셈블러 서비스에서 작업을 계속 처리하도록 지시하려면 AssemblerOptionSpec 개체의 setFailOnError 메서드를 호출하고 false를 전달합니다.
  6. PDF 문서를 분해합니다.

    AssemblerServiceClient 개체의 invokeDDX 메서드를 호출하고 다음 필수 값을 전달합니다.

    • 사용할 DDX 문서를 나타내는 com.adobe.idp.Document 개체
    • 디스어셈블할 PDF 문서가 포함된 java.util.Map 개체
    • 기본 글꼴 및 작업 로그 수준을 포함하여 런타임 옵션을 지정하는 com.adobe.livecycle.assembler.client.AssemblerOptionSpec 개체입니다

    invokeDDX 메서드는 분해된 PDF 문서와 발생한 예외가 포함된 com.adobe.livecycle.assembler.client.AssemblerResult 개체를 반환합니다.

  7. 분해된 PDF 문서를 저장합니다.

    분해된 PDF 문서를 가져오려면 다음 작업을 수행하십시오.

    • AssemblerResult 개체의 getDocuments 메서드를 호출합니다. java.util.Map 개체를 반환합니다.
    • 결과 com.adobe.idp.Document 개체를 찾을 때까지 java.util.Map 개체를 반복합니다.
    • com.adobe.idp.Document 개체의 copyToFile 메서드를 호출하여 PDF 문서를 추출합니다.

참고 항목

프로그래밍 방식으로 PDF 문서 분해

빠른 시작(SOAP 모드):Java API를 사용하여 PDF 문서 분해

AEM Forms Java 라이브러리 파일 포함

연결 속성 설정

웹 서비스 API를 사용하여 PDF 문서 분해

어셈블러 서비스 API(웹 서비스)를 사용하여 PDF 문서를 분해합니다.

  1. 프로젝트 파일을 포함합니다.

    MTOM을 사용하는 Microsoft .NET 프로젝트를 만듭니다. 서비스 참조를 설정할 때 다음 WSDL 정의를 사용해야 합니다.http://localhost:8080/soap/services/AssemblerService?WSDL&lc_version=9.0.1

    노트

    localhost 을 AEM Forms을 호스팅하는 서버의 IP 주소로 바꿉니다.

  2. PDF 어셈블러 클라이언트를 만듭니다.

    • 기본 생성자를 사용하여 AssemblerServiceClient 개체를 만듭니다.

    • System.ServiceModel.EndpointAddress 생성자를 사용하여 AssemblerServiceClient.Endpoint.Address 개체를 만듭니다. WSDL을 지정하는 문자열 값을 AEM Forms 서비스에 전달합니다(예: http://localhost:8080/soap/services/AssemblerService?blob=mtom). lc_version 특성을 사용할 필요는 없습니다. 이 속성은 서비스 참조를 만들 때 사용됩니다.

    • AssemblerServiceClient.Endpoint.Binding 필드의 값을 가져와서 System.ServiceModel.BasicHttpBinding 개체를 만듭니다. 반환 값을 BasicHttpBinding(으)로 캐스팅합니다.

    • System.ServiceModel.BasicHttpBinding 개체의 MessageEncoding 필드를 WSMessageEncoding.Mtom로 설정합니다. 이 값은 MTOM이 사용되도록 합니다.

    • 다음 작업을 수행하여 기본 HTTP 인증을 활성화합니다.

      • AEM Forms 사용자 이름을 AssemblerServiceClient.ClientCredentials.UserName.UserName 필드에 지정합니다.
      • 해당 암호 값을 AssemblerServiceClient.ClientCredentials.UserName.Password 필드에 할당합니다.
      • 상수 값 HttpClientCredentialType.Basic을 필드 BasicHttpBindingSecurity.Transport.ClientCredentialType에 할당합니다.
      • 상수 값 BasicHttpSecurityMode.TransportCredentialOnly을 필드 BasicHttpBindingSecurity.Security.Mode에 할당합니다.
  3. 기존 DDX 문서를 참조합니다.

    • 생성자를 사용하여 BLOB 개체를 만듭니다. BLOB 개체는 DDX 문서를 저장하는 데 사용됩니다.
    • 해당 생성자를 호출하여 System.IO.FileStream 개체를 만듭니다. DDX 문서의 파일 위치와 파일을 열 모드를 나타내는 문자열 값을 전달합니다.
    • System.IO.FileStream 개체의 내용을 저장하는 바이트 배열을 만듭니다. System.IO.FileStream 개체의 Length 속성을 가져와서 바이트 배열의 크기를 결정할 수 있습니다.
    • System.IO.FileStream 개체의 Read 메서드를 호출하고 읽을 바이트 배열, 시작 위치 및 스트림 길이를 전달하여 바이트 배열을 스트림 데이터로 채웁니다.
    • MTOM 속성을 바이트 배열의 콘텐츠로 할당하여 BLOB 개체를 채웁니다.
  4. 분해할 PDF 문서를 참조합니다.

    • 생성자를 사용하여 BLOB 개체를 만듭니다. BLOB 개체는 입력 PDF 문서를 저장하는 데 사용됩니다. 이 BLOB 개체는 invokeOneDocument에 인수로 전달됩니다.
    • 해당 생성자를 호출하고 입력 PDF 문서의 파일 위치와 파일을 열 모드를 나타내는 문자열 값을 전달하여 System.IO.FileStream 개체를 만듭니다.
    • System.IO.FileStream 개체의 내용을 저장하는 바이트 배열을 만듭니다. System.IO.FileStream 개체의 Length 속성을 가져와서 바이트 배열의 크기를 결정할 수 있습니다.
    • System.IO.FileStream 개체의 Read 메서드를 호출하고 읽을 바이트 배열, 시작 위치 및 스트림 길이를 전달하여 바이트 배열을 스트림 데이터로 채웁니다.
    • MTOM 필드를 바이트 배열의 내용에 할당하여 BLOB 개체를 채웁니다.
    • MyMapOf_xsd_string_To_xsd_anyType 개체를 만듭니다. 이 컬렉션 개체는 디스어셈블할 PDF를 저장하는 데 사용됩니다.
    • MyMapOf_xsd_string_To_xsd_anyType_Item 개체를 만듭니다.
    • 키 이름을 나타내는 문자열 값을 MyMapOf_xsd_string_To_xsd_anyType_Item 개체의 key 필드에 할당합니다. 이 값은 DDX 문서에 지정된 PDF 소스 요소의 값과 일치해야 합니다.
    • PDF 문서를 저장하는 BLOB 개체를 MyMapOf_xsd_string_To_xsd_anyType_Item 개체의 value 필드에 할당합니다.
    • MyMapOf_xsd_string_To_xsd_anyType 개체에 MyMapOf_xsd_string_To_xsd_anyType_Item 개체를 추가합니다. MyMapOf_xsd_string_To_xsd_anyType 개체 Add 메서드를 호출하고 MyMapOf_xsd_string_To_xsd_anyType 개체를 전달합니다.
  5. 런타임 옵션을 설정합니다.

    • 생성자를 사용하여 런타임 옵션을 저장하는 AssemblerOptionSpec 개체를 만듭니다.
    • AssemblerOptionSpec 객체에 속하는 데이터 멤버에 값을 할당하여 비즈니스 요구 사항을 충족하도록 런타임 옵션을 설정합니다. 예를 들어 오류가 발생할 때 어셈블러 서비스에서 작업을 계속 처리하도록 지시하려면 falseAssemblerOptionSpec 개체의 failOnError 필드에 할당합니다.
  6. PDF 문서를 분해합니다.

    AssemblerServiceClient 개체의 invokeDDX 메서드를 호출하고 다음 값을 전달합니다.

    • PDF 문서를 분해하는 DDX 문서를 나타내는 BLOB 개체입니다
    • 디스어셈블할 PDF 문서가 포함된 MyMapOf_xsd_string_To_xsd_anyType 개체
    • 런타임 옵션을 지정하는 AssemblerOptionSpec 개체

    invokeDDX 메서드는 작업 결과 및 발생한 예외가 포함된 AssemblerResult 개체를 반환합니다.

  7. 분해된 PDF 문서를 저장합니다.

    새로 만든 PDF 문서를 가져오려면 다음 작업을 수행하십시오.

    • 분해된 PDF 문서가 포함된 Map 개체인 AssemblerResult 개체의 documents 필드에 액세스합니다.
    • Map 개체를 반복하여 각 결과 문서를 가져옵니다. 그런 다음 해당 배열 멤버의 valueBLOB에 캐스팅합니다.
    • BLOB 개체의 MTOM 속성에 액세스하여 PDF 문서를 나타내는 이진 데이터를 추출합니다. PDF 파일에 쓸 수 있는 바이트 배열을 반환합니다.

참고 항목

프로그래밍 방식으로 PDF 문서 분해

MTOM을 사용하여 AEM Forms 호출

이 페이지에서는