Desensamblar documentos PDF mediante programación

Puede desmontar un documento PDF pasándolo al servicio Assembler. Normalmente, esta tarea resulta útil cuando el documento PDF se creó originalmente a partir de muchos documentos individuales, como una colección de instrucciones. En la siguiente ilustración, el DocA se divide en varios documentos resultantes, donde el primer marcador de nivel 1 de una página identifica el inicio de un nuevo documento resultante.

pd_pd_pdfsfrombookmarks

Para desmontar un documento PDF, asegúrese de que el elemento PDFsFromBookmarks está ubicado en el documento DDX. El elemento PDFsFromBookmarks es un elemento resultante y solo puede ser un elemento secundario del elemento DDX. No tiene un atributo result porque puede resultar en la generación de varios documentos.

El elemento PDFsFromBookmarks hace que se genere un solo documento para cada marcador de nivel 1 en el documento de origen.

A los efectos de esta discusión, supongamos que se utiliza el siguiente documento DDX.

 <?xml version="1.0" encoding="UTF-8"?> 
 <DDX xmlns="https://ns.adobe.com/DDX/1.0/"> 
      <PDFsFromBookmarks prefix="stmt"> 
     <PDF source="AssemblerResultPDF.pdf"/> 
 </PDFsFromBookmarks> 
 </DDX>
NOTA

Antes de leer esta sección, se recomienda que esté familiarizado con el ensamblaje de documentos PDF mediante el servicio Assembler. (Consulte Agrupación programática de documentos PDF).

NOTA

Al pasar un solo documento PDF al servicio Assembler y recuperar un solo documento, puede invocar la operación invokeOneDocument. Sin embargo, para desmontar un documento PDF, utilice la operación invokeDDX porque, aunque se pasa un documento PDF de entrada al servicio Assembler, el servicio Assembler devuelve un objeto de colección que contiene uno o más documentos.

NOTA

Para obtener más información sobre el servicio Assembler, consulte Referencia de servicios para AEM Forms.

NOTA

Para obtener más información sobre un documento DDX, consulte Servicio de ensamblador y referencia DDX.

Resumen de los pasos

Para desmontar un documento PDF, realice las siguientes tareas:

  1. Incluir archivos de proyecto.
  2. Cree un cliente del ensamblador PDF.
  3. Haga referencia a un documento DDX existente.
  4. Haga referencia a un documento PDF para desmontarlo.
  5. Establezca las opciones de tiempo de ejecución.
  6. Desmonte el documento PDF.
  7. Guarde los documentos PDF desmontados.

Incluir archivos de proyecto

Incluya los archivos necesarios en el proyecto de desarrollo. Si está creando una aplicación cliente mediante Java, incluya los archivos JAR necesarios. Si utiliza servicios web, asegúrese de incluir los archivos proxy.

Los siguientes archivos JAR deben agregarse a la ruta de clase del proyecto:

  • adobe-livecycle-client.jar
  • adobe-usermanager-client.jar
  • adobe-assembler-client.jar
  • adobe-Utilities.jar (obligatorio si AEM Forms está implementado en JBoss)
  • jbossall-client.jar (requerido si AEM Forms está implementado en JBoss)

si AEM Forms se implementa en un servidor de aplicaciones J2EE compatible que no sea JBoss, debe reemplazar adobe-Utilities.jar y jbossall-client.jar con archivos JAR específicos del servidor de aplicaciones J2EE en el que se implementa AEM Forms.

Crear un cliente de ensamblador PDF

Para poder realizar una operación Assembler mediante programación, debe crear un cliente de servicio Assembler.

Referencia a un documento DDX existente

Se debe hacer referencia a un documento DDX para desmontar un documento PDF. Este documento DDX debe contener el elemento PDFsFromBookmarks.

Hacer referencia a un documento PDF para desmontarlo

Para desmontar un documento PDF, haga referencia a un archivo PDF que represente el documento PDF que se va a desmontar. Cuando se pasa al servicio Assembler, se devuelve un documento PDF independiente para cada marcador de nivel 1 del documento.

Establecer opciones de tiempo de ejecución

Puede establecer opciones en tiempo de ejecución que controlan el comportamiento del servicio Assembler mientras realiza un trabajo. Por ejemplo, puede definir una opción que indique al servicio Assembler que continúe procesando un trabajo si se encuentra un error.

Desmontar el documento PDF

Después de crear el cliente de servicio Assembler, hacer referencia al documento DDX, hacer referencia a un documento PDF para desmontarlo y establecer las opciones de tiempo de ejecución, puede desensamblar un documento PDF invocando el método invokeDDX. Siempre que el documento DDX contenga instrucciones para desmontar el documento PDF, el servicio Assembler devuelve documentos PDF desensamblados dentro de un objeto de colección.

Guardar los documentos PDF desmontados

Todos los documentos PDF desmontados se devuelven dentro de un objeto de colección. Itere a través del objeto de colección y guarde cada documento PDF como un archivo PDF.

Consulte también

Inclusión de archivos de biblioteca Java de AEM Forms

Configuración de las propiedades de conexión

Montaje programático de documentos PDF

Desensamblar un documento PDF utilizando la API de Java

Desensamblar un documento PDF utilizando la API del servicio Assembler (Java):

  1. Incluir archivos de proyecto.

    Incluya archivos JAR del cliente, como adobe-assembler-client.jar, en la ruta de clase de su proyecto Java.

  2. Cree un cliente del ensamblador PDF.

    • Cree un objeto ServiceClientFactory que contenga propiedades de conexión.
    • Cree un objeto AssemblerServiceClient utilizando su constructor y pasando el objeto ServiceClientFactory.
  3. Haga referencia a un documento DDX existente.

    • Cree un objeto java.io.FileInputStream que represente el documento DDX utilizando su constructor y pasando un valor de cadena que especifique la ubicación del archivo DDX.
    • Cree un objeto com.adobe.idp.Document utilizando su constructor y pasando el objeto java.io.FileInputStream.
  4. Haga referencia a un documento PDF para desmontarlo.

    • Cree un objeto java.util.Map que se utilice para almacenar documentos PDF de entrada mediante un constructor HashMap.

    • Cree un objeto java.io.FileInputStream utilizando su constructor y pasando la ubicación del documento PDF para desmontarlo.

    • Cree un objeto com.adobe.idp.Document y pase el objeto java.io.FileInputStream que contiene el documento PDF para desmontarlo.

    • Agregue una entrada al objeto java.util.Map invocando su método put y pasando los siguientes argumentos:

      • Un valor de cadena que representa el nombre de la clave. Este valor debe coincidir con el valor del elemento de origen PDF especificado en el documento DDX.
      • Un objeto com.adobe.idp.Document que contiene el documento PDF que se va a desmontar.
  5. Establezca las opciones de tiempo de ejecución.

    • Cree un objeto AssemblerOptionSpec que almacene opciones en tiempo de ejecución empleando su constructor.
    • Defina las opciones en tiempo de ejecución para satisfacer los requisitos empresariales invocando un método que pertenece al objeto AssemblerOptionSpec . Por ejemplo, para solicitar al servicio Assembler que continúe procesando un trabajo cuando se produce un error, invoque el método AssemblerOptionSpec del objeto setFailOnError y pase false.
  6. Desmonte el documento PDF.

    Invoque el método AssemblerServiceClient del objeto invokeDDX y pase los siguientes valores obligatorios:

    • Un objeto com.adobe.idp.Document que representa el documento DDX que se va a utilizar
    • Un objeto java.util.Map que contiene el documento PDF que se va a desmontar
    • Un objeto com.adobe.livecycle.assembler.client.AssemblerOptionSpec que especifica las opciones de tiempo de ejecución, incluidas la fuente predeterminada y el nivel de registro de trabajo

    El método invokeDDX devuelve un objeto com.adobe.livecycle.assembler.client.AssemblerResult que contiene los documentos PDF desensamblados y cualquier excepción que se haya producido.

  7. Guarde los documentos PDF desmontados.

    Para obtener los documentos PDF desensamblados, realice las siguientes acciones:

    • Invoque el método AssemblerResult del objeto getDocuments. Esto devuelve un objeto java.util.Map.
    • Repita el objeto java.util.Map hasta que encuentre el objeto com.adobe.idp.Document resultante.
    • Invoque el método com.adobe.idp.Document del objeto copyToFile para extraer el documento PDF.

Consulte también

Desensamblar documentos PDF mediante programación

Inicio rápido (modo SOAP): Desensamblaje de un documento PDF mediante la API de Java

Inclusión de archivos de biblioteca Java de AEM Forms

Configuración de las propiedades de conexión

Desensamblar un documento PDF utilizando la API de servicio Web

Desensamblar un documento PDF utilizando la API del servicio Assembler (servicio Web):

  1. Incluir archivos de proyecto.

    Cree un proyecto de Microsoft .NET que utilice MTOM. Asegúrese de utilizar la siguiente definición WSDL al configurar una referencia de servicio: http://localhost:8080/soap/services/AssemblerService?WSDL&lc_version=9.0.1.

    NOTA

    Sustituya localhost por la dirección IP del servidor que hospeda AEM Forms.

  2. Cree un cliente del ensamblador PDF.

    • Cree un objeto AssemblerServiceClient utilizando su constructor predeterminado.

    • Cree un objeto AssemblerServiceClient.Endpoint.Address utilizando el constructor System.ServiceModel.EndpointAddress. Pase un valor de cadena que especifique el WSDL al servicio de AEM Forms (por ejemplo, http://localhost:8080/soap/services/AssemblerService?blob=mtom). No es necesario utilizar el atributo lc_version. Este atributo se utiliza al crear una referencia de servicio.

    • Cree un objeto System.ServiceModel.BasicHttpBinding obteniendo el valor del campo AssemblerServiceClient.Endpoint.Binding. Establezca el valor devuelto en BasicHttpBinding.

    • Establezca el campo System.ServiceModel.BasicHttpBinding del objeto MessageEncoding en WSMessageEncoding.Mtom. Este valor garantiza que se utilice MTOM.

    • Habilite la autenticación HTTP básica realizando las siguientes tareas:

      • Asigne el nombre de usuario de los formularios AEM al campo AssemblerServiceClient.ClientCredentials.UserName.UserName.
      • Asigne el valor de contraseña correspondiente al campo AssemblerServiceClient.ClientCredentials.UserName.Password.
      • Asigne el valor constante HttpClientCredentialType.Basic al campo BasicHttpBindingSecurity.Transport.ClientCredentialType.
      • Asigne el valor constante BasicHttpSecurityMode.TransportCredentialOnly al campo BasicHttpBindingSecurity.Security.Mode.
  3. Haga referencia a un documento DDX existente.

    • Cree un objeto BLOB utilizando su constructor. El objeto BLOB se utiliza para almacenar el documento DDX.
    • Cree un objeto System.IO.FileStream invocando su constructor. Pase un valor de cadena que represente la ubicación del archivo del documento DDX y el modo en que se abre el archivo.
    • Cree una matriz de bytes que almacene el contenido del objeto System.IO.FileStream. Puede determinar el tamaño de la matriz de bytes obteniendo la propiedad System.IO.FileStream del objeto Length.
    • Rellene la matriz de bytes con datos de flujo invocando el método System.IO.FileStream del objeto Read y pasando la matriz de bytes, la posición de inicio y la longitud de flujo para leer.
    • Rellene el objeto BLOB asignando su propiedad MTOM con el contenido de la matriz de bytes.
  4. Haga referencia a un documento PDF para desmontarlo.

    • Cree un objeto BLOB utilizando su constructor. El objeto BLOB se utiliza para almacenar el documento PDF de entrada. Este objeto BLOB se pasa a invokeOneDocument como argumento.
    • Cree un objeto System.IO.FileStream invocando su constructor y pasando un valor de cadena que represente la ubicación del archivo del documento PDF de entrada y el modo en que se abre el archivo.
    • Cree una matriz de bytes que almacene el contenido del objeto System.IO.FileStream. Puede determinar el tamaño de la matriz de bytes obteniendo la propiedad System.IO.FileStream del objeto Length.
    • Rellene la matriz de bytes con datos de flujo invocando el método System.IO.FileStream del objeto Read y pasando la matriz de bytes, la posición de inicio y la longitud de flujo para leer.
    • Rellene el objeto BLOB asignando su campo MTOM el contenido de la matriz de bytes.
    • Cree un objeto MyMapOf_xsd_string_To_xsd_anyType. Este objeto de colección se utiliza para almacenar el PDF que se va a desmontar.
    • Cree un objeto MyMapOf_xsd_string_To_xsd_anyType_Item.
    • Asigne un valor de cadena que represente el nombre clave al campo MyMapOf_xsd_string_To_xsd_anyType_Item del objeto key. Este valor debe coincidir con el valor del elemento de origen PDF especificado en el documento DDX.
    • Asigne el objeto BLOB que almacena el documento PDF al campo MyMapOf_xsd_string_To_xsd_anyType_Item del objeto value.
    • Agregue el objeto MyMapOf_xsd_string_To_xsd_anyType_Item al objeto MyMapOf_xsd_string_To_xsd_anyType. Invoque el método MyMapOf_xsd_string_To_xsd_anyType object’ Add y pase el objeto MyMapOf_xsd_string_To_xsd_anyType.
  5. Establezca las opciones de tiempo de ejecución.

    • Cree un objeto AssemblerOptionSpec que almacene opciones en tiempo de ejecución empleando su constructor.
    • Defina las opciones en tiempo de ejecución para satisfacer los requisitos empresariales asignando un valor a un miembro de datos que pertenece al objeto AssemblerOptionSpec. Por ejemplo, para solicitar al servicio Assembler que continúe procesando un trabajo cuando se produzca un error, asigne false al campo AssemblerOptionSpec del objeto failOnError.
  6. Desmonte el documento PDF.

    Invoque el método AssemblerServiceClient del objeto invokeDDX y pase los siguientes valores:

    • Un objeto BLOB que representa el documento DDX que desmonta el documento PDF
    • El objeto MyMapOf_xsd_string_To_xsd_anyType que contiene el documento PDF que se va a desmontar
    • Un objeto AssemblerOptionSpec que especifica opciones en tiempo de ejecución

    El método invokeDDX devuelve un objeto AssemblerResult que contiene los resultados del trabajo y cualquier excepción que se haya producido.

  7. Guarde los documentos PDF desmontados.

    Para obtener los documentos PDF recién creados, realice las siguientes acciones:

    • Acceda al campo AssemblerResult del objeto documents, que es un objeto Map que contiene los documentos PDF desensamblados.
    • Repita el objeto Map para obtener cada documento resultante. A continuación, convierta el value del miembro de la matriz en un BLOB.
    • Extraiga los datos binarios que representan el documento PDF accediendo a la propiedad BLOB del objeto MTOM. Esto devuelve una matriz de bytes que puede escribir en un archivo PDF.

Consulte también

Desensamblar documentos PDF mediante programación

Invocación de AEM Forms mediante MTOM

En esta página