Disassemblaggio di documenti PDF a livello di programmazione

Ultimo aggiornamento: 2023-12-07
  • Creato per:
  • Developer

Gli esempi e gli esempi contenuti in questo documento sono solo per l’ambiente AEM Forms su JEE.

È possibile disassemblare un documento PDF trasmettendolo al servizio Assembler. In genere, questa attività è utile quando il documento PDF è stato creato originariamente da molti singoli documenti, ad esempio una raccolta di istruzioni. Nell'illustrazione seguente, DocA è diviso in più documenti risultanti, dove il primo segnalibro di livello 1 in una pagina identifica l'inizio di un nuovo documento risultante.

pd_pd_pdfsfrombookmarks

Per disassemblare un documento PDF, assicurarsi che PDFsFromBookmarks nel documento DDX. Il PDFsFromBookmarks è un elemento risultante e può essere solo un elemento figlio del DDX elemento. Non ha un result perché può causare la generazione di più documenti.

Il PDFsFromBookmarks determina la generazione di un singolo documento per ogni segnalibro di livello 1 nel documento di origine.

Ai fini della presente discussione, si supponga di utilizzare il seguente documento DDX.

 <?xml version="1.0" encoding="UTF-8"?>
 <DDX xmlns="https://ns.adobe.com/DDX/1.0/">
      <PDFsFromBookmarks prefix="stmt">
     <PDF source="AssemblerResultPDF.pdf"/>
 </PDFsFromBookmarks>
 </DDX>
NOTA

Prima di leggere questa sezione, è consigliabile avere familiarità con l'assemblaggio di documenti PDF utilizzando il servizio Assembler. (vedere Assemblaggio di documenti PDF a livello di programmazione.)

NOTA

Quando si passa un singolo documento PDF al servizio Assembler e si recupera un singolo documento, è possibile richiamare invokeOneDocument operazione. Tuttavia, per disassemblare un documento PDF, utilizzare invokeDDX operazione perché, sebbene un documento di input PDF venga passato al servizio Assembler, quest'ultimo restituisce un insieme che contiene uno o più documenti.

NOTA

Per ulteriori informazioni sul servizio Assembler, vedere Guida di riferimento dei servizi per AEM Forms.

NOTA

Per ulteriori informazioni su un documento DDX, vedere Servizio assemblatore e riferimento DDX.

Riepilogo dei passaggi

Per disassemblare un documento PDF, effettuare le seguenti operazioni:

  1. Includi file di progetto.
  2. Creare un client PDF Assembler.
  3. Fare riferimento a un documento DDX esistente.
  4. Fare riferimento a un documento PDF da disassemblare.
  5. Impostare le opzioni di runtime.
  6. Disassemblare il documento PDF.
  7. Salvare i documenti PDF disassemblati.

Includi file di progetto

Includi i file necessari nel progetto di sviluppo. Se stai creando un’applicazione client utilizzando Java, includi i file JAR necessari. Se utilizzi i servizi web, accertati di includere i file proxy.

I seguenti file JAR devono essere aggiunti al percorso della classe del progetto:

  • adobe-livecycle-client.jar
  • adobe-usermanager-client.jar
  • adobe-assembler-client.jar
  • adobe-utilities.jar (richiesto se AEM Forms è implementato su JBoss)
  • jbossall-client.jar (obbligatorio se AEM Forms è distribuito su JBoss)

se AEM Forms viene distribuito su un server applicazioni J2EE supportato che non è JBoss, è necessario sostituire adobe-utilities.jar e jbossall-client.jar con file JAR specifici per il server applicazioni J2EE in cui viene distribuito AEM Forms.

Creare un client PDF Assembler

Prima di poter eseguire un'operazione Assembler a livello di programmazione, è necessario creare un client del servizio Assembler.

Riferimento a un documento DDX esistente

Per disassemblare un documento PDF è necessario fare riferimento a un documento DDX. Questo documento DDX deve contenere PDFsFromBookmarks elemento.

Riferimento a un documento PDF da disassemblare

Per disassemblare un documento PDF, fare riferimento a un file PDF che rappresenta il documento PDF da disassemblare. Quando viene passato al servizio Assembler, viene restituito un documento PDF separato per ogni segnalibro di livello 1 del documento.

Impostare le opzioni di runtime

È possibile impostare le opzioni di runtime che controllano il comportamento del servizio Assembler durante l'esecuzione di un processo. È ad esempio possibile impostare un'opzione che indichi al servizio Assembler di continuare l'elaborazione di un processo in caso di errore.

Disassemblare il documento PDF

Dopo aver creato il client del servizio Assembler, aver fatto riferimento al documento DDX, aver fatto riferimento a un documento PDF da disassemblare e aver impostato le opzioni di runtime, è possibile disassemblare un documento PDF richiamando il invokeDDX metodo. Se il documento DDX contiene istruzioni per disassemblare il documento PDF, il servizio Assembler restituisce i documenti PDF disassemblati all'interno di un oggetto insieme.

Salvare i documenti PDF disassemblati

Tutti i documenti PDF disassemblati vengono restituiti all'interno di un insieme. Scorrere l'oggetto insieme e salvare ogni documento PDF come file PDF.

Consulta anche

Inclusione dei file della libreria Java di AEM Forms

Impostazione delle proprietà di connessione

Assemblaggio di documenti PDF a livello di programmazione

Disassemblare un documento PDF utilizzando l’API Java

Disassemblare un documento PDF utilizzando l'API del servizio Assembler (Java):

  1. Includi file di progetto.

    Includi i file JAR client, come adobe-assembler-client.jar, nel percorso di classe del progetto Java.

  2. Creare un client PDF Assembler.

    • Creare un ServiceClientFactory oggetto che contiene proprietà di connessione.
    • Creare un AssemblerServiceClient mediante il costruttore e passando il ServiceClientFactory oggetto.
  3. Fare riferimento a un documento DDX esistente.

    • Creare un java.io.FileInputStream oggetto che rappresenta il documento DDX utilizzando il relativo costruttore e passando un valore stringa che specifica la posizione del file DDX.
    • Creare un com.adobe.idp.Document mediante il costruttore e passando il java.io.FileInputStream oggetto.
  4. Fare riferimento a un documento PDF da disassemblare.

    • Creare un java.util.Map oggetto utilizzato per memorizzare i documenti di input PDF utilizzando un HashMap costruttore.

    • Creare un java.io.FileInputStream mediante il costruttore e passando la posizione del documento PDF da disassemblare.

    • Creare un com.adobe.idp.Document e passare il java.io.FileInputStream oggetto che contiene il documento PDF da disassemblare.

    • Aggiungi una voce al java.util.Map oggetto richiamando il relativo put e fornendo i seguenti argomenti:

      • Valore stringa che rappresenta il nome della chiave. Questo valore deve corrispondere al valore dell'elemento di origine PDF specificato nel documento DDX.
      • A com.adobe.idp.Document oggetto che contiene il documento PDF da disassemblare.
  5. Impostare le opzioni di runtime.

    • Creare un AssemblerOptionSpec oggetto che memorizza le opzioni di runtime mediante il relativo costruttore.
    • Impostare le opzioni di runtime per soddisfare i requisiti aziendali richiamando un metodo che appartiene al AssemblerOptionSpec oggetto. Ad esempio, per indicare al servizio Assembler di continuare l'elaborazione di un processo quando si verifica un errore, richiamare AssemblerOptionSpec dell'oggetto setFailOnError metodo e passaggio false.
  6. Disassemblare il documento PDF.

    Richiama AssemblerServiceClient dell'oggetto invokeDDX e trasmettere i seguenti valori richiesti:

    • A com.adobe.idp.Document oggetto che rappresenta il documento DDX da utilizzare
    • A java.util.Map oggetto che contiene il documento PDF da disassemblare
    • A com.adobe.livecycle.assembler.client.AssemblerOptionSpec oggetto che specifica le opzioni di runtime, inclusi il tipo di carattere predefinito e il livello di registro del processo

    Il invokeDDX il metodo restituisce un com.adobe.livecycle.assembler.client.AssemblerResult oggetto contenente i documenti PDF disassemblati ed eventuali eccezioni.

  7. Salvare i documenti PDF disassemblati.

    Per ottenere i documenti PDF disassemblati, effettuare le seguenti operazioni:

    • Richiama AssemblerResult dell'oggetto getDocuments metodo. Questo restituisce un java.util.Map oggetto.
    • Effettua iterazione attraverso java.util.Map finché non viene individuato il risultato com.adobe.idp.Document oggetto.
    • Richiama com.adobe.idp.Document dell'oggetto copyToFile per estrarre il documento PDF.

Consulta anche

Disassemblaggio di documenti PDF a livello di programmazione

Guida rapida (modalità SOAP): disassemblaggio di un documento PDF tramite l’API Java

Inclusione dei file della libreria Java di AEM Forms

Impostazione delle proprietà di connessione

Disassemblare un documento PDF utilizzando l’API del servizio web

Disassemblare un documento PDF utilizzando l'API del servizio Assembler (servizio Web):

  1. Includi file di progetto.

    Creare un progetto Microsoft .NET che utilizza MTOM. Assicurarsi di utilizzare la seguente definizione WSDL durante l'impostazione di un riferimento al servizio: http://localhost:8080/soap/services/AssemblerService?WSDL&lc_version=9.0.1.

    NOTA

    Sostituisci localhost con l’indirizzo IP del server che ospita AEM Forms.

  2. Creare un client PDF Assembler.

    • Creare un AssemblerServiceClient utilizzando il costruttore predefinito.

    • Creare un AssemblerServiceClient.Endpoint.Address oggetto utilizzando System.ServiceModel.EndpointAddress costruttore. Passa un valore stringa che specifica il file WSDL al servizio AEM Forms (ad esempio, http://localhost:8080/soap/services/AssemblerService?blob=mtom). Non è necessario utilizzare il lc_version attributo. Questo attributo viene utilizzato quando si crea un riferimento a un servizio.

    • Creare un System.ServiceModel.BasicHttpBinding dell'oggetto ottenendo il valore del AssemblerServiceClient.Endpoint.Binding campo. Invia il valore restituito a BasicHttpBinding.

    • Imposta il System.ServiceModel.BasicHttpBinding dell'oggetto MessageEncoding campo a WSMessageEncoding.Mtom. Questo valore assicura che venga utilizzato MTOM.

    • Abilita l’autenticazione HTTP di base eseguendo le seguenti attività:

      • Assegna al campo il nome utente dei moduli AEM AssemblerServiceClient.ClientCredentials.UserName.UserName.
      • Assegna il valore password corrispondente al campo AssemblerServiceClient.ClientCredentials.UserName.Password.
      • Assegna il valore costante HttpClientCredentialType.Basic al campo BasicHttpBindingSecurity.Transport.ClientCredentialType.
      • Assegna il valore costante BasicHttpSecurityMode.TransportCredentialOnly al campo BasicHttpBindingSecurity.Security.Mode.
  3. Fare riferimento a un documento DDX esistente.

    • Creare un BLOB mediante il costruttore. Il BLOB viene utilizzato per memorizzare il documento DDX.
    • Creare un System.IO.FileStream richiamando il relativo costruttore. Passa un valore stringa che rappresenta la posizione del file del documento DDX e la modalità di apertura del file.
    • Creare una matrice di byte che memorizza il contenuto della System.IO.FileStream oggetto. È possibile determinare le dimensioni della matrice di byte ottenendo System.IO.FileStream dell'oggetto Length proprietà.
    • Compilare la matrice di byte con i dati di flusso richiamando System.IO.FileStream dell'oggetto Read e passando la matrice di byte, la posizione iniziale e la lunghezza del flusso da leggere.
    • Popolare il BLOB oggetto assegnando il relativo MTOM con il contenuto della matrice di byte.
  4. Fare riferimento a un documento PDF da disassemblare.

    • Creare un BLOB mediante il costruttore. Il BLOB L'oggetto viene utilizzato per memorizzare il documento di input PDF. Questo BLOB l'oggetto viene passato al invokeOneDocument come argomento.
    • Creare un System.IO.FileStream oggetto richiamando il relativo costruttore e passando un valore stringa che rappresenta la posizione del file del documento di input PDF e la modalità di apertura del file.
    • Creare una matrice di byte che memorizza il contenuto della System.IO.FileStream oggetto. È possibile determinare le dimensioni della matrice di byte ottenendo System.IO.FileStream dell'oggetto Length proprietà.
    • Compilare la matrice di byte con i dati di flusso richiamando System.IO.FileStream dell'oggetto Read e passando la matrice di byte, la posizione iniziale e la lunghezza del flusso da leggere.
    • Popolare il BLOB oggetto assegnando il relativo MTOM il contenuto della matrice di byte.
    • Creare un MyMapOf_xsd_string_To_xsd_anyType oggetto. Questo oggetto insieme viene utilizzato per memorizzare il PDF da disassemblare.
    • Creare un MyMapOf_xsd_string_To_xsd_anyType_Item oggetto.
    • Assegna un valore stringa che rappresenta il nome della chiave al MyMapOf_xsd_string_To_xsd_anyType_Item dell'oggetto key campo. Questo valore deve corrispondere al valore dell'elemento di origine PDF specificato nel documento DDX.
    • Assegna la BLOB oggetto che memorizza il documento PDF in MyMapOf_xsd_string_To_xsd_anyType_Item dell'oggetto value campo.
    • Aggiungi il MyMapOf_xsd_string_To_xsd_anyType_Item oggetto al MyMapOf_xsd_string_To_xsd_anyType oggetto. Richiama MyMapOf_xsd_string_To_xsd_anyType oggetto' Add e trasmettere il MyMapOf_xsd_string_To_xsd_anyType oggetto.
  5. Impostare le opzioni di runtime.

    • Creare un AssemblerOptionSpec oggetto che memorizza le opzioni di runtime mediante il relativo costruttore.
    • Impostare le opzioni di runtime per soddisfare i requisiti aziendali assegnando un valore a un membro dati che appartiene al AssemblerOptionSpec oggetto. Ad esempio, per indicare al servizio Assembler di continuare l'elaborazione di un processo quando si verifica un errore, assegnare false al AssemblerOptionSpec dell'oggetto failOnError campo.
  6. Disassemblare il documento PDF.

    Richiama AssemblerServiceClient dell'oggetto invokeDDX e trasmettere i seguenti valori:

    • A BLOB oggetto che rappresenta il documento DDX che disassembla il documento PDF
    • Il MyMapOf_xsd_string_To_xsd_anyType oggetto che contiene il documento PDF da disassemblare
    • Un AssemblerOptionSpec oggetto che specifica le opzioni di runtime

    Il invokeDDX il metodo restituisce un AssemblerResult oggetto contenente i risultati del processo ed eventuali eccezioni verificatesi.

  7. Salvare i documenti PDF disassemblati.

    Per ottenere i documenti di PDF appena creati, effettuare le seguenti operazioni:

    • Accedere a AssemblerResult dell'oggetto documents campo, che è un Map oggetto contenente i documenti PDF disassemblati.
    • Effettua iterazione attraverso Map per ottenere ogni documento risultante. Quindi, esegui il cast del membro di array value a un BLOB.
    • Estrarre i dati binari che rappresentano il documento PDF accedendo al relativo BLOB dell'oggetto MTOM proprietà. Restituisce una matrice di byte che è possibile scrivere in un file PDF.

Consulta anche

Disassemblaggio di documenti PDF a livello di programmazione

Richiamare AEM Forms tramite MTOM

In questa pagina