Estrazione dati OCR

Estrarre automaticamente i dati da un'ampia varietà di documenti rilasciati dal governo per compilare i moduli adattivi.

Esistono diverse organizzazioni che forniscono questo servizio e, finché dispongono di API REST ben documentate, puoi facilmente integrarsi con AEM Forms utilizzando la funzionalità di integrazione dei dati. Ai fini di questa esercitazione, ho utilizzato Analizzatore di ID dimostrare l’estrazione dei dati OCR dei documenti caricati.

Sono stati seguiti i passaggi seguenti per implementare l’estrazione dei dati OCR con AEM Forms utilizzando il servizio ID Analyzer .

Creare un account sviluppatore

Crea un account sviluppatore con Analizzatore di ID. Prendi nota della chiave API. Questa chiave sarà necessaria per richiamare le API REST del servizio di ID Analyzer.

Crea file Swagger/OpenAPI

La specifica OpenAPI (precedentemente specifica Swagger) è un formato di descrizione API per le API REST. Un file OpenAPI ti consente di descrivere l’intera API, tra cui:

  • Endpoint disponibili (/users?lang=it) e operazioni su ciascun endpoint (GET/users, POST/users)
  • Parametri operativi Input ed output per ogni operazione Metodi di autenticazione
  • Informazioni di contatto, licenza, termini di utilizzo e altre informazioni.
  • Le specifiche API possono essere scritte in YAML o JSON. Il formato è facile da imparare e leggibile sia per gli umani che per le macchine.

Per creare il tuo primo file swagger/OpenAPI, segui Documentazione OpenAPI

NOTA

AEM Forms supporta la specifica OpenAPI versione 2.0 (fka Swagger).

Utilizza la editor swagger per creare il file swagger per descrivere le operazioni che inviano e verificano il codice OTP inviato utilizzando SMS. Il file swagger può essere creato in formato JSON o YAML. Il file swagger completato può essere scaricato da qui

Considerazioni durante la definizione del file di swagger

  • Definizioni necessarie
  • $ref deve essere utilizzato per le definizioni dei metodi
  • Preferisci che le sezioni di consumo e di produzione siano definite
  • Non definire parametri del corpo della richiesta in linea o parametri di risposta. Cerca di modularizzare il più possibile. Ad esempio, la seguente definizione non è supportata
 "name": "body",
            "in": "body",
            "required": false,
            "schema": {
              "type": "object",
              "properties": {
                "Rollnum": {
                  "type": "string",
                  "description": "Rollnum"
                }
              }
            }

È supportato quanto segue con un riferimento alla definizione requestBody

 "name": "requestBody",
            "in": "body",
            "required": false,
            "schema": {
              "$ref": "#/definitions/requestBody"
            }

Crea origine dati

Per integrare AEM/AEM Forms con applicazioni di terze parti, è necessario crea origine dati nella configurazione dei servizi cloud. Utilizza la file swagger per creare l'origine dati.

Crea modello dati modulo

L’integrazione dei dati di AEM Forms offre un’interfaccia utente intuitiva con cui creare e lavorare modelli di dati modulo. Basare il modello dati del modulo sull’origine dati creata nel passaggio precedente.

fdm

Crea libreria client

Dovremo ottenere una stringa codificata base64 del documento caricato. Questa stringa codificata base64 viene quindi passata come uno dei parametri della nostra chiamata REST.
È possibile scaricare la libreria client da qui.

Creare un modulo adattivo

Integra le chiamate POST del modello dati modulo con il modulo adattivo per estrarre i dati dal documento caricato dall’utente nel modulo. Puoi creare un modulo adattivo e utilizzare la chiamata POST del modello dati modulo per inviare la stringa codificata base64 del documento caricato.

Distribuisci sul server

Se desideri utilizzare le risorse di esempio con la tua chiave API, segui i seguenti passaggi:

In questa pagina