Extracción de datos de OCR

Extraer automáticamente datos de una amplia variedad de documentos emitidos por el gobierno para rellenar sus formularios adaptables.

Existen varias organizaciones que proporcionan este servicio y, siempre que tengan API de REST bien documentadas, podrá integrarlas fácilmente con AEM Forms mediante la función de integración de datos. A los efectos de este tutorial, he utilizado Analizador de ID para demostrar la extracción de datos OCR de documentos cargados.

Se siguieron los siguientes pasos para implementar la extracción de datos OCR con AEM Forms mediante el servicio de ID Analyzer.

Crear cuenta de desarrollador

Cree una cuenta de desarrollador con Analizador de ID. Anote la clave de API. Esta clave será necesaria para invocar las API de REST del servicio de ID Analyzer.

Crear archivo Swagger/OpenAPI

La especificación OpenAPI (anteriormente la especificación Swagger) es un formato de descripción de API para las API de REST. Un archivo OpenAPI le permite describir toda la API, lo que incluye:

  • Puntos finales disponibles (/usuarios?lang=es) y operaciones en cada punto final (GET/usuarios, POST/usuarios)
  • Parámetros de operación Entrada y salida para cada operación Métodos de autenticación
  • Información de contacto, licencia, términos de uso y otra información.
  • Las especificaciones de API se pueden escribir en YAML o JSON. El formato es fácil de aprender y de leer tanto para humanos como para máquinas.

Para crear su primer archivo swagger/OpenAPI, siga el Documentación de OpenAPI

NOTA

AEM Forms admite OpenAPI Specification versión 2.0 (fka Swagger).

Utilice la variable editor de swagger para crear el archivo swagger para describir las operaciones que envían y verifican el código OTP enviado mediante SMS. El archivo de intercambio se puede crear en formato JSON o YAML. El archivo de cambio completado se puede descargar desde here

Consideraciones al definir el archivo de intercambio

  • Se requieren definiciones
  • $ref debe usarse para definiciones de métodos
  • Prefiere tener definidas secciones que consuman y produzcan
  • No defina parámetros de cuerpo de solicitud en línea ni parámetros de respuesta. Trate de modularizar tanto como sea posible. Por ejemplo, no se admite la siguiente definición
 "name": "body",
            "in": "body",
            "required": false,
            "schema": {
              "type": "object",
              "properties": {
                "Rollnum": {
                  "type": "string",
                  "description": "Rollnum"
                }
              }
            }

Lo siguiente se admite con una referencia a requestBody definition

 "name": "requestBody",
            "in": "body",
            "required": false,
            "schema": {
              "$ref": "#/definitions/requestBody"
            }

Crear fuente de datos

Para integrar AEM/AEM Forms con aplicaciones de terceros, necesitamos crear fuente de datos en la configuración de cloud services. Utilice el archivo swagger para crear la fuente de datos.

Crear modelo de datos de formulario

La integración de datos de AEM Forms proporciona una interfaz de usuario intuitiva para crear y trabajar con modelos de datos de formulario. Base el modelo de datos de formulario en el origen de datos creado en el paso anterior.

fdm

Crear lista de clientes

Necesitaríamos obtener la cadena codificada base64 del documento cargado. Esta cadena codificada base64 se pasa como uno de los parámetros de nuestra invocación REST.
La biblioteca de cliente se puede descargar desde aquí.

Crear formulario adaptable

Integre las invocaciones del POST del Modelo de datos de formulario con el formulario adaptable para extraer datos del documento cargado por el usuario en el formulario. Puede crear su propio formulario adaptable y utilizar la invocación del POST del modelo de datos de formulario para enviar la cadena codificada base64 del documento cargado.

Implementar en el servidor

Si desea utilizar los recursos de ejemplo con su clave de API, siga los siguientes pasos:

En esta página