OCR-Datenextraktion

Sie können automatisch Daten aus einer Vielzahl von staatlich ausgestellten Dokumenten extrahieren, um Ihre adaptiven Formulare zu befüllen.

Es gibt eine Reihe von Organisationen, die diesen Dienst bereitstellen. Sofern diese über gut dokumentierte REST-APIs verfügen, können Sie AEM Forms mithilfe der Datenintegrationsfunktionen problemlos integrieren. Im Rahmen dieses Tutorials wird ID Analyzer verwendet, um die OCR-Datenextraktion hochgeladener Dokumente zu demonstrieren.

Die folgenden Schritte wurden ausgeführt, um die OCR-Datenextraktion mit AEM Forms mithilfe des ID Analyzer-Diensts zu implementieren.

Erstellen eines Entwicklerkontos

Erstellen Sie ein Entwicklerkonto mit ID Analyzer. Notieren Sie sich den API-Schlüssel. Dieser Schlüssel ist erforderlich, um REST-APIs des ID Analyzer-Diensts aufzurufen.

Erstellen einer Swagger/OpenAPI-Datei

Die OpenAPI-Spezifikation (früher Swagger-Spezifikation) ist ein API-Beschreibungsformat für REST-APIs. Mit einer OpenAPI-Datei können Sie Ihre gesamte API beschreiben, einschließlich:

  • verfügbarer Endpunkte (https://experienceleague.adobe.com/users?lang=de) und der Vorgänge für jeden Endpunkt (GET /users, POST /users)
  • Aktionsparameter-Eingabe und -Ausgabe für jeden Vorgang
    Authentifizierungsmethoden
  • Kontaktinformationen, Lizenz, Nutzungsbedingungen und sonstiger Informationen
  • API-Spezifikationen können in YAML oder JSON geschrieben werden. Das Format ist sowohl für Menschen als auch für Maschinen leicht zu erlernen und lesbar.

Um Ihre erste Swagger/OpenAPI-Datei zu erstellen, befolgen Sie die OpenAPI-Dokumentation.

NOTE
AEM Forms unterstützt die OpenAPI-Spezifikationsversion 2.0 (früher Swagger).

Verwenden Sie den Swagger-Editor, um Ihre Swagger-Datei zu erstellen und die Vorgänge zu beschreiben, bei denen per SMS ein OTP-Code gesendet und überprüft wird. Die Swagger-Datei kann im JSON- oder YAML-Format erstellt werden. Die fertige Swagger-Datei kann hier heruntergeladen werden.

Aspekte beim Definieren der Swagger-Datei

  • Definitionen sind erforderlich.
  • $ref muss für Methodendefinitionen verwendet werden.
  • Ziehen Sie es vor, Verbrauchs- und Produktionsabschnitte zu definieren.
  • Definieren Sie keine Inline-Anfragetext- oder -Antwortparameter. Versuchen Sie, so viel wie möglich zu modularisieren. So wird etwa die folgende Definition nicht unterstützt:
 "name": "body",
            "in": "body",
            "required": false,
            "schema": {
              "type": "object",
              "properties": {
                "Rollnum": {
                  "type": "string",
                  "description": "Rollnum"
                }
              }
            }

Folgendes wird mit einem Verweis auf die requestBody-Definition unterstützt.

 "name": "requestBody",
            "in": "body",
            "required": false,
            "schema": {
              "$ref": "#/definitions/requestBody"
            }

Erstellen einer Datenquelle

Um AEM/AEM Forms in Drittanbieteranwendungen zu integrieren, ist die Erstellung einer Datenquelle in der Cloud-Service-Konfiguration erforderlich. Verwenden Sie die Swagger-Datei, um Ihre Datenquelle zu erstellen.

Erstellen eines Formulardatenmodells

Die AEM Forms-Datenintegration bietet eine intuitive Benutzeroberfläche zum Erstellen von und Arbeiten mit Formulardatenmodellen. Stützen Sie das Formulardatenmodell auf die Datenquelle, die im vorherigen Schritt erstellt wurde.

FDM

Erstellen einer Client-Bibliothek

Wir müssen eine base64-codierte Zeichenfolge des hochgeladenen Dokuments abrufen. Diese base64-codierte Zeichenfolge wird dann als ein Parameter unseres REST-Aufrufs weitergeben.
Die Client-Bibliothek kann hier heruntergeladen werden.

Erstellen eines adaptiven Formulars

Integrieren Sie die POST-Aufrufe des Formulardatenmodells in Ihr adaptives Formular, um Daten aus dem von der Person hochgeladenen Dokument für das Formular zu extrahieren. Sie können Ihr eigenes adaptives Formular erstellen und den POST-Aufruf des Formulardatenmodells verwenden, um die base64-codierte Zeichenfolge des hochgeladenen Dokuments zu senden.

Bereitstellen auf Ihrem Server

Wenn Sie die Beispiel-Assets mit Ihrem API-Schlüssel verwenden möchten, gehen Sie wie folgt vor:

recommendation-more-help
8de24117-1378-413c-a581-01e660b7163e