OCR資料提取

自動從各種政府發佈的文檔中提取資料以填充自適應表單。

有許多組織提供此服務,只要他們有詳細的REST API文檔,您就可以使用資料整合功能輕鬆與AEM Forms整合。 在本教程中,我使用 ID分析器 演示上載文檔的OCR資料提取。

接下來是使用ID Analyzer服務使用AEM Forms實現OCR資料提取。

建立開發人員帳戶

建立開發人員帳戶 ID分析器。 記下API密鑰。 調用ID Analyzer服務的REST API時需要此鍵。

建立Swagger/OpenAPI檔案

OpenAPI規範(以前稱為Swagger規範)是REST API的API說明格式。 OpenAPI檔案允許您描述整個API,包括:

  • 可用端點(/users?lang=zh-Hant)和每個端點上的操作(GET/users、POST/users)
  • 操作參數每個操作的輸入和輸出身份驗證方法
  • 聯繫資訊、許可證、使用條款和其他資訊。
  • API規範可以用YAML或JSON編寫。 該格式易於學習,對人和機器都易讀。

要建立第一個swagger/OpenAPI檔案,請按照 OpenAPI文檔

注意

AEM Forms支援OpenAPI規範2.0版(fka Swagger)。

使用 斯瓦格編輯器 建立swagger檔案,以描述使用SMS發送和驗證OTP代碼的操作。 可以使用JSON或YAML格式建立swagger檔案。 已完成的交換器檔案可從 這裡

定義swagger檔案時的注意事項

  • 需要定義
  • $ref需要用於方法定義
  • 希望定義消耗和生成節
  • 不定義內聯請求正文參數或響應參數。 盡量模組化。 例如,不支援以下定義
 "name": "body",
            "in": "body",
            "required": false,
            "schema": {
              "type": "object",
              "properties": {
                "Rollnum": {
                  "type": "string",
                  "description": "Rollnum"
                }
              }
            }

對requestBody定義的引用支援以下內容

 "name": "requestBody",
            "in": "body",
            "required": false,
            "schema": {
              "$ref": "#/definitions/requestBody"
            }

建立資料源

要將AEM/AEM Forms與第三方應用程式整合,我們需要 建立資料源 在雲服務配置中。 請使用 swagger檔案 建立資料源。

建立表單資料模型

AEM Forms資料整合提供直觀的用戶介面,用於建立和使用 表單資料模型。 將表單資料模型建立在前面步驟中建立的資料源上。

fd

建立客戶端庫

我們需要獲取上載文檔的base64編碼字串。 然後,此base64編碼字串作為REST調用的參數之一傳遞。
可以下載客戶端庫 從這裡。

建立自適應窗體

將表單資料模型的POST調用與自適應表單整合,以從表單中由用戶上載的文檔中提取資料。 您可以建立自己的自適應表單並使用表單資料模型的POST調用來發送上載文檔的base64編碼字串。

在伺服器上部署

如果要將示例資產與API密鑰一起使用,請執行以下步驟:

本頁內容