OCR資料擷取

自動從各種政府核發的檔案中擷取資料,以填入最適化表單。

有許多組織提供此服務,只要他們有記錄完善的REST API,您就可以使用資料整合功能,輕鬆與AEM Forms整合。 在本教學課程中,我已使用 ID分析器 演示已上載文檔的OCR資料提取。

請依照下列步驟,使用ID Analyzer服務,透過AEM Forms實作OCR資料擷取。

建立開發人員帳戶

使用建立開發人員帳戶 ID分析器. 記下API金鑰。 需要此金鑰才能叫用ID Analyzer服務的REST API。

建立Swagger/OpenAPI檔案

OpenAPI規格(原稱Swagger規格)是REST API的API說明格式。 OpenAPI檔案可讓您描述整個API,包括:

  • 每個端點上的可用端點(/users?lang=zh-Hant)和操作(GET/users、POST/users)
  • 操作參數每個操作的輸入和輸出身份驗證方法
  • 聯絡資訊、授權、使用條款和其他資訊。
  • API規格可以用YAML或JSON編寫。 該格式便於人和機器學習和閱讀。

若要建立您的第一個swagger/OpenAPI檔案,請遵循 OpenAPI檔案

注意

AEM Forms支援OpenAPI規格2.0版(fka Swagger)。

使用 swagger編輯器 建立swagger檔案,以說明使用簡訊傳送及驗證OTP程式碼的操作。 可以使用JSON或YAML格式建立Swagger檔案。 已完成的Swagger檔案可從 此處

定義Swagger檔案時的考量事項

  • 需要定義
  • $ref需要用於方法定義
  • 偏好使用並生成已定義的節
  • 請勿定義內嵌要求內文參數或回應參數。 盡量模組化。 例如,不支援下列定義
 "name": "body",
            "in": "body",
            "required": false,
            "schema": {
              "type": "object",
              "properties": {
                "Rollnum": {
                  "type": "string",
                  "description": "Rollnum"
                }
              }
            }

參考requestBody定義支援下列項目

 "name": "requestBody",
            "in": "body",
            "required": false,
            "schema": {
              "$ref": "#/definitions/requestBody"
            }

建立資料來源

若要將AEM/AEM Forms與協力廠商應用程式整合,我們需要 建立資料來源 在雲端服務設定中。 請使用 swagger檔案 來建立您的資料來源。

建立表單資料模型

AEM Forms資料整合提供直覺式的使用者介面,讓您建立及使用 表單資料模型. 將表單資料模型建立在先前步驟中建立的資料來源上。

fdm

建立客戶端庫

我們需要上傳檔案的base64編碼字串。 接著,系統會將此base64編碼字串作為REST呼叫的參數之一傳遞。
可下載用戶端程式庫 從這裡。

建立最適化表單

將表單資料模型的POST調用與最適化表單整合,以從表單中的用戶上載的文檔中提取資料。 您可以自由建立自己的最適化表單,並使用表單資料模型的POST叫用,傳送已上傳檔案的base64編碼字串。

在伺服器上部署

如果您想搭配API金鑰使用範例資產,請遵循下列步驟:

本頁內容