文字出現與光學字元辨識

指定影像時,文字存在/光學字元辨識(OCR)服務可指出影像中是否有文字。 如果文字存在,OCR可以傳回文字。

本檔案所示的範例請求中使用了下列影像:

範例影像

API格式

POST /services/v2/predict

要求

以下請求會根據承載中提供的輸入影像檢查文字是否存在。 請參閱裝載範例下表,以瞭解有關所示輸入引數的詳細資訊。

使用內嵌影像執行:

curl -w'\n' -i -X POST https://sensei.adobe.io/services/v2/predict \
-H 'Prefer: respond-async, wait=59' \
-H "x-api-key: $API_KEY" \
-H "content-type: multipart/form-data" \
-H "authorization: Bearer $API_TOKEN" \
-F file=@sample_image.png \
-F 'contentAnalyzerRequests={
  "sensei:name": "Feature:cintel-object-detection:Service-b9ace8b348b6433e9e7d82371aa16690",
  "sensei:invocation_mode": "asynchronous",
  "sensei:invocation_batch": false,
  "sensei:engines": [
    {
      "sensei:execution_info": {
        "sensei:engine": "Feature:cintel-object-detection:Service-b9ace8b348b6433e9e7d82371aa16690"
      },
      "sensei:inputs": {
        "documents": [
        {
          "sensei:multipart_field_name": "file",
          "dc:format": "image/jpg"
        }
        ]
      },
      "sensei:params": {
        "correct_with_dictionary": true,
        "min_probability": 0.2,
        "min_relevance": 0.01,
        "filter_with_dictionary": true
      },
      "sensei:outputs":{
        "result" : {
          "sensei:multipart_field_name" : "result",
          "dc:format": "application/json"
        }
      }
    }
  ]
}'

回應

成功的回應會傳回在中偵測到的文字 tags 要求中傳遞的每個影像的清單。 如果特定影像中沒有文字, is_text_present 為0且 tags 是空白清單。

[result0, result1, …]:每個輸入檔案的回應清單。 每個結果都是一個含有鍵的指令:

  1. request_element_id:此回應之輸入檔案的對應索引,0代表請求檔案清單中的第一個影像,1代表下一個影像,以此類推。
  2. 標籤:字典清單,每個字典有兩個索引鍵:文字(從影像中可辨識的字詞)和關聯性(計算為擷取文字的邊界方塊區域與完整影像相較之下的分數)。 0.01會翻譯成至少佔影像1%的文字。
  3. is_text_present: 0或1 (視影像中是否有文字而定)。 如果標籤為0,則清單為空白。
{
  "contentAnalyzerResponse": {
    "statuses": [
      {
        "sensei:engine": "Feature:cintel-object-detection:Service-b9ace8b348b6433e9e7d82371aa16690",
        "invocations": [
          {
            "sensei:outputs": {
              "result": {
                "sensei:multipart_field_name": "result",
                "dc:format": "application/json"
              }
            },
            "message": null,
            "status": "200"
          }
        ]
      }
    ],
    "request_id": "dttklFR7DPtMtEmjlRSx5BYP5WGg3tTx"
  },
  "result": [
    {
      "is_text_present": 1,
      "tags": [
        {
          "text": "yosemite",
          "relevance": 0.06
        }
      ],
      "request_element_id": 0
    }
  ]
}

要求

以下請求會根據承載中提供的輸入影像檢查文字是否存在。 請參閱裝載範例下表,以瞭解有關所示輸入引數的詳細資訊。

以URL執行:

curl -w'\n' -i -X POST https://sensei.adobe.io/services/v2/predict \
-H 'Prefer: respond-async, wait=59' \
-H "x-api-key: $API_KEY" \
-H "content-type: multipart/form-data" \
-H "authorization: Bearer $API_TOKEN" \
-F 'contentAnalyzerRequests={
  "sensei:name": "Feature:cintel-object-detection:Service-b9ace8b348b6433e9e7d82371aa16690",
  "sensei:invocation_mode": "asynchronous",
  "sensei:invocation_batch": false,
  "sensei:engines": [
    {
      "sensei:execution_info": {
        "sensei:engine": "Feature:cintel-object-detection:Service-b9ace8b348b6433e9e7d82371aa16690"
      },
      "sensei:inputs": {
        "documents": [
        {
          "repo:path": <IMG_URL_PATH>,
          "sensei:repoType": "HTTP",
          "dc:format": "image/jpg"
        }
        ]
      },
      "sensei:params": {
        "correct_with_dictionary": true
      },
      "sensei:outputs":{
        "result" : {
          "sensei:multipart_field_name" : "result",
          "dc:format": "application/json"
        }
      }
    }
  ]
}'
{
  "contentAnalyzerResponse": {
    "statuses": [
      {
        "sensei:engine": "Feature:cintel-object-detection:Service-b9ace8b348b6433e9e7d82371aa16690",
        "invocations": [
          {
            "sensei:outputs": {
              "result": {
                "sensei:multipart_field_name": "result",
                "dc:format": "application/json"
              }
            },
            "message": null,
            "status": "200"
          }
        ]
      }
    ],
    "request_id": "ZbdhcK0JqS4Wg1wGdlEHGR3JOm530YNn"
  },
  "result": [
    {
      "is_text_present": 0,
      "tags": [],
      "request_element_id": 0
    }
  ]
}
屬性
說明
必要
documents
JSON元素清單,清單中的每個專案代表一個影像。 作為此清單的一部分傳遞的任何引數,都會針對對應的清單元素覆寫在清單外部指定的全域引數。
sensei:multipart_field_name
要讀取輸入檔案路徑的field_name。
repo:path
影像資產的預先簽署url。
sensei:repoType
"HTTP" (適用於預先簽署的url)。
dc:format
輸入影像的編碼格式。 影像編碼僅允許影像格式,例如jpeg、jpg、png和tiff。 dc:format與允許的格式相符。
correct_with_dictionary
是否使用英文字典來更正這些字詞? 如果未開啟此功能,您可能會識別出非英文單字。 預設值為True:開啟。) 請注意,開啟字典時,您不一定一定要收到英文單字。 我們會嘗試修正它,但如果無法在特定的編輯距離內修正,我們會傳回原始單字。
filter_with_dictionary
是否要篩選單字,使其只包含英文字典中的單字? 如果開啟此功能,傳回的單字將一律屬於大型英文,包含47萬個單字。
min_probability
已識別字詞的最小機率為何? 服務只會傳回從影像擷取而來的單字,而且這些字的機率大於min_probability。 預設值設定為0.2。
min_relevance
已識別字詞的最低關聯性為何? 服務只會傳回從影像擷取而來的單字,而且這些單字的相關性比min_relevance還大。 預設值設定為0.01。相關性的計算方式為擷取文字的邊界方塊區域與完整影像的比較比例。 0.01會翻譯成至少佔影像1%的文字。
名稱
資料類型
必填
預設
說明
repo:path
字串
-
-
-
需要從中擷取文字之影像的預留URL。
sensei:repoType
字串
-
-
HTTPS
儲存影像的存放庫型別。
sensei:multipart_field_name
字串
-
-
-
將影像作為多部分引數傳遞時,請使用此選項,而不使用預先簽署的URL。
dc:format
字串
-
"image/jpg",
"image/jpeg",
"image/png",
"image/tiff"
影像編碼在處理前會根據允許的輸入編碼型別進行檢查。
recommendation-more-help
8959a20a-a58f-4057-9f82-870706c576e9