画像を指定すると、テキストの有無/光学式文字認識 (OCR) サービスは、画像内にテキストが存在するかどうかを示すことができます。 テキストが存在する場合、OCR はテキストを返すことができます。
このドキュメントの例では、次の画像が使用されています。
API 形式
POST /services/v2/predict
リクエスト
次のリクエストは、ペイロードで提供された入力画像に基づいて、テキストが存在するかどうかを確認します。 表示される入力パラメーターの詳細については、サンプルのペイロードの下の表を参照してください。
インライン画像を使用した実行:
curl -w'\n' -i -X POST https://sensei.adobe.io/services/v2/predict \
-H 'Prefer: respond-async, wait=59' \
-H "x-api-key: $API_KEY" \
-H "content-type: multipart/form-data" \
-H "authorization: Bearer $API_TOKEN" \
-F file=@sample_image.png \
-F 'contentAnalyzerRequests={
"sensei:name": "Feature:cintel-object-detection:Service-b9ace8b348b6433e9e7d82371aa16690",
"sensei:invocation_mode": "asynchronous",
"sensei:invocation_batch": false,
"sensei:engines": [
{
"sensei:execution_info": {
"sensei:engine": "Feature:cintel-object-detection:Service-b9ace8b348b6433e9e7d82371aa16690"
},
"sensei:inputs": {
"documents": [
{
"sensei:multipart_field_name": "file",
"dc:format": "image/jpg"
}
]
},
"sensei:params": {
"correct_with_dictionary": true,
"min_probability": 0.2,
"min_relevance": 0.01,
"filter_with_dictionary": true
},
"sensei:outputs":{
"result" : {
"sensei:multipart_field_name" : "result",
"dc:format": "application/json"
}
}
}
]
}'
応答
正常な応答は、 tags
リストに表示されます。 特定の画像にテキストがない場合、 is_text_present
が 0 かつ tags
は空のリストです。
[result0, result1, …]:各入力ドキュメントの応答のリスト。 それぞれの結果は、次のキーを持つディクトです。
{
"contentAnalyzerResponse": {
"statuses": [
{
"sensei:engine": "Feature:cintel-object-detection:Service-b9ace8b348b6433e9e7d82371aa16690",
"invocations": [
{
"sensei:outputs": {
"result": {
"sensei:multipart_field_name": "result",
"dc:format": "application/json"
}
},
"message": null,
"status": "200"
}
]
}
],
"request_id": "dttklFR7DPtMtEmjlRSx5BYP5WGg3tTx"
},
"result": [
{
"is_text_present": 1,
"tags": [
{
"text": "yosemite",
"relevance": 0.06
}
],
"request_element_id": 0
}
]
}
リクエスト
次のリクエストは、ペイロードで提供された入力画像に基づいて、テキストが存在するかどうかを確認します。 表示される入力パラメーターの詳細については、サンプルのペイロードの下の表を参照してください。
URL での実行:
curl -w'\n' -i -X POST https://sensei.adobe.io/services/v2/predict \
-H 'Prefer: respond-async, wait=59' \
-H "x-api-key: $API_KEY" \
-H "content-type: multipart/form-data" \
-H "authorization: Bearer $API_TOKEN" \
-F 'contentAnalyzerRequests={
"sensei:name": "Feature:cintel-object-detection:Service-b9ace8b348b6433e9e7d82371aa16690",
"sensei:invocation_mode": "asynchronous",
"sensei:invocation_batch": false,
"sensei:engines": [
{
"sensei:execution_info": {
"sensei:engine": "Feature:cintel-object-detection:Service-b9ace8b348b6433e9e7d82371aa16690"
},
"sensei:inputs": {
"documents": [
{
"repo:path": <IMG_URL_PATH>,
"sensei:repoType": "HTTP",
"dc:format": "image/jpg"
}
]
},
"sensei:params": {
"correct_with_dictionary": true
},
"sensei:outputs":{
"result" : {
"sensei:multipart_field_name" : "result",
"dc:format": "application/json"
}
}
}
]
}'
{
"contentAnalyzerResponse": {
"statuses": [
{
"sensei:engine": "Feature:cintel-object-detection:Service-b9ace8b348b6433e9e7d82371aa16690",
"invocations": [
{
"sensei:outputs": {
"result": {
"sensei:multipart_field_name": "result",
"dc:format": "application/json"
}
},
"message": null,
"status": "200"
}
]
}
],
"request_id": "ZbdhcK0JqS4Wg1wGdlEHGR3JOm530YNn"
},
"result": [
{
"is_text_present": 0,
"tags": [],
"request_element_id": 0
}
]
}
プロパティ | 説明 | 必須 |
---|---|---|
documents |
リスト内の各項目が 1 つの画像を表す JSON 要素のリスト。 このリストの一部として渡されたパラメーターは、対応するリスト要素に対して、リストの外部で指定されたグローバルパラメーターを上書きします。 | ○ |
sensei:multipart_field_name |
入力ファイルのパスを読み込む field_name。 | ○ |
repo:path |
画像アセットの事前署名済み URL。 | ○ |
sensei:repoType |
"HTTP" (presigned-url 用) | いいえ |
dc:format |
入力画像のエンコードされた形式。 画像エンコーディングで使用できるのは、jpeg、jpg、png、tiff などの画像形式のみです。 dc:format は、許可された書式と照合されます。 | いいえ |
correct_with_dictionary |
英語の辞書で単語を修正するか。 このオプションをオンにしないと、英語以外の単語が認識される可能性があります。 デフォルトは True です。オン ) 辞書がオンになっている場合、常に英語の単語を取得する必要はありません。 修正を試みますが、ある編集距離内で不可能な場合は、元の単語を返します。 | いいえ |
filter_with_dictionary |
英語の辞書にある単語のみを含むように単語をフィルターするかどうか。 このオプションをオンにすると、返される単語は常に大きな英語に属し、470,000 個の単語で構成されます。 | いいえ |
min_probability |
認識された単語の最小確率はどれくらいですか? min_probability よりも高い確率を持つ、画像から抽出された単語のみがサービスによって返されます。 デフォルト値は 0.2 に設定されています。 | いいえ |
min_relevance |
認識された単語に対する最小の関連性は何ですか? サービスは、画像から抽出され、min_relevance よりも関連度が高い単語のみを返します。 デフォルト値は 0.01 に設定されています。関連度は、抽出されたテキストのバウンディングボックスの領域の割合(全画像と比較した場合)として計算されます。 0.01 を指定すると、画像の少なくとも 1%を占めるテキストに変換されます。 | いいえ |
名前 | データタイプ | 必須 | デフォルト | 値 | 説明 |
---|---|---|---|---|---|
repo:path |
文字列 | - | - | - | テキストの抽出元となる画像の署名済み URL。 |
sensei:repoType |
文字列 | - | - | HTTPS | 画像が保存されるリポジトリのタイプ。 |
sensei:multipart_field_name |
文字列 | - | - | - | 画像を、署名済みの URL を使用する代わりにマルチパート引数として渡す場合に使用します。 |
dc:format |
文字列 | ○ | - | "image/jpg", "image/jpeg", "image/png", "image/tiff" |
画像のエンコーディングは、処理前に、許可されている入力エンコーディングタイプと照合されます。 |