텍스트 유무 및 광학 인식
이미지가 주어지면 텍스트 유무/광학 문자 인식(OCR) 서비스는 이미지에 텍스트가 있는지 여부를 나타낼 수 있습니다. 텍스트가 있으면 OCR에서 텍스트를 반환할 수 있습니다.
이 문서에 표시된 예제 요청에서는 다음 이미지가 사용되었습니다.
API 형식
POST /services/v2/predict
요청
다음 요청은 페이로드에 제공된 입력 이미지를 기반으로 텍스트가 존재하는지 확인합니다. 표시된 입력 매개 변수에 대한 자세한 내용은 예제 페이로드 아래의 표를 참조하십시오.
인라인 이미지를 사용한 실행:
curl -w'\n' -i -X POST https://sensei.adobe.io/services/v2/predict \
-H 'Prefer: respond-async, wait=59' \
-H "x-api-key: $API_KEY" \
-H "content-type: multipart/form-data" \
-H "authorization: Bearer $API_TOKEN" \
-F file=@sample_image.png \
-F 'contentAnalyzerRequests={
"sensei:name": "Feature:cintel-object-detection:Service-b9ace8b348b6433e9e7d82371aa16690",
"sensei:invocation_mode": "asynchronous",
"sensei:invocation_batch": false,
"sensei:engines": [
{
"sensei:execution_info": {
"sensei:engine": "Feature:cintel-object-detection:Service-b9ace8b348b6433e9e7d82371aa16690"
},
"sensei:inputs": {
"documents": [
{
"sensei:multipart_field_name": "file",
"dc:format": "image/jpg"
}
]
},
"sensei:params": {
"correct_with_dictionary": true,
"min_probability": 0.2,
"min_relevance": 0.01,
"filter_with_dictionary": true
},
"sensei:outputs":{
"result" : {
"sensei:multipart_field_name" : "result",
"dc:format": "application/json"
}
}
}
]
}'
응답
성공한 응답은 요청에서 전달된 각 이미지에 대해 tags 목록에서 검색된 텍스트를 반환합니다. 특정 이미지에 텍스트가 없으면 is_text_present은(는) 0이고 tags은(는) 빈 목록입니다.
[result0, result1, …]: 각 입력 문서에 대한 응답 목록입니다. 각 결과는 키가 있는 dict입니다.
- request_element_id: 이 응답에 대한 입력 파일에 해당하는 인덱스, 요청의 문서 목록에 있는 첫 번째 이미지에 대해 0, 다음 이미지에 대해 1 등입니다.
- 태그: 사전 목록에는 각 사전에는 두 개의 키, 즉 이미지에서 인식된 단어인 텍스트와 전체 이미지와 비교하여 추출된 텍스트의 테두리 상자 영역의 비율로 계산되는 관련성이 있습니다. 0.01은 이미지의 최소 1%를 차지하는 텍스트로 변환됩니다.
- is_text_present: 이미지에 텍스트가 있는지 여부에 따라 0 또는 1입니다. 태그가 0이면 목록이 비어 있습니다.
{
"contentAnalyzerResponse": {
"statuses": [
{
"sensei:engine": "Feature:cintel-object-detection:Service-b9ace8b348b6433e9e7d82371aa16690",
"invocations": [
{
"sensei:outputs": {
"result": {
"sensei:multipart_field_name": "result",
"dc:format": "application/json"
}
},
"message": null,
"status": "200"
}
]
}
],
"request_id": "dttklFR7DPtMtEmjlRSx5BYP5WGg3tTx"
},
"result": [
{
"is_text_present": 1,
"tags": [
{
"text": "yosemite",
"relevance": 0.06
}
],
"request_element_id": 0
}
]
}
요청
다음 요청은 페이로드에 제공된 입력 이미지를 기반으로 텍스트가 존재하는지 확인합니다. 표시된 입력 매개 변수에 대한 자세한 내용은 예제 페이로드 아래의 표를 참조하십시오.
URL을 사용한 실행:
curl -w'\n' -i -X POST https://sensei.adobe.io/services/v2/predict \
-H 'Prefer: respond-async, wait=59' \
-H "x-api-key: $API_KEY" \
-H "content-type: multipart/form-data" \
-H "authorization: Bearer $API_TOKEN" \
-F 'contentAnalyzerRequests={
"sensei:name": "Feature:cintel-object-detection:Service-b9ace8b348b6433e9e7d82371aa16690",
"sensei:invocation_mode": "asynchronous",
"sensei:invocation_batch": false,
"sensei:engines": [
{
"sensei:execution_info": {
"sensei:engine": "Feature:cintel-object-detection:Service-b9ace8b348b6433e9e7d82371aa16690"
},
"sensei:inputs": {
"documents": [
{
"repo:path": <IMG_URL_PATH>,
"sensei:repoType": "HTTP",
"dc:format": "image/jpg"
}
]
},
"sensei:params": {
"correct_with_dictionary": true
},
"sensei:outputs":{
"result" : {
"sensei:multipart_field_name" : "result",
"dc:format": "application/json"
}
}
}
]
}'
{
"contentAnalyzerResponse": {
"statuses": [
{
"sensei:engine": "Feature:cintel-object-detection:Service-b9ace8b348b6433e9e7d82371aa16690",
"invocations": [
{
"sensei:outputs": {
"result": {
"sensei:multipart_field_name": "result",
"dc:format": "application/json"
}
},
"message": null,
"status": "200"
}
]
}
],
"request_id": "ZbdhcK0JqS4Wg1wGdlEHGR3JOm530YNn"
},
"result": [
{
"is_text_present": 0,
"tags": [],
"request_element_id": 0
}
]
}
속성
설명
필수
documents목록의 각 항목이 하나의 이미지를 나타내는 JSON 요소 목록입니다. 이 목록의 일부로 전달된 모든 매개 변수는 해당 목록 요소에 대해 목록 외부에 지정된 전역 매개 변수를 재정의합니다.
예
sensei:multipart_field_name입력 파일 경로를 읽을 field_name입니다.
예
repo:path이미지 자산에 대한 사전 서명된 URL입니다.
예
sensei:repoType"HTTP"(사전 서명된 URL용).
아니요
dc:format입력 이미지의 인코딩된 형식입니다. jpeg, jpg, png 및 tiff와 같은 이미지 형식만 이미지 인코딩에 사용할 수 있습니다. dc:format은 허용된 형식에 대해 일치합니다.
아니요
correct_with_dictionary그 단어들을 영어사전으로 고칠 것인가? 이 기능이 설정되어 있지 않으면 영어가 아닌 단어가 인식될 수 있습니다. 기본값은 True로 설정되어 있습니다.) 사전이 켜져 있을 때, 항상 영어 단어를 얻을 필요는 없습니다. 수정하려고 노력하지만, 일정한 편집 거리 내에서 불가능하면 원어를 돌려준다.
아니요
filter_with_dictionary영어 사전의 단어만 포함하도록 단어를 필터링할지 여부 이 기능이 켜지면 반환된 단어는 항상 470k 단어로 구성된 큰 영어에 속합니다.
아니요
min_probability인식된 단어의 최소 확률은 얼마인가? 이미지에서 추출되고 min_probability보다 더 큰 확률을 갖는 단어만 서비스에서 반환됩니다. 기본값은 0.2로 설정되어 있습니다.
아니요
min_relevance인식된 단어의 최소 연관성은 무엇입니까? 이미지에서 추출되고 min_relevance보다 더 큰 관련성을 갖는 단어만 서비스에 의해 반환됩니다. 기본값은 0.01로 설정되어 있습니다. 관련성은 전체 이미지와 비교하여 추출된 텍스트의 테두리 상자 영역의 분율로 계산됩니다. 0.01은 이미지의 최소 1%를 차지하는 텍스트로 변환됩니다.
아니요
이름
데이터 유형
필수 여부
기본
값
설명
repo:path문자열
-
-
-
텍스트를 추출해야 하는 이미지의 사전 서명된 URL.
sensei:repoType문자열
-
-
HTTPS
이미지가 저장되는 저장소의 유형입니다.
sensei:multipart_field_name문자열
-
-
-
사전 서명된 URL을 사용하는 대신 이미지를 다중 부분 인수로 전달할 때 사용합니다.
dc:format문자열
예
-
"image/jpg",
"image/jpeg",
"image/png",
"image/tiff"
"image/jpeg",
"image/png",
"image/tiff"
이미지 인코딩이 처리되기 전에 허용된 입력 인코딩 유형에 대해 확인됩니다.
recommendation-more-help
8959a20a-a58f-4057-9f82-870706c576e9