Aanwezigheid van tekst en optische tekenherkenning
Gemaakt voor:
- Gebruiker
Met de OCR-service (Text Presence/Optical Character Recognition) kunt u aangeven of de afbeelding tekst bevat. Als er tekst aanwezig is, kan OCR de tekst retourneren.
De volgende afbeelding is gebruikt in de voorbeeldaanvraag die in dit document wordt weergegeven:
API formaat
POST /services/v2/predict
Verzoek
Met het volgende verzoek wordt gecontroleerd of er tekst aanwezig is op basis van de invoerafbeelding die in de lading is opgegeven. Zie de tabel onder de voorbeeldlading voor meer informatie over de getoonde inputparameters.
Uitvoering met inline-afbeelding:
curl -w'\n' -i -X POST https://sensei.adobe.io/services/v2/predict \
-H 'Prefer: respond-async, wait=59' \
-H "x-api-key: $API_KEY" \
-H "content-type: multipart/form-data" \
-H "authorization: Bearer $API_TOKEN" \
-F file=@sample_image.png \
-F 'contentAnalyzerRequests={
"sensei:name": "Feature:cintel-object-detection:Service-b9ace8b348b6433e9e7d82371aa16690",
"sensei:invocation_mode": "asynchronous",
"sensei:invocation_batch": false,
"sensei:engines": [
{
"sensei:execution_info": {
"sensei:engine": "Feature:cintel-object-detection:Service-b9ace8b348b6433e9e7d82371aa16690"
},
"sensei:inputs": {
"documents": [
{
"sensei:multipart_field_name": "file",
"dc:format": "image/jpg"
}
]
},
"sensei:params": {
"correct_with_dictionary": true,
"min_probability": 0.2,
"min_relevance": 0.01,
"filter_with_dictionary": true
},
"sensei:outputs":{
"result" : {
"sensei:multipart_field_name" : "result",
"dc:format": "application/json"
}
}
}
]
}'
Reactie
Een succesvol antwoord retourneert de tekst die in de lijst tags
is gedetecteerd voor elke afbeelding die in de aanvraag is doorgegeven. Als een bepaalde afbeelding geen tekst bevat, is is_text_present
0 en is tags
een lege lijst.
[ result0, result1, … ]: lijst van reacties voor elk inputdocument. Elk resultaat is een dict met toetsen:
- request_element_id: overeenkomende index met het invoerbestand voor deze reactie, 0 voor de eerste afbeelding in de documentenlijst van de aanvraag, 1 voor de volgende afbeelding, enzovoort.
- tags: lijst met woordenboeken, elk woordenboek heeft twee sleutels: tekst, een herkend woord uit de afbeelding, en relevantie, die wordt berekend als het deel van het gebied van het selectiekader van de geëxtraheerde tekst in vergelijking met de volledige afbeelding. 0,01 wordt omgezet in een tekst die minstens 1% van de afbeelding in beslag neemt.
- is_text_present: 0 of 1, afhankelijk van of er tekst aanwezig is in de afbeelding. Als de labels 0 zijn, is de lijst leeg.
{
"contentAnalyzerResponse": {
"statuses": [
{
"sensei:engine": "Feature:cintel-object-detection:Service-b9ace8b348b6433e9e7d82371aa16690",
"invocations": [
{
"sensei:outputs": {
"result": {
"sensei:multipart_field_name": "result",
"dc:format": "application/json"
}
},
"message": null,
"status": "200"
}
]
}
],
"request_id": "dttklFR7DPtMtEmjlRSx5BYP5WGg3tTx"
},
"result": [
{
"is_text_present": 1,
"tags": [
{
"text": "yosemite",
"relevance": 0.06
}
],
"request_element_id": 0
}
]
}
Verzoek
Met het volgende verzoek wordt gecontroleerd of er tekst aanwezig is op basis van de invoerafbeelding die in de lading is opgegeven. Zie de tabel onder de voorbeeldlading voor meer informatie over de getoonde inputparameters.
Uitvoering met URL:
curl -w'\n' -i -X POST https://sensei.adobe.io/services/v2/predict \
-H 'Prefer: respond-async, wait=59' \
-H "x-api-key: $API_KEY" \
-H "content-type: multipart/form-data" \
-H "authorization: Bearer $API_TOKEN" \
-F 'contentAnalyzerRequests={
"sensei:name": "Feature:cintel-object-detection:Service-b9ace8b348b6433e9e7d82371aa16690",
"sensei:invocation_mode": "asynchronous",
"sensei:invocation_batch": false,
"sensei:engines": [
{
"sensei:execution_info": {
"sensei:engine": "Feature:cintel-object-detection:Service-b9ace8b348b6433e9e7d82371aa16690"
},
"sensei:inputs": {
"documents": [
{
"repo:path": <IMG_URL_PATH>,
"sensei:repoType": "HTTP",
"dc:format": "image/jpg"
}
]
},
"sensei:params": {
"correct_with_dictionary": true
},
"sensei:outputs":{
"result" : {
"sensei:multipart_field_name" : "result",
"dc:format": "application/json"
}
}
}
]
}'
{
"contentAnalyzerResponse": {
"statuses": [
{
"sensei:engine": "Feature:cintel-object-detection:Service-b9ace8b348b6433e9e7d82371aa16690",
"invocations": [
{
"sensei:outputs": {
"result": {
"sensei:multipart_field_name": "result",
"dc:format": "application/json"
}
},
"message": null,
"status": "200"
}
]
}
],
"request_id": "ZbdhcK0JqS4Wg1wGdlEHGR3JOm530YNn"
},
"result": [
{
"is_text_present": 0,
"tags": [],
"request_element_id": 0
}
]
}
documents
sensei:multipart_field_name
repo:path
sensei:repoType
dc:format
correct_with_dictionary
filter_with_dictionary
min_probability
min_relevance
repo:path
sensei:repoType
sensei:multipart_field_name
dc:format
"image/jpeg",
"image/png",
"image/tiff"