Textpräsenz und optische Zeichenerkennung

HINWEIS

Die AI für Inhalte und Commerce befindet sich in der Betaphase. Die Dokumentation kann geändert werden.

Der Dienst "Texterkennung/Optische Zeichenerkennung"(OCR) kann bei Angabe eines Bildes angeben, ob Text im Bild vorhanden ist. Wenn Text vorhanden ist, kann OCR den Text zurückgeben.

Die folgende Abbildung wurde in der Beispielanforderung in diesem Dokument verwendet:

Testbild

API-Format

POST /services/v1/predict

Anfrage

Die folgende Anforderung prüft, ob Text auf der Grundlage des in der Nutzlast bereitgestellten Eingabebilds vorhanden ist. Weitere Informationen zu den angezeigten Eingabeparametern finden Sie in der Tabelle unter der Beispielpayload.

VORSICHT

analyzer_id bestimmt, welche verwendet Sensei Content Framework wird. Vergewissern Sie sich bitte, dass Sie über die erforderlichen Informationen verfügen, analyzer_id bevor Sie Ihre Anfrage bearbeiten. Wenden Sie sich an das AI Beta-Team von Content and Commerce, um Ihren analyzer_id Service zu erhalten.

curl -w'\n' -i -X POST https://sensei.adobe.io/services/v1/predict \
  -H "Authorization: Bearer {ACCESS_TOKEN}" \
  -H "Content-Type: multipart/form-data" \
  -H "cache-control: no-cache,no-cache" \
  -H "x-api-key: {API_KEY}" \
  -F file=@TestImage.jpg \
  -F 'contentAnalyzerRequests={
    "enable_diagnostics":"true",
    "requests":[{
    "analyzer_id": "Feature:image-text-extractor-ocr:Service-b0675160421e404ca3c7ca60f46a5b29",
    "parameters": {
      "application-id": "1234",
      "content-type": "inline",
      "encoding": "jpeg",
      "threshold": "0",
      "top-N": "0",
      "custom": {},
      "data": [{
        "content-id": "0987",
        "content": "inline-image",
        "content-type": "inline",
        "encoding": "jpeg",
        "threshold": "0",
        "top-N": "0",
        "historic-metadata": [],
        "custom": {}
        }]
      }
    }]
  }'
Eigenschaft Beschreibung Obligatorisch
analyzer_id Die Sensei Dienst-ID, unter der Ihre Anforderung bereitgestellt wird. Mit dieser ID wird festgelegt, welche der Variablen verwendet Sensei Content Frameworks werden. Wenden Sie sich bei benutzerdefinierten Diensten an das Content and Commerce AI-Team, um eine benutzerdefinierte ID einzurichten. Ja
application-id Die ID der erstellten Anwendung. Ja
data Ein Array, das ein JSON-Objekt mit jedem Objekt im Array enthält, das ein weitergeleitetes Bild darstellt. Alle Parameter, die als Teil dieses Arrays übergeben werden, setzen die globalen Parameter außer dem data Array außer Kraft. Die übrigen Eigenschaften, die unten in dieser Tabelle aufgeführt sind, können von innen aus überschrieben werden data. Ja
language Sprache des Eingabetexts. Der Standardwert lautet en. Nein
content-type Wird verwendet, um anzugeben, ob die Eingabe Teil des Anforderungstextes oder einer signierten URL für einen S3-Behälter ist. Die Standardeinstellung für diese Eigenschaft ist inline. Nein
encoding Das Dateiformat des Eingabebilds. Derzeit können nur JPEG- und PNG-Bilder verarbeitet werden. Die Standardeinstellung für diese Eigenschaft ist jpeg. Nein
threshold Der Schwellenwert des Ergebnisses (0 bis 1), ab dem die Ergebnisse zurückgegeben werden müssen. Verwenden Sie den Wert, 0 um alle Ergebnisse zurückzugeben. Die Standardeinstellung für diese Eigenschaft ist 0. Nein
top-N Die Anzahl der zurückzugebenden Ergebnisse (darf keine negative Ganzzahl sein). Verwenden Sie den Wert, 0 um alle Ergebnisse zurückzugeben. Bei gleichzeitiger Verwendung thresholdist die Anzahl der zurückgegebenen Ergebnisse die niedrigere der beiden festgelegten Grenzwerte. Die Standardeinstellung für diese Eigenschaft ist 0. Nein
custom Alle benutzerdefinierten Parameter, die übergeben werden sollen. Für diese Eigenschaft ist ein gültiges JSON-Objekt erforderlich, um zu funktionieren. Nein
content-id Die eindeutige ID für das Datenelement, das in der Antwort zurückgegeben wird. Wenn dies nicht weitergegeben wird, wird eine automatisch generierte ID zugewiesen. Nein
content Der Inhalt kann ein Rohbild ("inline"-Inhaltstyp) sein.
Wenn es sich bei dem Inhalt um eine Datei unter S3 handelt (Content-Typ des s3-Buckets), übergeben Sie die signierte URL.
Ja

Antwort

Eine erfolgreiche Antwort gibt den Text zurück, der im feature_value Array erkannt wurde. Der Text wird gelesen und von links nach rechts oben zurückgegeben. Wenn also "Ich liebe Adobe"erkannt wurde, gibt Ihre Nutzlast "Ich", "Liebe"und "Adobe"in separaten Objekten zurück. Im Objekt erhalten Sie eine feature_name Beschreibung, die das Wort und eine feature_value mit einer Konfidenzmetrik für diesen Text enthält.

{
  "status": 200,
  "content_id": "TestImage.jpg",
  "cas_responses": [
    {
      "status": 200,
      "analyzer_id": "Feature:image-text-extractor-ocr:Service-b0675160421e404ca3c7ca60f46a5b29",
      "content_id": "TestImage.jpg",
      "result": {
        "response_type": "feature",
        "response": [
          {
            "feature_value": [
              {
                "feature_value": "yes",
                "feature_name": "has_text"
              },
              {
                "feature_value": "0.977",
                "feature_name": "CHEF"
              },
              {
                "feature_value": "success",
                "feature_name": "text_processing_status"
              }
            ],
            "feature_name": "ocr"
          }
        ]
      }
    }
  ],
  "error": []
}

Auf dieser Seite