Présence de texte et reconnaissance de caractères optiques

REMARQUE

Content and Commerce AI est en version bêta. La documentation peut être modifiée.

Le service Visibilité de texte / Reconnaissance optique de caractères (OCR), lorsqu’une image est donnée, peut indiquer si du texte est présent dans l’image. Si du texte est présent, la reconnaissance optique des caractères peut renvoyer le texte.

L'image suivante a été utilisée dans l'exemple de demande illustré dans ce document :

image de test

Format d’API

POST /services/v1/predict

Requête

La requête suivante vérifie si du texte est présent en fonction de l’image d’entrée fournie dans la charge utile. Consultez le tableau ci-dessous pour plus d’informations sur les paramètres d’entrée affichés.

ATTENTION

analyzer_id détermine lequel Sensei Content Framework est utilisé. Veuillez vérifier que vous en avez le bon analyzer_id avant de faire votre demande. Contactez l’équipe bêta de Content and Commerce AI pour recevoir votre analyzer_id demande pour ce service.

curl -w'\n' -i -X POST https://sensei.adobe.io/services/v1/predict \
  -H "Authorization: Bearer {ACCESS_TOKEN}" \
  -H "Content-Type: multipart/form-data" \
  -H "cache-control: no-cache,no-cache" \
  -H "x-api-key: {API_KEY}" \
  -F file=@TestImage.jpg \
  -F 'contentAnalyzerRequests={
    "enable_diagnostics":"true",
    "requests":[{
    "analyzer_id": "Feature:image-text-extractor-ocr:Service-b0675160421e404ca3c7ca60f46a5b29",
    "parameters": {
      "application-id": "1234",
      "content-type": "inline",
      "encoding": "jpeg",
      "threshold": "0",
      "top-N": "0",
      "custom": {},
      "data": [{
        "content-id": "0987",
        "content": "inline-image",
        "content-type": "inline",
        "encoding": "jpeg",
        "threshold": "0",
        "top-N": "0",
        "historic-metadata": [],
        "custom": {}
        }]
      }
    }]
  }'
Propriété Description Obligatoire
analyzer_id ID Sensei de service sous lequel votre demande est déployée. Cet identifiant détermine lequel des Sensei Content Frameworks est utilisé. Pour les services personnalisés, contactez l’équipe d’API Content and Commerce pour configurer un identifiant personnalisé. Oui
application-id ID de l’application créée. Oui
data Tableau contenant un objet JSON avec chaque objet du tableau représentant une image transmise. Tous les paramètres transmis dans le cadre de ce tableau remplacent les paramètres globaux spécifiés en dehors du data tableau. Toutes les autres propriétés décrites ci-dessous dans ce tableau peuvent être remplacées de l’intérieur data. Oui
language Langue du texte de saisie. La valeur par défaut est en. Non
content-type Permet d’indiquer si l’entrée fait partie du corps de la requête ou si une URL signée est associée à un compartiment S3. La valeur par défaut de cette propriété est inline. Non
encoding Format de fichier de l’image d’entrée. Actuellement, seules les images JPEG et PNG peuvent être traitées. La valeur par défaut de cette propriété est jpeg. Non
threshold Seuil de score (0 à 1) au-dessus duquel les résultats doivent être renvoyés. Utilisez la valeur 0 pour renvoyer tous les résultats. La valeur par défaut de cette propriété est 0. Non
top-N Nombre de résultats à renvoyer (ne peut pas être un entier négatif). Utilisez la valeur 0 pour renvoyer tous les résultats. Lorsqu'elle est utilisée conjointement avec threshold, le nombre de résultats renvoyés est le moins élevé des deux limites définies. La valeur par défaut de cette propriété est 0. Non
custom Tout paramètre personnalisé à transmettre. Cette propriété requiert un objet JSON valide pour fonctionner. Non
content-id ID unique de l’élément de données renvoyé dans la réponse. Si elle n’est pas transmise, un identifiant généré automatiquement est attribué. Non
content Le contenu peut être une image brute (type de contenu "intégré").
Si le contenu est un fichier sur S3 (type de contenu du compartiment 3), transmettez l’URL signée.
Oui

Réponse

Une réponse réussie renvoie le texte qui a été détecté dans le feature_value tableau. Le texte est lu et renvoyé de gauche à droite de haut en bas. Cela signifie que si "J’aime l’Adobe" a été détecté, votre charge utile renvoie "I", "love" et "Adobe" dans des objets distincts. Dans l’objet, vous recevez un feature_name qui contient le mot et un feature_value qui contient une mesure de confiance pour ce texte.

{
  "status": 200,
  "content_id": "TestImage.jpg",
  "cas_responses": [
    {
      "status": 200,
      "analyzer_id": "Feature:image-text-extractor-ocr:Service-b0675160421e404ca3c7ca60f46a5b29",
      "content_id": "TestImage.jpg",
      "result": {
        "response_type": "feature",
        "response": [
          {
            "feature_value": [
              {
                "feature_value": "yes",
                "feature_name": "has_text"
              },
              {
                "feature_value": "0.977",
                "feature_name": "CHEF"
              },
              {
                "feature_value": "success",
                "feature_name": "text_processing_status"
              }
            ],
            "feature_name": "ocr"
          }
        ]
      }
    }
  ],
  "error": []
}

Sur cette page