Presença de texto e reconhecimento óptico de caracteres

OBSERVAÇÃO

A API do conteúdo e do comércio está em beta. A documentação está sujeita a alterações.

O serviço de Presença de texto/Reconhecimento ótico de caracteres (OCR), quando recebe uma imagem, pode indicar se o texto está presente na imagem. Se o texto estiver presente, o OCR poderá retornar o texto.

A imagem a seguir foi usada na solicitação de exemplo mostrada neste documento:

imagem de teste

Formato da API

POST /services/v1/predict

Solicitação

A solicitação a seguir verifica se o texto está presente com base na imagem de entrada fornecida no payload. Consulte a tabela abaixo do exemplo de carga para obter mais informações sobre os parâmetros de entrada mostrados.

ATENÇÃO

analyzer_id determina qual Sensei Content Framework é usada. Verifique se você tem o analyzer_id correto antes de fazer sua solicitação. Entre em contato com a equipe beta do Content and Commerce AI para receber seu analyzer_id para este serviço.

curl -w'\n' -i -X POST https://sensei.adobe.io/services/v1/predict \
  -H "Authorization: Bearer {ACCESS_TOKEN}" \
  -H "Content-Type: multipart/form-data" \
  -H "cache-control: no-cache,no-cache" \
  -H "x-api-key: {API_KEY}" \
  -F file=@TestImage.jpg \
  -F 'contentAnalyzerRequests={
    "enable_diagnostics":"true",
    "requests":[{
    "analyzer_id": "Feature:image-text-extractor-ocr:Service-b0675160421e404ca3c7ca60f46a5b29",
    "parameters": {
      "application-id": "1234",
      "content-type": "inline",
      "encoding": "jpeg",
      "threshold": "0",
      "top-N": "0",
      "custom": {},
      "data": [{
        "content-id": "0987",
        "content": "inline-image",
        "content-type": "inline",
        "encoding": "jpeg",
        "threshold": "0",
        "top-N": "0",
        "historic-metadata": [],
        "custom": {}
        }]
      }
    }]
  }'
Propriedade Descrição Obrigatório
analyzer_id A ID do serviço Sensei em que sua solicitação é implantada. Essa ID determina qual das Sensei Content Frameworks é usada. Para serviços personalizados, entre em contato com a equipe de API de Conteúdo e Comércio para configurar uma ID personalizada. Sim
application-id A ID do aplicativo criado. Sim
data Uma matriz que contém um objeto JSON com cada objeto na matriz representando uma imagem passada. Qualquer parâmetro passado como parte dessa matriz substitui os parâmetros globais especificados fora da matriz data. Qualquer uma das propriedades restantes descritas abaixo nesta tabela pode ser substituída de dentro de data. Sim
language Idioma do texto de entrada. O valor padrão é en. Não
content-type Usado para indicar se a entrada é parte do corpo da solicitação ou um url assinado para um bucket S3. O padrão para essa propriedade é inline. Não
encoding O formato de arquivo da imagem de entrada. Atualmente, somente imagens JPEG e PNG podem ser processadas. O padrão para essa propriedade é jpeg. Não
threshold O limite de pontuação (0 a 1) acima do qual os resultados precisam ser retornados. Use o valor 0 para retornar todos os resultados. O padrão para essa propriedade é 0. Não
top-N O número de resultados a serem retornados (não pode ser um número inteiro negativo). Use o valor 0 para retornar todos os resultados. Quando usado em conjunto com threshold, o número de resultados retornados é o menor de qualquer um dos limites definidos. O padrão para essa propriedade é 0. Não
custom Quaisquer parâmetros personalizados a serem transmitidos. Essa propriedade requer um objeto JSON válido para funcionar. Não
content-id A ID exclusiva para o elemento de dados retornado na resposta. Se isso não for passado, uma ID gerada automaticamente será atribuída. Não
content O conteúdo pode ser uma imagem bruta (tipo de conteúdo "em linha").
Se o conteúdo for um arquivo no tipo de conteúdo S3 (s3-bucket'), passe o URL assinado.
Sim

Resposta

Uma resposta bem-sucedida retorna o texto que foi detectado na matriz feature_value. O texto é lido e retornado de cima para baixo da esquerda para a direita. Isso significa que se "Eu amo Adobe" for detectado, sua carga retornará "I", "amo" e "Adobe" em objetos separados. No objeto, você recebe um feature_name que contém a palavra e um feature_value que contém uma métrica de confiança para o texto.

{
  "status": 200,
  "content_id": "TestImage.jpg",
  "cas_responses": [
    {
      "status": 200,
      "analyzer_id": "Feature:image-text-extractor-ocr:Service-b0675160421e404ca3c7ca60f46a5b29",
      "content_id": "TestImage.jpg",
      "result": {
        "response_type": "feature",
        "response": [
          {
            "feature_value": [
              {
                "feature_value": "yes",
                "feature_name": "has_text"
              },
              {
                "feature_value": "0.977",
                "feature_name": "CHEF"
              },
              {
                "feature_value": "success",
                "feature_name": "text_processing_status"
              }
            ],
            "feature_name": "ocr"
          }
        ]
      }
    }
  ],
  "error": []
}

Nesta página