A API do conteúdo e do comércio está em beta. A documentação está sujeita a alterações.
O serviço de Presença de texto/Reconhecimento ótico de caracteres (OCR), quando recebe uma imagem, pode indicar se o texto está presente na imagem. Se o texto estiver presente, o OCR poderá retornar o texto.
A imagem a seguir foi usada na solicitação de exemplo mostrada neste documento:
Formato da API
POST /services/v1/predict
Solicitação
A solicitação a seguir verifica se o texto está presente com base na imagem de entrada fornecida no payload. Consulte a tabela abaixo do exemplo de carga para obter mais informações sobre os parâmetros de entrada mostrados.
analyzer_id
determina qual Sensei Content Framework é usada. Verifique se você tem a analyzer_id
antes de fazer sua solicitação. Entre em contato com a equipe beta do Content and Commerce AI para receber seu analyzer_id
para este serviço.
curl -w'\n' -i -X POST https://sensei.adobe.io/services/v1/predict \
-H "Authorization: Bearer {ACCESS_TOKEN}" \
-H "Content-Type: multipart/form-data" \
-H "cache-control: no-cache,no-cache" \
-H "x-api-key: {API_KEY}" \
-F file=@TestImage.jpg \
-F 'contentAnalyzerRequests={
"enable_diagnostics":"true",
"requests":[{
"analyzer_id": "Feature:image-text-extractor-ocr:Service-b0675160421e404ca3c7ca60f46a5b29",
"parameters": {
"application-id": "1234",
"content-type": "inline",
"encoding": "jpeg",
"threshold": "0",
"top-N": "0",
"custom": {},
"data": [{
"content-id": "0987",
"content": "inline-image",
"content-type": "inline",
"encoding": "jpeg",
"threshold": "0",
"top-N": "0",
"historic-metadata": [],
"custom": {}
}]
}
}]
}'
Propriedade | Descrição | Obrigatório |
---|---|---|
analyzer_id |
O Sensei ID de serviço em que sua solicitação é implantada. Essa ID determina qual das Sensei Content Frameworks são usadas. Para serviços personalizados, entre em contato com a equipe de API de Conteúdo e Comércio para configurar uma ID personalizada. | Sim |
application-id |
A ID do aplicativo criado. | Sim |
data |
Uma matriz que contém um objeto JSON com cada objeto na matriz representando uma imagem passada. Quaisquer parâmetros transmitidos como parte dessa matriz substituem os parâmetros globais especificados fora do data matriz. Qualquer uma das propriedades restantes descritas abaixo nesta tabela pode ser substituída por dentro de data . |
Sim |
language |
Idioma do texto de entrada. O valor padrão é en . |
Não |
content-type |
Usado para indicar se a entrada é parte do corpo da solicitação ou um url assinado para um bucket S3. O padrão para essa propriedade é inline . |
Não |
encoding |
O formato de arquivo da imagem de entrada. Atualmente, somente imagens JPEG e PNG podem ser processadas. O padrão para essa propriedade é jpeg . |
Não |
threshold |
O limite de pontuação (0 a 1) acima do qual os resultados precisam ser retornados. Use o valor 0 para retornar todos os resultados. O padrão para essa propriedade é 0 . |
Não |
top-N |
O número de resultados a serem retornados (não pode ser um número inteiro negativo). Use o valor 0 para retornar todos os resultados. Quando usado em conjunto com threshold , o número de resultados devolvidos é o menor de qualquer um dos limites definidos. O padrão para essa propriedade é 0 . |
Não |
custom |
Quaisquer parâmetros personalizados a serem transmitidos. Essa propriedade requer um objeto JSON válido para funcionar. | Não |
content-id |
A ID exclusiva para o elemento de dados retornado na resposta. Se isso não for passado, uma ID gerada automaticamente será atribuída. | Não |
content |
O conteúdo pode ser uma imagem bruta (tipo de conteúdo "em linha"). Se o conteúdo for um arquivo no tipo de conteúdo S3 (s3-bucket'), passe o URL assinado. |
Sim |
Resposta
Uma resposta bem-sucedida retorna o texto que foi detectado no feature_value
matriz. O texto é lido e retornado de cima para baixo da esquerda para a direita. Isso significa que se "Eu amo Adobe" for detectado, sua carga retornará "I", "amo" e "Adobe" em objetos separados. No objeto , você recebe uma feature_name
que contém a palavra e uma feature_value
que contém uma métrica de confiança para esse texto.
{
"status": 200,
"content_id": "TestImage.jpg",
"cas_responses": [
{
"status": 200,
"analyzer_id": "Feature:image-text-extractor-ocr:Service-b0675160421e404ca3c7ca60f46a5b29",
"content_id": "TestImage.jpg",
"result": {
"response_type": "feature",
"response": [
{
"feature_value": [
{
"feature_value": "yes",
"feature_name": "has_text"
},
{
"feature_value": "0.977",
"feature_name": "CHEF"
},
{
"feature_value": "success",
"feature_name": "text_processing_status"
}
],
"feature_name": "ocr"
}
]
}
}
],
"error": []
}