Importar uma fórmula em pacote na interface do usuário do Data Science Workspace

Este tutorial fornece informações sobre como configurar e importar uma fórmula em pacote usando o exemplo fornecido de Vendas de Varejo. Ao final deste tutorial, você estará pronto para criar, treinar e avaliar um Modelo no Adobe Experience Platform Data Science Workspace.

Pré-requisitos

Este tutorial requer uma fórmula em pacote no formato de um URL de imagem do Docker. Consulte o tutorial sobre como Compactar arquivos de origem em uma fórmula para obter mais informações.

Fluxo de trabalho da interface do usuário

A importação de uma fórmula em pacote para o Data Science Workspace requer configurações de fórmula específicas, compiladas em um único arquivo JSON (JavaScript Object Notation). Essa compilação de configurações de fórmula é conhecida como o arquivo de configuração. Uma fórmula em pacote com um conjunto específico de configurações é chamada de instância de fórmula. Uma fórmula pode ser usada para criar muitas instâncias de fórmula em Data Science Workspace.

O fluxo de trabalho para importar uma fórmula de pacote consiste nas seguintes etapas:

Configurar uma fórmula configure

Cada instância da fórmula em Data Science Workspace é acompanhada por um conjunto de configurações que adaptam a instância da fórmula para atender a um caso de uso específico. Os arquivos de configuração definem os comportamentos padrão de treinamento e pontuação de um Modelo criado usando essa instância de fórmula.

NOTE
Os arquivos de configuração são específicos de receita e caso.

Abaixo está um arquivo de configuração de exemplo que mostra os comportamentos padrão de treinamento e pontuação para a fórmula de Vendas de varejo.

[
    {
        "name": "train",
        "parameters": [
            {
                "key": "learning_rate",
                "value": "0.1"
            },
            {
                "key": "n_estimators",
                "value": "100"
            },
            {
                "key": "max_depth",
                "value": "3"
            },
            {
                "key": "ACP_DSW_INPUT_FEATURES",
                "value": "date,store,storeType,storeSize,temperature,regionalFuelPrice,markdown,cpi,unemployment,isHoliday"
            },
            {
                "key": "ACP_DSW_TARGET_FEATURES",
                "value": "weeklySales"
            },
            {
                "key": "ACP_DSW_FEATURE_UPDATE_SUPPORT",
                "value": false
            },
            {
                "key": "tenantId",
                "value": "_{TENANT_ID}"
            },
            {
                "key": "ACP_DSW_TRAINING_XDM_SCHEMA",
                "value": "{SEE BELOW FOR DETAILS}"
            },
            {
                "key": "evaluation.labelColumn",
                "value": "weeklySalesAhead"
            },
            {
                "key": "evaluation.metrics",
                "value": "MAPE,MAE,RMSE,MASE"
            }
        ]
    },
    {
        "name": "score",
        "parameters": [
            {
                "key": "tenantId",
                "value": "_{TENANT_ID}"
            },
            {
                "key":"ACP_DSW_SCORING_RESULTS_XDM_SCHEMA",
                "value":"{SEE BELOW FOR DETAILS}"
            }
        ]
    }
]
Chave de parâmetro
Tipo
Descrição
learning_rate
Número
Escalar para multiplicação de gradiente.
n_estimators
Número
Número de árvores na floresta para o Classificador Random Forest.
max_depth
Número
Profundidade máxima de uma árvore no Classificador Random Forest.
ACP_DSW_INPUT_FEATURES
String
Lista de atributos de esquema de entrada separados por vírgula.
ACP_DSW_TARGET_FEATURES
String
Lista de atributos de esquema de saída separados por vírgulas.
ACP_DSW_FEATURE_UPDATE_SUPPORT
Booleano
Determina se os recursos de entrada e saída são modificáveis
tenantId
String
Essa ID garante que os recursos criados tenham o namespace adequado e estejam contidos na organização. Siga as etapas aqui para encontrar sua ID de locatário.
ACP_DSW_TRAINING_XDM_SCHEMA
String
O esquema de entrada usado para treinar um Modelo. Deixe isso em branco ao importar na interface do usuário, substitua por SchemaID de treinamento ao importar usando a API.
evaluation.labelColumn
String
Rótulo da coluna para visualizações de avaliação.
evaluation.metrics
String
Lista separada por vírgulas de métricas de avaliação a serem usadas para avaliar um Modelo.
ACP_DSW_SCORING_RESULTS_XDM_SCHEMA
String
O esquema de saída usado para pontuar um Modelo. Deixe isso em branco ao importar na interface do usuário, substitua por SchemaID de pontuação ao importar usando a API.

Para o propósito deste tutorial, você pode deixar os arquivos de configuração padrão para a fórmula de Vendas de Varejo na Data Science Workspace Referencie como estão.

Importar fórmula baseada no Docker - Python python

Comece navegando e selecionando Fluxos de trabalho localizados na parte superior esquerda da interface do usuário do Platform. Em seguida, selecione Importar fórmula e selecione Iniciar.

A página Configurar para o fluxo de trabalho Importar fórmula é exibida. Insira um nome e uma descrição para a fórmula e selecione Avançar no canto superior direito.

configurar fluxo de trabalho

NOTE
No tutorial Empacotar arquivos de origem em uma Receita, uma URL Docker foi fornecida no final da criação da fórmula de Vendas de Varejo usando arquivos de origem Python.

Quando você estiver na página Selecionar origem, cole a URL do Docker correspondente à fórmula em pacote criada usando arquivos de origem Python no campo URL do Source. Em seguida, importe o arquivo de configuração fornecido arrastando e soltando ou use o Navegador do sistema de arquivos. O arquivo de configuração fornecido pode ser encontrado em experience-platform-dsw-reference/recipes/python/retail/retail.config.json. Selecione Python no menu suspenso Tempo de Execução e Classificação no menu suspenso Tipo. Depois que tudo estiver preenchido, selecione Avançar no canto superior direito para prosseguir para Gerenciar esquemas.

NOTE
O tipo dá suporte a Classificação e Regressão. Se o seu modelo não se enquadrar em um desses tipos, selecione Personalizado.

Em seguida, selecione os esquemas de entrada e saída de Vendas de Varejo na seção Gerenciar esquemas, que foram criados usando o script de inicialização fornecido no tutorial criar esquema e conjunto de dados de vendas de varejo.

Na seção Gerenciamento de recursos, selecione em sua identificação de locatário no visualizador de esquema para expandir o esquema de entrada de Vendas de Varejo. Selecione os recursos de entrada e saída, realçando o recurso desejado e selecionando Recurso de Entrada ou Recurso de Destino na janela direita Propriedades do Campo. Para fins deste tutorial, defina weeklySales como o Recurso do Target e tudo o mais como Recurso de Entrada. Selecione Avançar para revisar sua nova fórmula configurada.

Revise a fórmula, adicione, modifique ou remova configurações conforme necessário. Selecione Concluir para criar a fórmula.

Prossiga para as próximas etapas para descobrir como criar um Modelo no Data Science Workspace usando a fórmula de Vendas de Varejo recém-criada.

Importar fórmula baseada no Docker - R r

Comece navegando e selecionando Fluxos de trabalho localizados na parte superior esquerda da interface do usuário do Platform. Em seguida, selecione Importar fórmula e selecione Iniciar.

A página Configurar para o fluxo de trabalho Importar fórmula é exibida. Insira um nome e uma descrição para a fórmula e selecione Avançar no canto superior direito.

configurar fluxo de trabalho

NOTE
No tutorial Empacotar arquivos de origem em uma Fórmula, uma URL Docker foi fornecida no final da criação da fórmula de Vendas de Varejo usando arquivos de origem R.

Quando você estiver na página Selecionar origem, cole a URL do Docker correspondente à fórmula em pacote criada usando arquivos de origem R no campo URL do Source. Em seguida, importe o arquivo de configuração fornecido arrastando e soltando ou use o Navegador do sistema de arquivos. O arquivo de configuração fornecido pode ser encontrado em experience-platform-dsw-reference/recipes/R/Retail\ -\ GradientBoosting/retail.config.json. Selecione R no menu suspenso Tempo de Execução e Classificação no menu suspenso Tipo. Depois que tudo estiver preenchido, selecione Avançar no canto superior direito para prosseguir para Gerenciar esquemas.

NOTE
Type dá suporte a Classification e Regression. Se o seu modelo não se enquadrar em um desses tipos, selecione Personalizado.

Em seguida, selecione os esquemas de entrada e saída de Vendas de Varejo na seção Gerenciar esquemas, que foram criados usando o script de inicialização fornecido no tutorial criar esquema e conjunto de dados de vendas de varejo.

Na seção Gerenciamento de recursos, selecione em sua identificação de locatário no visualizador de esquema para expandir o esquema de entrada de Vendas de Varejo. Selecione os recursos de entrada e saída, realçando o recurso desejado e selecionando Recurso de Entrada ou Recurso de Destino na janela direita Propriedades do Campo. Para fins deste tutorial, defina weeklySales como o Recurso do Target e tudo o mais como Recurso de Entrada. Selecione Avançar para revisar sua nova fórmula Configurada.

Revise a fórmula, adicione, modifique ou remova configurações conforme necessário. Selecione Concluir para criar a fórmula.

Prossiga para as próximas etapas para descobrir como criar um Modelo no Data Science Workspace usando a fórmula de Vendas de Varejo recém-criada.

Importar fórmula baseada no Docker - PySpark pyspark

Comece navegando e selecionando Fluxos de trabalho localizados na parte superior esquerda da interface do usuário do Platform. Em seguida, selecione Importar fórmula e selecione Iniciar.

A página Configurar para o fluxo de trabalho Importar fórmula é exibida. Insira um nome e uma descrição para a fórmula e selecione Avançar no canto superior direito para continuar.

configurar fluxo de trabalho

NOTE
No tutorial Empacotar arquivos de origem em uma Receita, uma URL Docker foi fornecida no final da criação da fórmula de Vendas de Varejo usando arquivos de origem do PySpark.

Quando você estiver na página Selecionar origem, cole a URL do Docker correspondente à fórmula em pacote criada usando arquivos de origem do PySpark no campo URL do Source. Em seguida, importe o arquivo de configuração fornecido arrastando e soltando ou use o Navegador do sistema de arquivos. O arquivo de configuração fornecido pode ser encontrado em experience-platform-dsw-reference/recipes/pyspark/retail/pipeline.json. Selecione PySpark no menu suspenso Tempo de Execução. Depois que o tempo de execução do PySpark é selecionado, o artefato padrão é preenchido automaticamente para Docker. Em seguida, selecione Classificação no menu suspenso Tipo. Depois que tudo estiver preenchido, selecione Avançar no canto superior direito para prosseguir para Gerenciar esquemas.

NOTE
Type dá suporte a Classification e Regression. Se o seu modelo não se enquadrar em um desses tipos, selecione Personalizado.

Em seguida, selecione os esquemas de entrada e saída de Vendas de Varejo usando o seletor Gerenciar esquemas. Os esquemas foram criados usando o script de inicialização fornecido no tutorial criar esquema e conjunto de dados de vendas de varejo.

gerenciar esquemas

Na seção Gerenciamento de recursos, selecione em sua identificação de locatário no visualizador de esquema para expandir o esquema de entrada de Vendas de Varejo. Selecione os recursos de entrada e saída, realçando o recurso desejado e selecionando Recurso de Entrada ou Recurso de Destino na janela direita Propriedades do Campo. Para fins deste tutorial, defina weeklySales como o Recurso do Target e tudo o mais como Recurso de Entrada. Selecione Avançar para revisar sua nova fórmula configurada.

Revise a fórmula, adicione, modifique ou remova configurações conforme necessário. Selecione Concluir para criar a fórmula.

Prossiga para as próximas etapas para descobrir como criar um Modelo no Data Science Workspace usando a fórmula de Vendas de Varejo recém-criada.

Importar fórmula baseada no Docker - Scala scala

Comece navegando e selecionando Fluxos de trabalho localizados na parte superior esquerda da interface do usuário do Platform. Em seguida, selecione Importar fórmula e selecione Iniciar.

A página Configurar para o fluxo de trabalho Importar fórmula é exibida. Insira um nome e uma descrição para a fórmula e selecione Avançar no canto superior direito para continuar.

configurar fluxo de trabalho

NOTE
No tutorial Empacotar arquivos de origem em uma Fórmula, uma URL Docker foi fornecida no final da criação da fórmula de Vendas de Varejo usando arquivos de origem Scala (Spark).

Quando você estiver na página Selecionar origem, cole a URL do Docker correspondente à fórmula em pacote criada usando arquivos de origem Scala no campo URL do Source. Em seguida, importe o arquivo de configuração fornecido arrastando e soltando ou use o navegador do sistema de arquivos. O arquivo de configuração fornecido pode ser encontrado em experience-platform-dsw-reference/recipes/scala/retail/pipelineservice.json. Selecione Spark no menu suspenso Tempo de Execução. Depois que o tempo de execução Spark for selecionado, o artefato padrão será preenchido automaticamente para Docker. Em seguida, selecione Regressão no menu suspenso Tipo. Depois que tudo estiver preenchido, selecione Avançar no canto superior direito para prosseguir para Gerenciar esquemas.

NOTE
O tipo dá suporte a Classificação e Regressão. Se o seu modelo não se enquadrar em um desses tipos, selecione Personalizado.

Em seguida, selecione os esquemas de entrada e saída de Vendas de Varejo usando o seletor Gerenciar esquemas. Os esquemas foram criados usando o script de inicialização fornecido no tutorial criar esquema e conjunto de dados de vendas de varejo.

gerenciar esquemas

Na seção Gerenciamento de recursos, selecione em sua identificação de locatário no visualizador de esquema para expandir o esquema de entrada de Vendas de Varejo. Selecione os recursos de entrada e saída, realçando o recurso desejado e selecionando Recurso de Entrada ou Recurso de Destino na janela direita Propriedades do Campo. Para fins deste tutorial, defina "weeklySales" como o Recurso do Target e tudo o mais como Recurso de Entrada. Selecione Avançar para revisar sua nova fórmula configurada.

Revise a fórmula, adicione, modifique ou remova configurações conforme necessário. Selecione Concluir para criar a fórmula.

Prossiga para as próximas etapas para descobrir como criar um Modelo no Data Science Workspace usando a fórmula de Vendas de Varejo recém-criada.

Próximas etapas next-steps

Este tutorial forneceu informações sobre como configurar e importar uma fórmula para o Data Science Workspace. Agora você pode criar, treinar e avaliar um Modelo usando a fórmula recém-criada.

recommendation-more-help
cc79fe26-64da-411e-a6b9-5b650f53e4e9