Neste exercício, você instalará o Anaconda em sua máquina local para executar os Notebooks Jupyter em sua máquina local e, em seguida, interagir com os dados na Adobe Experience Platform por meio do Serviço de query.
Com o Adobe Experience Platform Data Science Workspace, estamos disponibilizando notebooks Júpiter originalmente sobre a Adobe Experience Platform. Com isso, os cientistas de dados agora podem ler dados e gravar dados na plataforma nativamente.
Muitos cientistas de dados, no entanto, ainda preferem trabalhar em suas máquinas locais para exploração de dados e construção de modelos. Este é um padrão que a Adobe Experience Platform também suporta por meio do Serviço de query da Adobe Experience Platform. Com isso, cientistas de dados podem carregar dados da Platform diretamente em seu ambiente local de escolha.
Para este exercício, estamos usando o Anaconda Navigator que você pode baixar e instalar de aqui.
Se estiver usando um MacBook, certifique-se de ter brew instalado. Você pode encontrar instruções de instalação para brew aqui: https://brew.sh/
Além disso, após instalar brew, será necessário instalar o pacote postgres, executando o comando brew install postgres em uma janela Terminal.
A seguir estão maneiras alternativas de garantir que você tenha os pacotes necessários instalados na máquina:
Execute este comando em uma janela Terminal: (tente estes comandos primeiro)
Execute este comando em uma janela Terminal:
Execute estes dois comandos em uma janela Terminal:
Depois de instalar Anaconda, abra Anaconda e você verá a página abaixo.
Clique no botão Launch para JupyterLab.
Depois disso, seu navegador deverá abrir e mostrar a página inicial do JupyterLab.
Abra um novo notebook Python 3 clicando no botão abaixo conforme indicado.
Você terá um caderno novo e vazio.
Você terá um novo notebook Python 3 vazio. Antes de continuar, dê um nome descritivo ao seu bloco de anotações. Clique com o botão direito do mouse no arquivo Untitled.ipynb e clique em Renomear.
Insira mutuo365-Insurance-anaconda.ipynb como o nome do seu notebook e pressione Enter. Você terá isso:
Essa célula baixará e instalará duas bibliotecas externas necessárias para suportar PostgreSQL. A execução desta célula pela primeira vez pode demorar alguns minutos.
FYI: se você receber um erro ao carregar psiccopg2, precisará instalar postgres no computador abrindo uma janela de terminal e executando o comando brew install postgres (o que supõe que você já tenha 'brew' instalado no MacBook).
Clique na primeira célula vazia do bloco de notas.
Copie o código abaixo e cole-o na primeira célula do notebook.
!pip install --user psycopg2-binary
!pip install --user sql_magic
import sys
import pprint
import psycopg2
Você terá isso na célula 1:
Clique no ícone Play para executar esta célula. Se você encontrar um erro com essa célula, verifique as maneiras alternativas de instalar os cartazes, conforme mencionado acima, na seção Pré-requisitos.
Aguarde até que o indicador fique assim antes de continuar:
O resultado tem esta aparência:
Nesta etapa, você precisa se conectar ao Serviço de query.
Role para baixo e clique na próxima célula vazia.
Copie o código abaixo e cole-o na primeira célula do notebook.
# Copy these settings from https://platform.adobe.com/query/configuration
connection = psycopg2.connect(
sslmode='require',
host='',
port='80',
dbname='prod:all',
user='',
password='')
Para se conectar, você terá que atualizar os seguintes campos no código acima com base nas informações que você pode encontrar dentro da Adobe Experience Platform.
Para recuperar essas configurações do Serviço de query, acesse a Adobe Experience Platform, vá para Queries > Credentials > Postgres Credentials.
Depois de copiar o código acima e atualizar os campos conforme indicado, você deve ter algo como o seguinte:
Clique no ícone Play para executar esta célula. Isso pode levar alguns segundos.
Aguarde até que o indicador fique assim antes de continuar:
Nesta etapa, você ativará o SQL no seu notebook.
Role para baixo e clique na próxima célula vazia.
Copie o código abaixo e cole-o na primeira célula do notebook.
# Enable sql magic
%load_ext sql_magic
%config SQL.conn_name = 'connection'
Agora você deve ter algo como o seguinte:
Clique no ícone Play para executar esta célula. Isso pode levar alguns segundos.
Aguarde até que o indicador fique assim antes de continuar:
Nesta etapa, você começará a interagir com conjuntos de dados na Adobe Experience Platform a partir do ambiente Anaconda local e do Notebook Jupyter.
Role para baixo e clique na próxima célula vazia.
Copie o código abaixo e cole-o na primeira célula do notebook.
%%read_sql
show tables
Agora você deve ter algo como o seguinte:
Clique no ícone Play para executar esta célula. Isso pode levar alguns segundos.
Aguarde até que o indicador fique assim antes de continuar:
Em seguida, você verá todos os conjuntos de dados disponíveis na Adobe Experience Platform serem retornados no ambiente Anaconda local e no Notebook Jupyter.
Ir para a célula seguinte. Nesta célula, você carregará campos específicos do conjunto de dados Demo System - Event Dataset for Website (Global v1.1) da Adobe Experience Platform em um quadro de dados.
Role para baixo e clique na próxima célula vazia.
Copie o código abaixo e cole-o na primeira célula do notebook.
%%read_sql df_result
SELECT --aepTenantId--.identification.core.ecid as ecid,
--aepTenantId--.interactionDetails.insurance.car.numberKm as km,
--aepTenantId--.interactionDetails.insurance.car.type as cartype,
--aepTenantId--.interactionDetails.insurance.car.customerAge as age,
--aepTenantId--.interactionDetails.insurance.car.customerGender as gender,
--aepTenantId--.interactionDetails.insurance.car.brand as carbrand,
--aepTenantId--.interactionDetails.insurance.car.leasing as leasing,
--aepTenantId--.interactionDetails.insurance.car.customerCity as city,
--aepTenantId--.interactionDetails.insurance.car.customerCountry as country,
--aepTenantId--.interactionDetails.insurance.car.customerNationality as nationality,
--aepTenantId--.interactionDetails.insurance.car.isCustomerPrimaryDriver as primaryuser,
--aepTenantId--.interactionDetails.insurance.car.hasCustomerPurchased as purchase,
--aepTenantId--.interactionDetails.insurance.car.priceBasic as pricequote,
timestamp
FROM demo_system_event_dataset_for_website_global_v1_1
WHERE --aepTenantId--.interactionDetails.insurance.car.type <> ''
Agora você deve ter algo como o seguinte:
Clique no ícone Play para executar esta célula. Isso pode levar alguns minutos.
Aguarde até que o indicador fique assim antes de continuar:
Você verá um resultado semelhante:
O conjunto de dados Demo System - Event Dataset for Website (Global v1.1) agora é atribuído a um quadro de dados, e agora um cientista de dados pode continuar a Exploração, Visualização e Desenvolvimento de Modelo com base nesse quadro de dados em seu computador local usando Anaconda e Serviço de Consulta.
Próxima etapa: 15.3 Operacionalize seu modelo usando uma Receita