Dans cet exercice, vous allez installer Anaconda sur votre ordinateur local pour pouvoir exécuter des portables Jupyter sur votre ordinateur local, puis interagir avec les données de Adobe Experience Platform via le service de Requête.
Avec Adobe Experience Platform Data Science Workspace, nous rendons les portables Jupyter disponibles en mode natif sur Adobe Experience Platform. Ainsi, les Data Scientists peuvent désormais lire les données et écrire les données sur Plateforme en mode natif.
De nombreux chercheurs en données préfèrent cependant travailler sur leurs machines locales pour l'exploration des données et la construction de modèles. C'est un modèle que Adobe Experience Platform prend également en charge par Adobe Experience Platform Requête Service. Grâce à cela, les chercheurs en données peuvent charger directement les données de Platform dans leur environnement de choix local.
Pour cet exercice, nous utilisons Anaconda Navigator que vous pouvez télécharger et installer à partir de ici.
Si vous utilisez un MacBook, veillez à ce que brew soit installé. Vous trouverez les instructions d'installation de brew ici : https://brew.sh/
En outre, après avoir installé brew, vous devez installer le package postgres en exécutant la commande brew install postgres dans une fenêtre Terminal.
Vous trouverez ci-dessous d’autres méthodes pour vous assurer que les packages requis sont installés sur votre ordinateur :
Exécutez cette commande dans une fenêtre Terminal : (essayez d’abord ces commandes)
Exécutez cette commande dans une fenêtre Terminal :
Exécutez ces 2 commandes dans une fenêtre Terminal :
Après avoir installé Anaconda, ouvrez Anaconda et vous verrez la page ci-dessous.
Cliquez sur le bouton Lancer pour JupyterLab.
Après cela, votre navigateur doit ouvrir et vous montrer la page du début JupyterLab.
Ouvrez un nouveau bloc-notes Python 3 en cliquant sur le bouton ci-dessous comme indiqué.
Vous aurez alors un nouveau bloc-notes vide.
Vous aurez alors un nouveau portable Python 3 vide et vide. Avant de continuer, donnez un nom descriptif à votre bloc-notes. Cliquez avec le bouton droit sur le fichier Untitled.ipynb et cliquez sur Renommer.
Saisissez mutuales365-assurance-anaconda.ipynb comme nom pour votre ordinateur portable et appuyez sur Entrée. Vous aurez ensuite ceci :
Cette cellule téléchargera et installera 2 bibliothèques externes nécessaires à la prise en charge de PostgreSQL. La première exécution de cette cellule peut prendre quelques minutes.
FYI : si vous obtenez une erreur lors du chargement de psycopg2, vous devez installer postgres sur votre ordinateur en ouvrant une fenêtre de terminal et en exécutant la commande brw install postgres (qui suppose que vous avez "brew" déjà installé sur votre MacBook).
Cliquez sur la première cellule vide du bloc-notes.
Copiez le code ci-dessous et collez-le dans la première cellule de votre bloc-notes.
!pip install --user psycopg2-binary
!pip install --user sql_magic
import sys
import pprint
import psycopg2
Vous aurez ensuite ceci dans la cellule 1 :
Cliquez sur l'icône Lecture pour exécuter cette cellule. Si vous rencontrez une erreur avec cette cellule, vérifiez les autres méthodes d'installation des postgres, comme mentionné ci-dessus dans la section Conditions préalables.
Attendez que l’indicateur se présente comme suit avant de continuer :
Le résultat ressemble à ceci :
Dans cette étape, vous devez vous connecter à Requête Service.
Faites défiler la page vers le bas et cliquez dans la cellule vide suivante.
Copiez le code ci-dessous et collez-le dans la première cellule de votre bloc-notes.
# Copy these settings from https://platform.adobe.com/query/configuration
connection = psycopg2.connect(
sslmode='require',
host='',
port='80',
dbname='prod:all',
user='',
password='')
Pour vous connecter, vous devez mettre à jour les champs suivants du code ci-dessus en fonction des informations disponibles dans Adobe Experience Platform.
Pour récupérer ces paramètres de Requête Service, accédez à Adobe Experience Platform, à Requêtes > Informations d'identification > Informations d'identification des postgres.
Après avoir copié le code ci-dessus et mis à jour les champs comme indiqué, vous devez disposer de quelque chose comme ceci :
Cliquez sur l'icône Lecture pour exécuter cette cellule. Cela pourrait prendre quelques secondes.
Attendez que l’indicateur se présente comme suit avant de continuer :
Dans cette étape, vous allez activer SQL dans votre bloc-notes.
Faites défiler la page vers le bas et cliquez dans la cellule vide suivante.
Copiez le code ci-dessous et collez-le dans la première cellule de votre bloc-notes.
# Enable sql magic
%load_ext sql_magic
%config SQL.conn_name = 'connection'
Vous devriez maintenant avoir quelque chose comme ça :
Cliquez sur l'icône Lecture pour exécuter cette cellule. Cela pourrait prendre quelques secondes.
Attendez que l’indicateur se présente comme suit avant de continuer :
Dans cette étape, vous allez début d'interagir avec des jeux de données à Adobe Experience Platform à partir de votre environnement Anaconda local et de Jupyter Notebook.
Faites défiler la page vers le bas et cliquez dans la cellule vide suivante.
Copiez le code ci-dessous et collez-le dans la première cellule de votre bloc-notes.
%%read_sql
show tables
Vous devriez maintenant avoir quelque chose comme ça :
Cliquez sur l'icône Lecture pour exécuter cette cellule. Cela pourrait prendre quelques secondes.
Attendez que l’indicateur se présente comme suit avant de continuer :
Vous verrez alors tous les jeux de données disponibles à Adobe Experience Platform être retournés sur votre environnement Anaconda local et sur Jupyter Notebook.
Accède à la cellule suivante. Dans cette cellule, vous allez charger des champs spécifiques du système de démonstration - jeu de données de Événement pour le site Web (Global v1.1) jeu de données de Adobe Experience Platform dans un cadre de données.
Faites défiler la page vers le bas et cliquez dans la cellule vide suivante.
Copiez le code ci-dessous et collez-le dans la première cellule de votre bloc-notes.
%%read_sql df_result
SELECT --aepTenantId--.identification.core.ecid as ecid,
--aepTenantId--.interactionDetails.insurance.car.numberKm as km,
--aepTenantId--.interactionDetails.insurance.car.type as cartype,
--aepTenantId--.interactionDetails.insurance.car.customerAge as age,
--aepTenantId--.interactionDetails.insurance.car.customerGender as gender,
--aepTenantId--.interactionDetails.insurance.car.brand as carbrand,
--aepTenantId--.interactionDetails.insurance.car.leasing as leasing,
--aepTenantId--.interactionDetails.insurance.car.customerCity as city,
--aepTenantId--.interactionDetails.insurance.car.customerCountry as country,
--aepTenantId--.interactionDetails.insurance.car.customerNationality as nationality,
--aepTenantId--.interactionDetails.insurance.car.isCustomerPrimaryDriver as primaryuser,
--aepTenantId--.interactionDetails.insurance.car.hasCustomerPurchased as purchase,
--aepTenantId--.interactionDetails.insurance.car.priceBasic as pricequote,
timestamp
FROM demo_system_event_dataset_for_website_global_v1_1
WHERE --aepTenantId--.interactionDetails.insurance.car.type <> ''
Vous devriez maintenant avoir quelque chose comme ça :
Cliquez sur l'icône Lecture pour exécuter cette cellule. Cela pourrait prendre quelques minutes.
Attendez que l’indicateur se présente comme suit avant de continuer :
Vous verrez alors un résultat similaire :
L'ensemble de données Demo System - Événement Dataset for Website (Global v1.1) est maintenant affecté à un cadre de données et un scientifique de données peut maintenant continuer l'exploration, la visualisation et le développement de modèles en se basant sur ce cadre de données sur son ordinateur local à l'aide d'Anaconda et de Requête Service.
Étape suivante : 15.3 Opérationnalisez votre modèle à l'aide d'une Recette