Connecter Jupyter Notebook à Query Service

Ce document décrit les étapes à suivre pour connecter Jupyter Notebook à Adobe Experience Platform Query Service.

Commencer

Ce guide nécessite que vous ayez déjà accès à Jupyter Notebook et que vous connaissiez son interface. Pour télécharger Jupyter Notebook ou pour plus d’informations, consultez la documentation Jupyter Notebook officielle.

Pour acquérir les informations d’identification nécessaires à la connexion de Jupyter Notebook à Experience Platform, vous devez avoir accès à l’espace de travail Requêtes dans l’interface utilisateur d’Experience Platform. Veuillez contacter l’administrateur de votre organisation si vous n’avez pas actuellement accès à l’espace de travail Requêtes.

TIP
Anaconda Navigator est une interface utilisateur graphique (GUI) de bureau qui permet d’installer et de lancer plus facilement des programmes de Python courants tels que Jupyter Notebook. Il permet également de gérer les packages, les environnements et les canaux sans utiliser de commandes de ligne de commande.
Suivez le processus d’installation guidé sur leur site web pour installer la version de l’application que vous préférez.
Sur l'écran d'accueil du Navigateur Anaconda, sélectionnez Jupyter Notebook dans la liste des applications prises en charge pour lancer le programme.
Vous trouverez plus d’informations dans la documentation officielle d’Anaconda.

La documentation officielle de Jupyter fournit des instructions pour exécuter le notebook à partir de l’interface de ligne de commande(CLI).

Launch Jupyter Notebook

Après avoir ouvert une nouvelle application web Jupyter Notebook, sélectionnez la liste déroulante New dans l’interface utilisateur, puis Python 3 pour créer un notebook. L’éditeur de Notebook s’affiche.

Sur la première ligne de l’éditeur de Notebook, saisissez la valeur suivante : pip install psycopg2-binary et sélectionnez Run dans la barre de commandes. Un message de réussite s’affiche sous la ligne de saisie.

IMPORTANT
Dans le cadre de ce processus de création d’une connexion, vous devez sélectionner Run pour exécuter chaque ligne de code.

Importez ensuite un adaptateur de base de données PostgreSQL pour Python. Saisissez la valeur : import psycopg2 et sélectionnez Run. Il n’y a aucun message de réussite pour ce processus. S’il n’y a aucun message d’erreur, passez à l’étape suivante.

Vous devez maintenant fournir vos identifiants Adobe Experience Platform en saisissant la valeur : conn = psycopg2.connect("{YOUR_CREDENTIALS}"). Vos informations d’identification de connexion se trouvent dans la section Requêtes, sous l’onglet Informations d’identification de l’interface utilisateur d’Experience Platform. Consultez la documentation sur la façon de trouver les informations d’identification de votre organisation pour obtenir des instructions détaillées.

L’utilisation d’informations d’identification non expirantes est recommandée lors de l’utilisation de clients tiers afin d’éviter la saisie répétée de vos informations. Consultez la documentation pour obtenir des instructions sur comment générer et utiliser des informations d’identification non expirantes.

IMPORTANT
Lors de la copie d’informations d’identification depuis l’interface utilisateur d’Experience Platform, aucune mise en forme supplémentaire des informations d’identification n’est nécessaire. Elles peuvent être données sur une seule ligne, avec un seul espace entre les propriétés et les valeurs. Les informations d’identification sont placées entre guillemets et non séparées par des virgules.
conn = psycopg2.connect('''sslmode=require host=<YOUR_HOST_CREDENTIAL> port=80 dbname=prod:all user=<YOUR_ORGANIZATION_ID> password=<YOUR_PASSWORD>''')"

Votre instance Jupyter Notebook est maintenant connectée à Query Service.

Exemple d’exécution de requête

Maintenant que vous avez connecté Jupyter Notebook à Query Service, vous pouvez exécuter des requêtes sur vos jeux de données à l’aide de vos entrées Notebook. L’exemple suivant utilise une requête simple pour démontrer le processus .

Saisissez les valeurs suivantes :

cur = conn.cursor()
cur.execute('''<YOUR_QUERY_HERE>''')
data = [r for r in cur]

Ensuite, appelez le paramètre (data dans l’exemple ci-dessus) pour afficher les résultats de la requête dans une réponse non formatée.

Pour formater les résultats de manière plus lisible, utilisez les commandes suivantes :

  • colnames = [desc[0] for desc in cur.description]
  • import pandas as pd
  • import numpy as np
  • df = pd.DataFrame(samples,columns=colnames)
  • df.fillna(0,inplace=True)

Ces commandes ne génèrent pas de message de réussite. S’il n’existe aucun message d’erreur, vous pouvez utiliser une fonction pour générer les résultats de votre requête SQL sous la forme d’une table.

Saisissez et exécutez la fonction df.head() pour afficher les résultats de la requête tabulée.

Étapes suivantes

Maintenant que vous êtes connecté à Query Service, vous pouvez utiliser Jupyter Notebook pour écrire des requêtes. Pour plus d’informations sur la façon d’écrire et d’exécuter des requêtes, veuillez lire le guide relatif aux requêtes en cours d’exécution.

recommendation-more-help
ccf2b369-4031-483f-af63-a93b5ae5e3fb