Conectar Jupyter Notebook al servicio de consultas

Este documento describe los pasos necesarios para conectar Jupyter Notebook con Adobe Experience Platform Query Service.

Introducción

Esta guía requiere que ya tenga acceso a Jupyter Notebook y que esté familiarizado con su interfaz. Para descargar Jupyter Notebook o más información, consulte la documentación oficial Jupyter Notebook 3}.

Para adquirir las credenciales necesarias para conectar Jupyter Notebook al Experience Platform, debe tener acceso al área de trabajo Consultas en la interfaz de usuario de Platform. Póngase en contacto con el administrador de su organización si actualmente no tiene acceso al área de trabajo Consultas.

TIP
Anaconda Navigator es una interfaz gráfica de usuario (GUI) de escritorio que proporciona una forma más sencilla de instalar e iniciar programas comunes de Python como Jupyter Notebook. También ayuda a administrar paquetes, entornos y canales sin utilizar comandos de la línea de comandos.
Siga el proceso de instalación guiada en su sitio web para instalar su versión preferida de la aplicación.
En la pantalla de inicio de Anaconda Navigator, seleccione Jupyter Notebook de la lista de aplicaciones compatibles para iniciar el programa.
Encontrará más información en la documentación oficial de Anaconda.

La documentación oficial de Jupyter proporciona instrucciones para ejecutar el bloc de notas desde la interfaz de línea de comandos (CLI).

Launch Jupyter Notebook

Después de abrir una nueva aplicación web Jupyter Notebook, seleccione el menú desplegable New de la interfaz de usuario, seguido de Python 3 para crear un nuevo bloc de notas. Aparece el editor Notebook.

En la primera línea del editor Notebook, escriba el siguiente valor: pip install psycopg2-binary y seleccione Run en la barra de comandos. Aparece un mensaje de éxito debajo de la línea de entrada.

IMPORTANT
Como parte de este proceso para formar una conexión, debe seleccionar Run para ejecutar cada línea de código.

A continuación, importe un adaptador de base de datos PostgreSQL para Python. Introduzca el valor: import psycopg2 y seleccione Run. No hay ningún mensaje de éxito para este proceso. Si no hay ningún mensaje de error, continúe con el paso siguiente.

Ahora debe proporcionar sus credenciales de Adobe Experience Platform al escribir el valor: conn = psycopg2.connect("{YOUR_CREDENTIALS}"). Sus credenciales de conexión se encuentran en la sección Consultas, en la ficha Credenciales de la interfaz de usuario de Platform. Consulte la documentación sobre cómo encontrar las credenciales de su organización para obtener instrucciones detalladas.

Se recomienda el uso de credenciales que no caducan al utilizar clientes de terceros para ahorrar el esfuerzo de escribir repetidamente sus detalles. Consulte la documentación para obtener instrucciones sobre cómo generar y utilizar credenciales que no caduquen.

IMPORTANT
Al copiar credenciales desde la interfaz de usuario de Platform, no es necesario aplicar un formato adicional a las credenciales. Se pueden indicar en una línea, con un solo espacio entre las propiedades y los valores. Las credenciales están entre comillas y no separadas por comas.
conn = psycopg2.connect('''sslmode=require host=<YOUR_HOST_CREDENTIAL> port=80 dbname=prod:all user=<YOUR_ORGANIZATION_ID> password=<YOUR_PASSWORD>''')"

Su instancia de Jupyter Notebook ahora está conectada al servicio de consultas.

Ejemplo de ejecución de consultas

Ahora que ha conectado Jupyter Notebook al servicio de consultas, puede realizar consultas en los conjuntos de datos usando las entradas de Notebook. El siguiente ejemplo utiliza una consulta simple para mostrar el proceso.

Introduzca los siguientes valores:

cur = conn.cursor()
cur.execute('''<YOUR_QUERY_HERE>''')
data = [r for r in cur]

A continuación, llame al parámetro (data en el ejemplo anterior) para mostrar los resultados de la consulta en una respuesta sin formato.

Para dar un formato más legible a los resultados en lenguaje natural, utilice los siguientes comandos:

  • colnames = [desc[0] for desc in cur.description]
  • import pandas as pd
  • import numpy as np
  • df = pd.DataFrame(samples,columns=colnames)
  • df.fillna(0,inplace=True)

Estos comandos no generan un mensaje de éxito. Si no hay ningún mensaje de error, puede utilizar una función para generar los resultados de la consulta SQL en formato de tabla.

Escriba y ejecute la función df.head() para ver los resultados de la consulta tabularizada.

Pasos siguientes

Ahora que se ha conectado con el servicio de consultas, puede usar Jupyter Notebook para escribir consultas. Para obtener más información sobre cómo escribir y ejecutar consultas, lea la guía de ejecución de consultas.

recommendation-more-help
ccf2b369-4031-483f-af63-a93b5ae5e3fb