将Jupyter Notebook连接到查询服务

本文档介绍将Jupyter Notebook连接到Adobe Experience Platform查询服务所需的步骤。

快速入门

本指南要求您已经拥有Jupyter Notebook的访问权限并熟悉其界面。 要下载Jupyter Notebook或了解更多信息,请参阅官方 Jupyter Notebook 文档

要获取连接Jupyter Notebook到Experience Platform所需的凭据,您必须有权访问平台UI中的查询工作区。 如果您当前无权访问查询工作区,请联系您的组织管理员。

TIP
Anaconda Navigator是一个桌面图形用户界面(GUI),它提供了一种更容易安装和启动常用Python程序(如Jupyter Notebook)的方法。 它还有助于在不使用命令行命令的情况下管理包、环境和通道。
按照其网站上的引导式安装过程来安装您的首选应用程序版本
从Anaconda Navigator主屏幕中,从支持的应用程序列表中选择​ Jupyter Notebook ​以启动该程序。
有关详细信息,请参阅Anaconda官方文档

Jupyter官方文档提供了从命令行界面🔗 (CLI) 运行笔记本的说明。

Launch Jupyter Notebook

打开新的Jupyter Notebook Web应用程序后,从UI中选择​ New ​下拉列表,然后选择​ Python 3 ​以创建新的笔记本。 出现Notebook编辑器。

在Notebook编辑器的第一行,输入以下值: pip install psycopg2-binary并从命令栏中选择​ Run。 输入行下方将显示一条成功消息。

IMPORTANT
作为建立连接的过程的一部分,您必须选择​ Run ​以执行每行代码。

接下来,为Python导入PostgreSQL数据库适配器。 输入值: import psycopg2并选择​ Run。 此进程没有成功消息。 如果没有错误消息,请继续执行下一步。

您现在必须输入以下值来提供您的Adobe Experience Platform凭据: conn = psycopg2.connect("{YOUR_CREDENTIALS}")。 可在Platform UI的凭据选项卡下的查询部分中找到您的连接凭据。 有关详细说明,请参阅有关如何查找组织凭据的文档。

在使用第三方客户端时,建议使用未过期的凭据,以节省重复输入详细信息的精力。 有关如何生成和使用未过期的凭据的说明,请参阅文档。

IMPORTANT
从Platform UI复制凭据时,不需要凭据的其他格式。 它们可以在一行中给出,属性和值之间只有一段空格。 凭据用引号括起来,不能用逗号分隔
conn = psycopg2.connect('''sslmode=require host=<YOUR_HOST_CREDENTIAL> port=80 dbname=prod:all user=<YOUR_ORGANIZATION_ID> password=<YOUR_PASSWORD>''')"

您的Jupyter Notebook实例现在已连接到查询服务。

示例查询执行

现在您已将Jupyter Notebook连接到查询服务,可以使用Notebook输入对数据集执行查询。 以下示例使用一个简单的查询来演示该过程。

输入以下值:

cur = conn.cursor()
cur.execute('''<YOUR_QUERY_HERE>''')
data = [r for r in cur]

接下来,调用参数(data,以上示例中为),以在未格式化的响应中显示查询结果。

要以更易于用户阅读的方式格式化结果,请使用以下命令:

  • colnames = [desc[0] for desc in cur.description]
  • import pandas as pd
  • import numpy as np
  • df = pd.DataFrame(samples,columns=colnames)
  • df.fillna(0,inplace=True)

这些命令不会生成成功消息。 如果没有错误消息,则可以使用函数以表格式输出SQL查询的结果。

输入并运行df.head()函数以查看列表化的查询结果。

后续步骤

现在您已连接查询服务,可以使用Jupyter Notebook编写查询。 有关如何编写和运行查询的详细信息,请参阅运行查询指南

recommendation-more-help
ccf2b369-4031-483f-af63-a93b5ae5e3fb