将Jupyter Notebook连接到查询服务
本文档介绍将Jupyter Notebook连接到Adobe Experience Platform查询服务所需的步骤。
快速入门
本指南要求您已经拥有Jupyter Notebook的访问权限并熟悉其界面。 要下载Jupyter Notebook或了解更多信息,请参阅官方 Jupyter Notebook 文档。
要获取连接Jupyter Notebook到Experience Platform所需的凭据,您必须有权访问平台UI中的查询工作区。 如果您当前无权访问查询工作区,请联系您的组织管理员。
按照其网站上的引导式安装过程来安装您的首选应用程序版本。
从Anaconda Navigator主屏幕中,从支持的应用程序列表中选择 Jupyter Notebook 以启动该程序。
有关详细信息,请参阅Anaconda官方文档。
Jupyter官方文档提供了从命令行界面🔗 (CLI) 运行笔记本的说明。
Launch Jupyter Notebook
打开新的Jupyter Notebook Web应用程序后,从UI中选择 New 下拉列表,然后选择 Python 3 以创建新的笔记本。 出现Notebook编辑器。
在Notebook编辑器的第一行,输入以下值: pip install psycopg2-binary
并从命令栏中选择 Run。 输入行下方将显示一条成功消息。
接下来,为Python导入PostgreSQL数据库适配器。 输入值: import psycopg2
并选择 Run。 此进程没有成功消息。 如果没有错误消息,请继续执行下一步。
您现在必须输入以下值来提供您的Adobe Experience Platform凭据: conn = psycopg2.connect("{YOUR_CREDENTIALS}")
。 可在Platform UI的凭据选项卡下的查询部分中找到您的连接凭据。 有关详细说明,请参阅有关如何查找组织凭据的文档。
在使用第三方客户端时,建议使用未过期的凭据,以节省重复输入详细信息的精力。 有关如何生成和使用未过期的凭据的说明,请参阅文档。
conn = psycopg2.connect('''sslmode=require host=<YOUR_HOST_CREDENTIAL> port=80 dbname=prod:all user=<YOUR_ORGANIZATION_ID> password=<YOUR_PASSWORD>''')"
您的Jupyter Notebook实例现在已连接到查询服务。
示例查询执行
现在您已将Jupyter Notebook连接到查询服务,可以使用Notebook输入对数据集执行查询。 以下示例使用一个简单的查询来演示该过程。
输入以下值:
cur = conn.cursor()
cur.execute('''<YOUR_QUERY_HERE>''')
data = [r for r in cur]
接下来,调用参数(data
,以上示例中为),以在未格式化的响应中显示查询结果。
要以更易于用户阅读的方式格式化结果,请使用以下命令:
colnames = [desc[0] for desc in cur.description]
import pandas as pd
import numpy as np
df = pd.DataFrame(samples,columns=colnames)
df.fillna(0,inplace=True)
这些命令不会生成成功消息。 如果没有错误消息,则可以使用函数以表格式输出SQL查询的结果。
输入并运行df.head()
函数以查看列表化的查询结果。
后续步骤
现在您已连接查询服务,可以使用Jupyter Notebook编写查询。 有关如何编写和运行查询的详细信息,请参阅运行查询指南。