aepp Python ライブラリのインストール
aepp は、Adobeが管理するオープンソース Python ライブラリで、他のExperience Platformサービスにリクエストを行う場合と同様に、データDistillerに接続しクエリを送信する機能を提供します。 aepp
ライブラリは、インタラクティブな Data Distiller クエリ用に PostgreSQL データベースアダプターパッケージの psycopg2
を利用します。 単独で Data Distillerに接続し、Experience Platformデータセットをクエリすることもできますが、psycopg2
の方が、より高い利便性と、すべてのExperience PlatformAPI サービスに対するリクエストを行う aepp
めの追加機能を提供します。
お使いの環境で aepp
と psycopg2
をインストールまたはアップグレードするには、ノートブックで %pip
magic コマンドを使用します。
%pip install --upgrade aepp
%pip install --upgrade psycopg2-binary
その後、次のコードを使用して、資格情報を含んだ aepp
ライブラリを設定できます。
from configparser import ConfigParser
# Create a ConfigParser object to read and store information from config.ini
config = ConfigParser()
config_path = '<PATH_TO_YOUR_CONFIG.INI_FILE>'
config.read(config_path)
# Configure aepp with your credentials
import aepp
aepp.configure(
org_id=config.get('Credential', 'ims_org_id'),
sandbox=config.get('Credential', 'sandbox_name'),
client_id=config.get('Credential', 'client_id'),
secret=config.get('Credential', 'client_secret'),
scopes=config.get('Credential', 'scopes'),
tech_id=config.get('Credential', 'tech_acct_id')
)
Data Distillerへの接続の作成
認証情報 aepp
設定されたら、次のコードを使用して Data Distillerへの接続を作成し、次のようにインタラクティブセッションを開始できます。
from aepp import queryservice
dd_conn = queryservice.QueryService().connection()
dd_cursor = queryservice.InteractiveQuery2(dd_conn)
その後、Experience Platformサンドボックスでデータセットに対してクエリを実行できます。 クエリ対象のデータセットの ID を指定すると、カタログサービスから対応するテーブル名を取得し、そのテーブルに対してクエリを実行できます。
table_name = 'ecommerce_events'
simple_query = f'''SELECT * FROM {table_name} LIMIT 5'''
dd_cursor.query(simple_query)
単一のデータセットに接続して、クエリのパフォーマンスを向上させます
デフォルトでは、Data Distiller接続は、サンドボックス内のすべてのデータセットに接続します。 クエリを高速化しリソース使用量を削減するには、代わりに、関心のある特定のデータセットに接続できます。 これを行うには、Data Distiller接続オブジェクトの dbname
を {sandbox}:{table_name}
に変更します。
from aepp import queryservice
sandbox = config.get('Credential', 'sandbox_name')
table_name = 'ecommerce_events'
dd_conn = queryservice.QueryService().connection()
dd_conn['dbname'] = f'{sandbox}:{table_name}'
dd_cursor = queryservice.InteractiveQuery2(dd_conn)
次の手順
このドキュメントでは、機械学習の Python ノートブックから Data Distillerに接続する方法について説明しました。 Experience Platformから機能パイプラインを作成して、機械学習環境でカスタムモデルにフィードする次の手順は、 データセットを調査および分析することです。