データモデルのベストプラクティス data-model-best-practices
このドキュメントでは、Adobe Campaign データモデルを設計する際の主なレコメンデーションの概要を説明します。
Campaign のビルトインテーブルとそのインタラクションについて詳しくは、 この節を参照してください。
キャンペーンスキーマの概要については、 このドキュメントを参照してください。 Adobe Campaign データベースの概念的データモデルを拡張するための拡張スキーマの設定方法については、 このドキュメントを参照してください。
概要 overview
Adobe Campaign システムは非常に柔軟性が高く、初期の実装をさらに拡張可能です。 可能性は無限です。とはいえ、賢明な判断を下し、データモデルの設計を開始する前に強力な基盤を構築しておくことが不可欠です。
このドキュメントでは、Adobe Campaign ツールを適切にアーキテクトする方法を学ぶための一般的なユースケースとベストプラクティスを示します。
データモデルアーキテクチャ data-model-architecture
Adobe Campaign は強力なクロスチャネルキャンペーン管理システムであり、オンラインとオフラインのマーケティング戦略を融合して、パーソナライズされた顧客体験を作成できます。
顧客中心のアプローチ customer-centric-approach
ほとんどのメールサービスプロバイダーは、リスト中心アプローチを使用して顧客と通信していますが、Adobe Campaign は、リレーショナルデータベースに基づいて、顧客と顧客の属性を幅広く視野に入れて活用しています。
この顧客中心アプローチを次のグラフに示します。 グレーの 受信者 テーブルは、すべてが構築されているメインの顧客テーブルを表します。
各テーブルの記述にアクセスするには、管理/設定/データスキーマ に移動し、リストからリソースを選択して「ドキュメント」タブをクリックします。
Adobe Campaignのデフォルトデータモデルについては、 このドキュメントを参照してください。
Adobe Campaign 用データ data-for-campaign
Adobe Campaign に送信すべきデータマーケティングアクティビティに必要なデータを決定することがきわめて重要です。
Adobe Campaign で必要な属性であるかどうかを判断するには、次のカテゴリのいずれかに該当するかどうかを確認します。
- セグメント化 に使用する属性
- データ管理プロセス に使用する属性(集計計算など)
- パーソナライゼーション に使用する属性
これらのいずれにも該当しない場合、その属性は Adobe Campaign でまず必要にならないと思われます。
データタイプの選択 data-types
システムのアーキテクチャとパフォーマンスを適切な状態に保つには、次のベストプラクティスに従って Adobe Campaign のデータを設定します。
- 大きなテーブルには、主として数値フィールドや参照テーブルへのリンクを含みます(値のリストを扱う場合)。
- expr 属性を使用すると、テーブル内の物理的な設定値ではなく、計算フィールドとしてスキーマ属性を定義できます。 これにより、は、両方の値を保存する必要なく、異なる形式(年齢や生年月日など)の情報にアクセスできます。 これにより、フィールドの重複を避けることができます。例えば、ドメインはメールフィールドに既に存在するので、受信者テーブルでドメインの式を使用できます。
- ただし、式の計算が複雑な場合は、expr 属性を使用しないでください。検索時に計算すると、クエリのパフォーマンスに影響を与える可能性があるからです。
- XML 型を使用すると、作成するフィールドの数を減らすことができます。ただし、データベース内で CLOB 列を使用するので、ディスク領域も消費します。また、結果的に複雑な SQL クエリになり、パフォーマンスに影響を与える可能性もあります。
- 文字列 フィールドの長さは、常に列で定義する必要があります。Adobe Campaign ではデフォルトの最大長は 255 ですが、データの最大長があらかじめわかっている場合は、フィールドの長さを短くすることをお勧めします。
- 参照元のシステム内のフィールドサイズが過大に見積もられていて、データはそれほど長くないことが確実な場合は、Adobe Campaign のフィールドを参照元のシステムのフィールドより短くしても構いません。 これにより、Adobe Campaign では短い文字列や小さい整数として扱うことができます。
フィールドの選択 choice-of-fields
ターゲティングやパーソナライゼーションに利用するフィールドは、テーブルに格納する必要があります。つまり、パーソナライズされたメール送信やクエリの条件に使用しないフィールドは、ディスク領域を消費しますが、意味はありません。
ハイブリッドインスタンスおよびオンプレミスインスタンスの場合、FDA (Federated Data Access、外部データにアクセスできるオプション機能)は、キャンペーンプロセス中に「その場」でフィールドを追加する必要があることを説明します。 FDA を使用している場合は、すべてを読み込む必要はありません。 詳しくは、Federated Data Access についてを参照してください。
キーの選択 choice-of-keys
ほとんどのテーブルでデフォルトにより定義されている autopk に加えて、論理キーやビジネスキー(アカウント番号、クライアント番号など)を追加することを検討してください。 後でデータのインポートや紐付け、データパッケージに使用できます。詳細については、識別子を参照してください。
パフォーマンスを高めるには、効率的なキーが不可欠です。 テーブルのキーとして常に推奨されるのは、数値データ型です。
SQLServer データベースの場合、パフォーマンスが必要な場合は「クラスタ化インデックス」の使用を検討できます。 Adobeでは処理しないので、SQL で作成する必要があります。
専用テーブルスペース dedicated-tablespaces
スキーマのテーブルスペース属性を使用して、テーブル専用のテーブルスペースを指定できます。
インストールアシスタントでは、オブジェクトをタイプ(データ、一時、インデックス)別に保存できます。
専用のテーブルスペースは、パーティション化、セキュリティ・ルールに適しており、柔軟な管理、最適化、パフォーマンスの向上が可能です。
識別子 identifiers
Adobe Campaign リソースには 3 つの識別情報があり、別の識別情報を追加することもできます。
これらの識別子とその目的を次の表に示します。
- ID は、Adobe Campaign テーブルの物理的なプライマリキーです。標準のテーブルの場合は、シーケンスから生成された 32 ビットの番号になります
- この ID は通常、特定のAdobe Campaign インスタンスに対して一意です。
- 自動生成された ID は、スキーマ定義に表示できます。 autopk="true" 属性を検索します。
- 自動生成された識別子は、ワークフローやパッケージ定義で参照として使用しないでください。
- ID が常に増加する数になるという前提は立てないでください。
- 標準テーブルの ID は 32 ビットの番号なので、このタイプは変更しないでください。 この番号は、同じ名前のセクションで説明されている「シーケンス」から取得されます。
- この情報は、テーブル内のレコードの一意の識別子です。この値は、通常は生成された名前で手動で更新できます。
- この識別子は、Adobe Campaign の別のインスタンスにデプロイされたときにその値を保持し、空にはしないでください。
- オブジェクトをある環境から別の環境にデプロイする場合は、Adobe Campaignで生成されたレコード名を変更します。
- オブジェクトに名前空間属性(schema など)がある場合、この共通の名前空間は、作成されたすべてのカスタムオブジェクトで活用されます。一部の予約済み名前空間(nms、xtk、nl、ncl、crm、xxl)は使用しないでください。
- オブジェクトに名前空間(workflow や delivery など)がない場合、この名前空間は内部名オブジェクトのプレフィックスとして追加されます(namespaceMyObjectName)。
- スペース「」、セミコロン「:」、ハイフン「–」などの特殊文字は使用しないでください。 これらの文字はすべて、アンダースコア「_」(許可されている文字)に置き換えられます。例えば、「abc-def」と「abc:def」は「abc_def」として保存され、相互に上書きされます。
- ラベルは、Adobe Campaign 内のオブジェクトまたはレコードのビジネス識別子です。
- このオブジェクトでは、スペースと特殊文字も使用できます。
- レコードの一意性は保証されません。
- オブジェクトラベルの構造を決定することをお勧めします。
- これは、Adobe Campaign ユーザーにとって、レコードまたはオブジェクトを識別するための最も使いやすい解決策です。
カスタム内部キー custom-internal-keys
プライマリキーは、Adobe Campaign で作成されるすべてのテーブルに必要です。
ほとんどの組織は、外部システムからレコードを読み込んでいます。受信者テーブルの物理キーは「id」属性ですが、さらにカスタムキーを特定することもできます。
このカスタムキーは、Adobe Campaign にフィードする外部システムの実際のレコードのプライマリキーです。
標準テーブルに autopk と内部キーの両方が含まれている場合、内部キーは物理データベーステーブルの一意のインデックスとして設定されます。
カスタムテーブルを作成する場合は、次の 2 つのオプションがあります。
- 自動生成されたキー(id)と内部キー(カスタム)の組み合わせ。このオプションは、システムキーが複合キーであるか、整数ではない場合に役立ちます。 整数は、大きいテーブルで高いパフォーマンスを提供し、他のテーブルと結合できます。
- プライマリキーを外部システムのプライマリキーとして使用します。 この解決策は、異なるシステム間で一貫したキーを使用してデータのインポートとエクスポートのアプローチを簡素化するので、通常は推奨されます。キーの名前が「id」で、(自動生成でない)外部の値が入力されると想定される場合は、autopk を無効にしてください。
シーケンス sequences
Adobe Campaignのプライマリキーは、すべての標準テーブルの自動生成 id で、カスタムテーブルで同じにすることができます。 詳しくは、この節を参照してください。
この値は、番号順序の生成に使用されるデータベース オブジェクトである sequence から取得されます。
シーケンスには次の 2 種類があります。
- 共有:複数のテーブルが同じシーケンスから ID を選択します。 つまり、ID 「X」が 1 つのテーブルで使用されている場合、同じシーケンスを共有する他のテーブルには、その ID 「X」を持つレコードは存在しません。 XtkNewId は、Adobe Campaignで使用できるデフォルトの共有シーケンスです。
- 専用:シーケンスから ID を選択しているテーブルは 1 つだけです。 通常、シーケンス名にはテーブル名が含まれます。
したがって、ログの保持期間が 180 日の年間 60 億通のメールを送信しているお客様は、4 か月で ID を使い果たすことになります。 このような問題を回避するには、ボリュームに応じたパージ設定を使用してください。 詳しくは、この節を参照してください。
プライマリキーが autoPK のカスタムテーブルをAdobe Campaignで作成する場合は、カスタム専用シーケンスをそのテーブルに体系的に関連付ける必要があります。
デフォルトでは、カスタムシーケンスは+1,000~+2.1BB の範囲の値を持ちます。 技術的には、負の ID を有効にすることで、4BB の全範囲を取得することが可能です。 これは慎重に使用してください。負の数から正の数に切り替えると、1 つの ID が失われます。通常、生成された SQL クエリでは、レコード 0 はAdobe Campaignによって無視されます。
シーケンスの概要については、 このビデオをご覧ください。
インデックス indexes
インデックスは、パフォーマンスにとって不可欠です。 スキーマ内のキーを宣言すると、Adobeによってキーのフィールドにインデックスが自動的に作成されます。 また、キーを使用しないクエリに対して、さらにインデックスを宣言できます。
Adobeでは、パフォーマンスを向上させる可能性があるので、追加のインデックスを定義することをお勧めします。
ただし、次の点に注意してください。
- インデックスの使用状況は、アクセスパターンにバインドされます。 インデックス作成の最適化は、多くの場合、データベース設計の重要な部分であり、エキスパートが対応する必要があります。 インデックスの追加は、多くの場合、データベースメンテナンスに付属する反復的なワークフローです。 これは、パフォーマンスの問題が発生した場合に対処するために、時間をかけて段階的に行われます。
- インデックスを使用すると、(インデックス自体を格納するために)テーブルの全体サイズが大きくなります。
- 列にインデックスを追加すると、データ読み取りアクセス(SELECT)のパフォーマンスが向上しますが、データ書き込みアクセス(UPDATE)のパフォーマンスが低下する可能性があります。
- これはデータ挿入時のパフォーマンスに影響するので、インデックスのサイズと数を制限する必要があります。
- 必要のない場合はインデックスを追加しないでください。 これが必要であること、およびクエリの全体的なパフォーマンス(テストと学習)が向上していることを確認してください。
- 一般的に、クエリで 10% を超えるレコードを取り戻すことができない場合は、インデックスが効率的です。
- 定義する必要があるインデックスを慎重に選択します。
- 標準テーブルからネイティブインデックスを削除しないでください。
例
インデックスの管理は非常に複雑になる可能性があるので、その仕組みを理解することが重要です。 この複雑さを説明するために、名と姓をフィルタリングして受信者を検索するなどの基本的な例について説明します。 手順は次のとおりです。
-
データベース内のすべての受信者を一覧表示するフォルダーに移動します。 詳しくは、 プロファイルの管理を参照してください。
-
「名 フィールドを右クリックします。
-
このフィールドでフィルター を選択します。
-
姓 フィールドに対してこの操作を繰り返します。
対応する 2 つのフィルターが画面の上部に追加されます。
様々なフィルター条件に従って、名 フィールドと 姓 フィールドに検索フィルターを実行できるようになりました。
これらのフィルターでの検索を高速化するために、インデックスを追加できるようになりました。 しかし、どのインデックスを使用するべきでしょうか。
次の表は、最初の列に表示されているアクセスパターンに従って、以下に説明する 3 つのインデックスが使用される場合と使用されない場合を示しています。
リンクとカーディナリティ links-and-cardinality
リンク links
大きなテーブルでは、「own」整合性に注意してください。「own」整合性でワイドテーブルを持つレコードを削除すると、インスタンスが停止する可能性があります。 テーブルはロックされ、削除は 1 つずつ行われます。したがって、大型の子テーブルには「neutral」整合性を使用することをお勧めします。
リンクを外部結合として宣言すると、パフォーマンスが悪くなります。ゼロ ID レコードは外部結合機能をエミュレートします。リンクで autopk を使用する場合は、外部結合を宣言する必要はありません。
ワークフロー内の任意のテーブルを結合できますが、リソース間の共通リンクをデータ構造の定義に直接定義することをお勧めします。
リンクは、テーブル内の実際のデータと整合するように定義する必要があります。誤った定義は、レコードの予期しない複製など、リンクを介して取得したデータに影響を与える可能性があります。
リンクには、テーブル名と一致する名前を付けます。リンク名は遠隔テーブルの内容を理解するのに役立ちます。
「id」をサフィックスとして含む名前をリンクに付けないでください。例えば、「transactionId」ではなく「transaction」という名前を付けます。
デフォルトでは、Adobe Campaign は外部テーブルのプライマリキーを使用してリンクを作成します。わかりやすくするために、リンク定義で結合を明示的に定義することをお勧めします。
リンクで使用される属性にインデックスが追加されます。
この 作成者リンクと最終変更者リンクは多くのテーブルに存在します。 この情報がビジネスで使用されていない場合は、リンクの属性 noDbIndex を使用してインデックスを無効にすることができます。
カーディナリティ cardinality
リンクを設計する場合は、1-1 関係が宣言されているときに、ターゲットレコードが一意になることを確認します。そうでない場合は、結合の結果、1 つであるはずのレコードが複数返される可能性があります。これにより、「クエリが想定以上の行を返す」場合、配信の準備中にエラーが発生します。リンク名をターゲットスキーマと同じ名前に設定します。
(1) 側のスキーマにカーディナリティ(1-N) のリンクを定義します。例えば、受信者 (1) - (N) トランザクションという関係は、トランザクションスキーマ内で定義してください。
デフォルトでは、リンクの逆カーディナリティは (N) なので注意してください。リンク定義に revCardinality='single' という属性を追加することで、リンク (1-1) を定義できます。
逆リンクをユーザーに表示しない場合は、リンク定義 revLink='NONE' を使用して非表示にできます。例えば、受信者から最後に完了したトランザクションへのリンクを定義する場合が、これに該当するユースケースです。受信者から最後のトランザクションへのリンクのみ表示されればよく、トランザクションテーブルからの逆リンクを表示する必要はありません。
外部結合 (1-0…1) を実行するリンクは、システムのパフォーマンスに影響を与えるので、慎重に使用してください。
データ保持 – クリーンアップとパージ data-retention
Adobe Campaign はデータウェアハウスでもレポートツールでもありません。したがって、Adobe Campaign ソリューションの高いパフォーマンスを確保するには、データベースの増大を抑制する必要があります。これを達成するには、以下のベストプラクティスが役に立ちます。
デフォルトでは、Adobe Campaignの配信ログとトラッキングログの保持期間は 180 日です。 クリーンアッププロセスが実行され、それより古いログが削除されます。
- ログを長く保持する場合は、データベースのサイズと送信されるメッセージの量に応じて、この決定を慎重に行う必要があります。 なお、Adobe Campaignシーケンスは 32 ビットの整数です。
- これらのテーブルには、一度に 10 億件を超えるレコード(使用可能な 21 億 4000 万 id の約 50%)を含めないことをお勧めします。これにより、使用可能なすべての id を使用するリスクが制限されます。 これにより、一部のお客様は保持期間を 180 日未満に短縮する必要があります。
データ保持について詳しくは、Campaign のプライバシーとセキュリティガイドラインを参照してください。
Campaign データベースクリーンアップワークフローについて詳しくは この節を参照してください。
Adobe Campaign 内のレコードの必要性を最小限に抑えるには、いくつかの解決策があります。
- Adobe Campaign 外部の Data Warehouse にデータをエクスポートする。
- 使用するデータ容量が小さいながらもマーケティング活動には十分な集計値を生成する。例えば、最後の購入を追跡することが目的であれば、Adobe Campaign の顧客トランザクション履歴をすべて残す必要はありません。
「deleteStatus」属性はスキーマで宣言できます。レコードを削除済みとマークしてから、後でクリーンアップタスクで削除する方が効率的です。
パフォーマンス performance
常にパフォーマンスの向上を図るには、次のベストプラクティスに従います。
一般的なレコメンデーション general-recommendations
- クエリで「CONTAINS」などの演算子は使用しません。フィルタリングしたい対象がはっきりしている場合は、「EQUAL TO」または他の特定のフィルター演算子を使用して同じ条件を適用します。
- ワークフローでデータを作成する際は、インデックスのないフィールドと結合しないでください。
- インポートやエクスポートなどのプロセスは営業時間外に行われるようにします。
- 日常のすべてのアクティビティがわかるスケジュールがあることを確認して、そのスケジュールに従います。
- 日常的なプロセスの 1 つまたはいくつかが失敗し、その同じ日に実行する必要がある場合があります。手動でプロセスを開始する際は、システムのパフォーマンスに影響を与える可能性があるので、競合するプロセスが実行されていないことを確認します。
- インポートプロセスを実行中、または手動プロセスを実行したときに、日常的なキャンペーンが実行されていないことを確認します。
- すべての行にフィールドを複製するのではなく、参照テーブルを使用します。キーと値のペアを使用する場合は、数値キーを選択することをお勧めします。
- 短い文字列は引き続き使用できます。参照テーブルが外部システムに配置されている場合、それを再利用すると、Adobe Campaign とのデータ統合が容易になります。
1 対多の関係 one-to-many-relationships
- データ設計は使い勝手と機能性に影響を与えます。1 対多の関係を多く持つデータモデルを設計すると、ユーザーがアプリケーション内で意味のあるロジックを作成するのが難しくなります。マーケターが技術者でない場合は、1 対多のフィルターロジックを正しく理解して構築するのは困難なことがあります。
- 必須フィールドをすべて 1 つのテーブルにまとめておくと、クエリの作成が容易になります。結合を回避できれば、テーブル間でいくつかのフィールドを複製することもパフォーマンス的には良い場合があります。
- オファーの重み付けの式や配信などのように、1 対多の関係を参照できないビルトイン機能もあります。
大きいテーブル large-tables
Adobe Campaign は、サードパーティのデータベースエンジンを活用しています。プロバイダーによっては、大きいテーブルに対するパフォーマンスを最適化するために、特定のデザインが必要になる場合があります。
大きいテーブルと複雑な結合を使用したデータモデルを設計する場合は、以下のような一般的なベストプラクティスに従う必要があります。
- 追加のカスタム受信者テーブルを使用する場合は、配信マッピングごとに専用のログテーブルを使用します。
- 列の数を減らします。特に、未使用の列を特定して削減します。
- 複雑な結合を回避して、データモデルのリレーションを最適化します。たとえば、複数の条件や複数の列に対する結合を回避します。
- 結合キーには、文字列ではなく常に数値データを使用します。
- ログを保持する深さをできる限り減らします。 深い履歴が必要な場合は、集計の計算やカスタムログテーブルの処理を行うと、大きな履歴を保存できます。
テーブルのサイズ size-of-tables
テーブルサイズは、レコード数とレコードあたりの列数の組み合わせです。いずれも、クエリのパフォーマンスに影響を与える可能性があります。
- 小さいサイズ のテーブルは、配信テーブルに似ています。
- 中程度のサイズ のテーブルは、受信者テーブルと同じくらいのサイズです。顧客 1 人につき 1 件のレコードがあります。
- 大きいサイズ のテーブルは、広範ログテーブルに似ています。1 人の顧客につき多くのレコードがあります。
例えば、データベースに 1,000 万人の受信者が含まれている場合、広範ログテーブルには 1 億件から 2 億件くらいのメッセージが格納され、配信テーブルには数千件のレコードが格納されます。
PostgreSQL では、TOAST メカニズムを避けるために、行は 8KB を超えてはいけません。 したがって、システム(メモリと CPU)の最適なパフォーマンスを維持するために、列数と各行のサイズをできるだけ減らすようにしてください。
行数もパフォーマンスに影響します。Adobe Campaign データベースは運用データベースであり、ターゲティングやパーソナライゼーションにあまり使用しない履歴データを格納するようには設計されていません。
行数の増加に伴うパフォーマンス上の問題を防ぐには、必要なレコードのみをデータベースに保存します。その他のレコードは、サードパーティのデータウェアハウスにエクスポートし、Adobe Campaign 運用データベースから削除する必要があります。
テーブルサイズに関するベストプラクティスのいくつかを次に示します。
- フィールド数が少なく数値データが多い大きなテーブルを設計します。
- ブール値のような小さな数値を格納する場合は、大きな数値型の列(例:Int64)を使用しないでください。
- テーブル定義から未使用の列を削除します。
- 履歴データや非アクティブなデータはエクスポートして消去し、Adobe Campaign データベースには保持しません。
次に例を示します。
この例では、次のようになります。
- Transaction テーブルと Transaction Item テーブルは大きく、1,000 万を超えています。
- Product テーブルと Store テーブルが小さく、10,000 未満です。
- 製品ラベルと参照が Product テーブルに配置されました。
- Transaction Item テーブルには、数値の Product テーブルへのリンクのみが含まれます。