派生データセット
派生データセット機能は、データレイクで使用可能な他の情報から選択したデータセットを生成する便利な手段を提供します。 これらのデータセットは、任意の定期的な頻度で更新でき、オプションでリアルタイム顧客プロファイルデータに公開できます。 派生データセットは、最大、カウント、平均などのより単純なデータセットよりも、十分位数、パーセンタイル、四分位数などの複雑なデータセットを作成する必要性に対応します。 これらのデータセットは、個々のユーザーまたはビジネスエンティティに対して特別に計算できます。 これにより、メールアドレス、デバイス ID、電話番号などの識別子に直接認定できるデータセットや、そのユーザーまたはビジネスプロファイルに間接的に関連付けられているデータセットを取得できます。
派生データセットは、データレイク上でデータを分析する様々なユースケースで必要です。 その後、このデータはリアルタイム顧客プロファイルで使用するようにマークされ、高度にフォーカスされたオーディエンスの作成など、ダウンストリームのユースケースで使用できます。 この機能の使用例として、次のものが考えられます。
- チャネル別の視聴者数に基づいて購読者の最も低い 10% を特定します。 これにより、マーケターは特定のオーディエンスをターゲットにし、新しい購読者パッケージを販売できます。
- 移動した合計マイルと「チラシ」ステータスに基づいて、チラシの上位 10% に入っているオーディエンスを特定します。 このオーディエンスを使用すれば、新しいクレジットカードオファーの販売を選択的にターゲットにすることができます。
- サブスクリプションに基づいてチャーンレートを決定します。
- 州または都道府県の世帯収入の上位 1% を特定し、過去「n」か月間にその集団グループから移動した個人の数の測定値を提供します。
複雑な派生データセット
特定のディメンション(カテゴリ)の 1 つ以上の指標(売上高、視聴者期間など)に基づいてランキングを作成するには、複雑な派生データセットが必要です。 デシル、四分位数およびパーセンタイルでは、派生データセットを使用してデータをランキングする際に、柔軟性と精度を確保できます。
デシルは、ランク付けされたデータのセットを 10 個の等しい部分に分割する方法です。 データをデシルに分割すると、データセット内の各行にデシルランクが割り当てられます。 これにより、データを降順または昇順に並べ替えることができます。
デシルランクは、データを最小から最大の順序で配置し、1 ~ 10 のスケールで行われます。このスケールでは、連続する各数値は 10 パーセントポイントの増加に対応します。
デシルバケットは、ランク付けされたグループの数を表し、データセット内のディメンション(カテゴリ)にランキングを割り当てるために使用されます。 バケットは、各パーティションの正の整数値に評価される数値または式にすることができます。 バケットに null 値を指定しないでください。
四分位数は分布を 4 で、パーセンタイルを 100 で割るために使用されます。
分析派生データセット
クエリサービスには、セッション化、ラストタッチなどの組み込み機能が用意されており、任意の時系列データに適用して、ビジネス関連の派生データセットを生成できます。 これらの分析派生データセットは、1 つ以上の ID に基づいて作成でき、必要に応じて、オプションでリアルタイム顧客プロファイルに公開することもできます。
このタイプの派生属性の使用例として、次のものが考えられます。
- 在庫切れのユーザーセッション中にスキャンされた製品のトラッキング。
- 閲覧または購入された製品のサイズ、色、製品カテゴリなどの一般的な指標をトラッキングします。
- 製品の参照または購入につながったプラットフォームソースをトラッキングします。
- ID によって最近参照された項目を追跡します。
- トラッキング指標(買い物かごの平均項目数、買い物かごの放棄、平均購入頻度など)。
その他の派生データセット
また、ビジネス指標を派生属性として計算し、郵便番号などの単純なデータセットや、合計数などの集計指標と組み合わせて使用することもできます。 例えば、市区町村または都道府県に基づいた合計数、またはビジネスカテゴリと市区町村または都道府県に基づいた合計数です。
次の手順とユースケース
このドキュメントでは、クエリサービスから派生したデータセットが、データのユーティリティを最大限に活用するための複雑なユースケースをどのように促進するかについて、より深く理解しました。 次に、 デシルベースの派生属性のユースケースを参照して、実際のシナリオでこの機能がどのように適用されるかを確認してください。