派生データセット

派生データセット機能は、データレイクで利用可能な他の情報から選択したデータセットを生成する便利な手段です。 これらのデータセットは、任意の定期的なサイクルで更新でき、オプションでリアルタイム顧客プロファイルデータに公開できます。 派生データセットは、最大値、数値、平均値など、単純なデータセットよりも、十分位数、パーセンタイル、四分位数など、複雑なデータセットを構築する必要に対応します。 これらのデータセットは、個々のユーザーまたはビジネスエンティティに対して特別に計算できます。 これにより、電子メールアドレス、デバイス ID、電話番号などの識別子に直接認定できるデータセットを取得し、そのユーザーやビジネスプロファイルに間接的に関連付けられたデータセットを取得できます。

データレイクでデータを分析する際、様々な使用例で派生データセットが必要です。 このデータをリアルタイム顧客プロファイルで使用するようにマークしたり、非常に焦点を絞ったオーディエンスを作成するなど、ダウンストリームの使用例で使用したりできます。 この機能の使用例としては、次のようなものが考えられます。

  • チャネル別の視聴数に基づく、購読者の最低 10%を識別する。 これにより、マーケターは、特定のオーディエンスをターゲティングし、新しい購読者パッケージを販売できます。
  • 旅行マイル数と「チラシ」ステータスを基に、チラシの上位 10%にいるオーディエンスを識別する。 このオーディエンスは、新しいクレジットカードオファーの販売を選択的にターゲット設定するために使用できます。
  • 購読に基づいてチャーンレートを決定します。
  • ある州または州の家計収入の上位 1%を特定し、過去「n」か月間にその集団から出て行く個人の数を測定します。

複雑な派生データセット

特定のディメンション(カテゴリ)に対して 1 つ以上の指標(売上高、閲覧者数の期間など)に基づいてランキングを作成するには、複雑な派生データセットが必要です。 デシル、四分位数、パーセンタイルを使用すると、派生データセットを使用してデータをランク付けする際の柔軟性と精度を実現できます。

十分位数とは、ランク付けされたデータのセットを 10 個の等しい部分に分割する方法です。 データがデシルに分割されると、デシルのランクがデータセット内の各行に割り当てられます。 これにより、データを降順または昇順に並べ替えることができます。

十分位数のランクでは、データを最低から最高の順に並べ、1~10 のスケールで行います。連続する各数は、10%ポイントの増加に対応します。

デシルグループは、ランク付けされたグループの数を表し、データセット内のディメンション(カテゴリ)にランキングを割り当てるために使用されます。 バケットには、各パーティションの正の整数値に評価される数値または式を指定できます。 バケットに null 値を含めることはできません。

四分位数は、分布を 4 で割り、百分位数は 100 で割るために使用されます。

分析派生データセット

クエリサービスは、セッション化やラストタッチなどの組み込み関数を提供します。この関数は、任意の時系列データに適用して、ビジネス関連の派生データセットを生成できます。 これらの分析派生データセットを 1 つ以上の ID に基づいてベース化するオプションと、必要に応じてリアルタイム顧客プロファイルにデータを公開するオプションがあります。

このタイプの派生属性の使用例として、次のようなものが考えられます。

  • 在庫切れのユーザーセッション中にスキャンされた製品を追跡します。
  • 閲覧または購入される製品のサイズ、色、製品カテゴリなど、人気の高い指標の追跡。
  • 製品の閲覧または購入につながったプラットフォームソースのトラッキング。
  • ID による最近参照された項目の追跡。
  • トラッキング指標(買い物かご内の品目の平均数、買い物かごの放棄、平均購入頻度など)。

その他の派生データセット

また、ビジネス指標を派生属性として計算し、郵便番号などの単純なデータセットや合計数などの集計指標と組み合わせて使用することもできます。 例えば、市区町村または都道府県に基づく合計数、またはビジネスカテゴリや市区町村/都道府県に基づく合計数です。

次の手順と使用例

このドキュメントでは、クエリサービスから派生したデータセットが、データのユーティリティを最大限に活用するための複雑な使用例をどのように促すかについて、より深く理解しています。 次に、 デシルベースの派生属性の使用例 実際のシナリオでこの機能がどのように適用されるかを確認するには、以下を実行します。

recommendation-more-help
ccf2b369-4031-483f-af63-a93b5ae5e3fb