派生属性機能を使用すると、データレイクで利用可能な他の情報から任意の属性を生成できます。 これらの属性は、任意の定期的な更新で更新でき、オプションでリアルタイム顧客プロファイルデータに公開できます。 派生属性は、最大、数、平均など、単純な属性に対して、十分位数、パーセンタイル、四分位数などの複雑な属性を作成する必要に対応します。 これらの属性は、個々のユーザーまたはビジネスエンティティに対して特別に計算できます。 これにより、電子メールアドレス、デバイス ID、電話番号など、識別子に直接認定できる属性を導き出し、そのユーザーまたはビジネスプロファイルに間接的に関連付けられた属性を導き出すことができます。
データレイクでデータを分析する際の様々な使用例に対して、派生属性が必要です。 このデータをリアルタイム顧客プロファイルで使用するようにマークしたり、非常に焦点を絞ったオーディエンスを作成するなど、ダウンストリームの使用例で使用したりできます。 この機能の使用例としては、次のようなものが考えられます。
特定のディメンション(カテゴリ)に対して、1 つ以上の指標(売上高、閲覧者数の期間など)に基づいてランキングを作成するには、複雑な派生属性が必要です。 デシル、四分位数、パーセンタイルを使用すると、派生属性を使用してデータをランク付けする際の柔軟性と精度を実現できます。
十分位数とは、ランク付けされたデータのセットを 10 個の等しい部分に分割する方法です。 データがデシルに分割されると、デシルのランクがデータセット内の各行に割り当てられます。 これにより、データを降順または昇順に並べ替えることができます。
十分位数のランクでは、データを最低から最高の順に並べ、1~10 のスケールで行います。連続する各数は、10%ポイントの増加に対応します。
デシルグループは、ランク付けされたグループの数を表し、データセット内のディメンション(カテゴリ)にランキングを割り当てるために使用されます。 バケットには、各パーティションの正の整数値に評価される数値または式を指定できます。 バケットに null 値を含めることはできません。
四分位数は、分布を 4 で割り、百分位数は 100 で割るために使用されます。
クエリサービスは、セッション化やラストタッチなどの組み込み関数を提供します。この関数は、任意の時系列データに適用して、ビジネス関連の派生属性を生成できます。 これらの分析派生属性を 1 つ以上の ID に基づいてベース化するオプションと、必要に応じてリアルタイム顧客プロファイルにデータを公開するオプションがあります。
このタイプの派生属性の使用例として、次のようなものが考えられます。
また、ビジネス指標を派生属性として計算し、郵便番号などの単純な属性や合計数などの集計された指標と組み合わせて使用することもできます。 例えば、市区町村または都道府県に基づく合計数、またはビジネスカテゴリや市区町村/都道府県に基づく合計数です。
このドキュメントでは、クエリサービスの派生属性が、データのユーティリティを最大限に活用するための複雑な使用例をどのように促進するかについて、より深く理解しています。 次に、 デシルベースの派生属性の使用例 実際のシナリオでこの機能がどのように適用されるかを確認するには、以下を実行します。