ディメンションのセットアップ

この節では、様々なタイプのDimensionと、DWBでの設定方法について説明します。

Dimension

最も基本的なレベルでは、ディメンションは、データセット内のデータを分類できるカテゴリです。

ベストプラクティス:Dimensionスキーマ内のデータは、任意の名前を指定できます。 このコースで使用および説明するDimension名は、ベストプラクティスと見なされます。 Dimensionの名前は、別の方法で指定できます。 他のデータセットに公開されると、データセットの違いがわかり始めます。 ディメンションの名前ではなく、ディメンションの目的を理解することが重要です。 例えば、「訪問者」、「顧客」、「人」、「消費者」、「ユーザー」と呼ばれる場合でも、特定の個人に関する情報を収集するために使用される最高レベルの可算ディメンションを参照するのに一般に使用される用語であることを理解することが重要です。

詳しくは、『データセット設定』ガイドを参照してください。

DWB内のDimensionのタイプ

ディメンションには、次の2つのタイプのData Workbenchがあります。拡張Dimensionと派生Dimension。

拡張Dimensionは、「生」データファイルのフィールドから作成されます。 拡張ディメンションは、「生」データの分類や、データ間の関係の指定に使用されます。 拡張ディメンションは、Data Workbenchアーキテクトによって作成されます。

派生Dimensionは、既存の拡張ディメンション定義を使用してデータセットを処理した後、「クライアント側」で」ユーザーが作成します。 例えば、既存のURIディメンションに基づいて、派生したPage Nameディメンションを作成する場合、特定のURIの代わりに、よりわかりやすいページ名が表示されます。 すべてのディメンションは、分類(グループ化)されてディメンションを形成したエレメントまたは項目で構成されます。 次に、3つの次元とその要素を示します。

多くの派生ディメンションは、異なるタイプの可視化を実現するために自動的に作成されます。例えば、ユーザーがサイトやプロセスマップを構築する際に、DWBサーバーはプレフィックスディメンションを作成します。 他にも、レポーティング時間ディメンションのように、プロファイルのディメンションディレクトリ内のファイルによって定義されるものもあります。

メモ

任意のディメンションに表示される要素は、データセットに読み込むように選択されたレコードに存在する値のみを反映します。 例えば、「5月12日」のデータがない場合、その月は「月」ディメンションに表示されません。

拡張ディメンション

拡張ディメンションのタイプ

(1)可算Dimension

最も高いレベルには可算ディメンションがあります。 可算ディメンションは、2つの主な機能を果たします。 最初に、要素をカウントするディメンションを指定します。 つまり、可算は次のような質問に答えます。

  • 「ホームページを訪問した訪問者の数は?」
  • 「google.comからの訪問回数は?」

このため、可算は、指標を作成する基本的な構成要素としてよく使用されます。

可算の2つ目の主な機能は、データセットスキーマ構造のバックボーンを形成する点です。 データスキーマとその他すべてのディメンションは、可算にグループ化され、属するように編成されます。 つまり、ディメンションを「カテゴリ」と見なす場合、可算とは、これらの「カテゴリ」をグループに編成する方法です。

ディメンションが可算ディメンションの下にグループ化される場合、それらは可算ディメンションの「レベル」にあると言えます。 例えば、「電子メールアドレス」が訪問者レベル、「ブラウザー」が訪問レベルに設定できます。 「親」と「子」は、可算とその下にグループ化されたディメンションとの関係を指します。 例えば、訪問者は電子メールアドレスの「親」です。 逆に、電子メールアドレスは訪問者の「子」です。

2)シンプルなDimension

最も一般的なディメンションは、シンプルディメンションです。 シンプルディメンションは、親の可算ディメンションと1対多の関係を持ち、ビジュアライゼーションで一般的に使用されるので、その要素を表示できます。 つまり、可算ディメンションは単純ディメンションに1つの値を持つことができますが、シンプルディメンションは1つ以上の可算に属することができます。 例えば、顧客の名前が「John」であるとします。その顧客は1つの名しか持つことができませんが、他の多くの顧客は「John;」という名前を持つことができます。 別の例として、1つのブラウザー(Firefoxなど)のみがWebサイトへの特定の訪問に使用できますが、そのブラウザーは様々な訪問に使用できます。

可算ディメンションが「数?」に応答する場合、単純ディメンションは「どれが該当するか」に応答します。 可算ディメンションセクションで使用されているのと同じ例を使用する。「ページ名」は、シンプルディメンションです。 テーブルとシンプルディメンションのページ名を使用して、次のような質問に答えることができます。

  • 「最もページビュー数の多いページはどれですか?」
  • 「買い物かごのページの中で、最も訪問回数の多いページはどれか。」

(3)多対多Dimension

多対多ディメンションは、親の可算ディメンションと多対多の関係を持ちます。 例えば、「外部検索語句」という名前のディメンションが訪問レベルの場合、特定の外部検索用語は1回または複数の訪問で使用でき、特定の訪問には1つまたは複数の外部検索用語が含まれる場合があります。 したがって、「外部検索用語」は多対多ディメンションになります。

4)数値Dimension

数値ディメンションは、数値を持つシンプルディメンションの一種です。 数値ディメンションは、多くの場合、指標で使用するために作成されます。 数値ディメンションの例としては、「売上高」、「注文件数」、「数量」があります。 上の例では、「顧客の注文件数」は数値ディメンションです。
5)非正規ディメ ンション非正規ディメンションは、親の可算ディメンションと1対1の関係を持つディメンションです。非正規ディメンションは、多くの場合、識別データなどの基数(多くの一意の要素)が大きいディメンションで使用されます。 例えば、1人の訪問者が持つことのできるユーザーIDは1つだけ、1つのユーザーIDは1つの訪問者にのみ属することができます。 したがって、これは1対1の関係で、非正規ディメンションにすることができます。

例えば、GeometrixxWebユーザーIDは、顧客レベルの非正規ディメンションです。 非正規なので、親ディメンションとの間に1対1の関係があります。つまり、各WebユーザーIDには1つの顧客があり、各顧客には1つのWebユーザーIDしかありません。 したがって、「お客様」指標は、GeometrixxWebユーザーIDの各要素に対して「1」のみになります。

6)時間Dimension

時間ディメンションを使用すると、指定したタイムスタンプフィールドに基づいて、定期的または絶対的なローカル時間ディメンションのセットを作成できます。 時間ディメンションの例としては、「日」、「時間」、「週」、「時間帯」があります。 上の例の「時間帯」表は、その日の別の時間に受け取った訪問数とページビュー数を示します。

メモ

表示書式に使用する%エスケープは、標準のCライブラリ​strftime​と同じです。

拡張ディメンションの定義

拡張Dimensionの定義手順:

  1. データセットプロファイル内でプロファイルマネージャーを開き、Dataset をクリックしてその内容を表示します。

  2. 拡張ディメンションの定義先となる Transformation.cfg ファイルまたは変換データセットインクルードファイルを開きます。

  3. Transformationsを右クリックし、 Add new > <Extended dimension type>をクリックします。

  4. 拡張ディメンションに必要な情報を入力します。変換のタイプとそのパラメーターに関する情報については、次の節を参照してください。

  5. 独自に定義した拡張ディメンションには、そのディメンションに関する詳しい情報や使用上の注意点をコメント行として Comments パラメーターに追加することができます。コメントを追加するには、コメント​ラベルを右クリックし、新規追加/コメント行*をクリックします。

  6. 設定ファイルで拡張ディメンションを定義したら、そのファイルをローカルに保存し、DWBサーバー上のデータセットプロファイルに保存します。

拡張ディメンションの非表示

拡張Dimensionは、DWBの[Dimension]メニューに表示されないように、非表示にできます。 ディメンションを非表示にするには、ディメンション定義でHiddenプロパティを「True」に設定します。

このページ