変換設定ファイルの編集

データセットプロファイルの Transformation.cfg ファイルを編集する手順について説明します。

  1. データセットプロファイル内でProfile Managerを開き、 Dataset​をクリックして内容を表示します。

    Profile Managerを開いて使用する方法については、『Data Workbenchユーザーガイド』を参照してください。

    メモ

    Datasetディレクトリには、 Transformationサブディレクトリが存在する場合があります。 このサブディレクトリには、継承された1つ以上のプロファイルに対して作成されたTransformation Dataset Includeファイルが格納されます。 Transformation Dataset Includeファイルについて詳しくは、データセットインクルードファイルを参照してください。

  2. Transformation.cfgの横のチェックマークを右クリックし、Make Local​をクリックします。 このファイル用のチェックマークが User 列に表示されます。

  3. 新しく作成されたチェックマークを右クリックし、Open / in Workstation​をクリックします。 Transformation.cfgウィンドウが表示されます。

    Transformation Dependency MapからTransformation.cfgファイルを開くこともできます。 transformation dependency mapsについて詳しくは、データセット設定ツールを参照してください。

  4. 次の表を参考にして、設定ファイルのパラメーターを編集します。

    Data Workbench ウィンドウ内で Transformation.cfg ファイルを編集するときは、基本的な編集機能にショートカットキーを使用できます。切り取り(Ctrl + X)、コピー(Ctrl + C)、貼り付け(Ctrl + V)、取り消し(Ctrl + Z)、やり直し(Ctrl + Shift + Z)、セクション選択(クリックしながらドラッグ)、すべて選択(Ctrl + A)などの操作が可能です。また、設定ファイル(.cfg)間でテキストをコピーして貼り付ける際にも、ショートカットを使用できます。

    メモ

    継承されたプロファイルのTransformation Dataset Includeファイルには、次の表で説明するパラメーターのサブセットと、追加のパラメーターが含まれています。 Transformation Dataset Includeファイルについて詳しくは、データセットインクルードファイルを参照してください。

    パラメーター 説明
    End Time

    (オプション)データのフィルター。タイムスタンプがこの時刻より前(この時刻は含まず)のログエントリを抽出します。この時刻には、次のいずれかの形式を使用することをお勧めします。

    • January 1 2013 HH:MM:SS EDT
    • Jan 1 2013 HH:MM:SS GMT

    例えば、「July 29 2013 00:00:00 EDT」を End Time として指定した場合、米国東部夏時間の 2013 年 7 月 28 日 11:59:59 PM までのデータが対象となります。

    タイムゾーンの指定は必須です。タイムゾーンを指定しなかった場合に、デフォルトで GMT に設定されることはありません。Data Workbench サーバーでサポートされるタイムゾーンの略称一覧については、 タイムゾーンのコード .

    注意:End Time の値を指定した場合、End Time という名前のパラメーターが設定され、データセット構築の変換段階全体で適用されます。パラメーターについて詳しくは、 データセットインクルードファイルでのパラメーターの定義を参照してください。

    拡張ディメンション (オプション)拡張ディメンションは、変換データセットインクルードファイルに定義することをお勧めします。詳しくは、 変換データセットインクルードファイルを参照してください。
    Hash Threshold

    (オプション)より小さな標本(データセットの行)をランダムに抽出するためのサンプリング係数。数値 n に設定した場合、n 件の追跡 ID につき 1 件のみがデータセットに組み入れられ、データセットの合計行数を 1/n に減らすことができます。100%の精度が必要なデータセットを作成する(つまりすべての行を対象とする)には、Hash Threshold を 1 に設定します。

    Log Processing.cfg ファイルと Transformation.cfg ファイルの両方に Hash Threshold を指定した場合、それぞれの値が順に適用されるのではなく、いずれか大きい方の値だけが適用されます。

    Log Entry Condition (オプション)ログ処理から出力されたログエントリをデータセットプロファイルに含めるかどうかの判断基準となるルールを定義します。詳しくは、 ログ記録条件 .
    新規訪問者条件 (オプション)Web データ用。データに訪問者を含めるかどうかの判断基準となるルールを定義します。New Visitor Condition は、特定の訪問者の(時系列順に並んだ)ログのうち、データセットに使用する最初のエントリを定義します。それ以降、この条件を満たしているかどうかに関係なく、同じ訪問者のすべてのログエントリがデータセットに組み入れられます。詳しくは、 新規訪問者条件 .
    Reprocess

    (オプション)ここには任意の文字またはその組み合わせを入力できます。このパラメーターに変更を加えてファイルを保存すると、データの再変換が開始されます。

    データの再処理について詳しくは、 再処理と再変換 .

    Schema Checking true または false。true の場合、データセットの破損の問題を Data Workbench サーバーが特定し、その Trace ディレクトリ内のログファイルに問題に関する情報を記録します。デフォルト値は true です。このパラメーターは常に true にしておくことをお勧めします。
    Stages

    (オプション)変換データセットインクルードファイルで使用できる処理ステージの名前。処理ステージにより、変換データセットインクルードファイル内に定義された変換の順序付けを行うことができます。複数の変換データセットインクルードファイルに変換を定義してあるとき、変換の決まったポイントで特定の変換を実行したい場合に、このパラメーターが非常に役立ちます。

    変換データセットインクルードファイル内の各変換が、変換の過程でどのような順序で実行されるかは、ここにリストしたステージの順序によって決まります。PreprocessingPostprocessing はビルトインのステージです。Preprocessing は常に最初のステージに、Postprocessing は常に最後のステージになります。デフォルトでは、Default という名前のステージが 1 つ存在します。

    新しい処理ステージを追加するには

    • Transformation.cfg ウィンドウで Stages を右クリックし、新規追加Stage をクリックします。
    • 新しいステージの名前を入力します。

    既存の処理ステージを削除するには

    • 削除するステージに対応する番号を右クリックし、「<#stage_number> を削除」をクリックします。

    注意:変換データセットインクルードファイルで Stage を指定するときは、ここに入力したステージの名前と完全に一致させる必要があります。データセットインクルードファイルについて詳しくは、 データセットインクルードファイルを参照してください。

    Start Time

    (オプション)データのフィルター。タイムスタンプがこの時刻以後(この時刻を含む)のログエントリを抽出します。この時刻には、次のいずれかの形式を使用することをお勧めします。

    • 2013年1月1日HH:MM:SS EDT
    • 2013年1月1日HH:MM:SS GMT

    例えば、July 29 2013 00:00:00 EDT を Start Time として指定した場合、米国東部夏時間の 2013 年 7 月 29 日 12:00:00 AM 以降のデータが対象となります。

    タイムゾーンの指定は必須です。タイムゾーンを指定しなかった場合に、デフォルトで GMT に設定されることはありません。Data Workbench サーバーでサポートされるタイムゾーンの略称一覧については、 タイムゾーンのコード .

    注意:Start Time の値を指定した場合、Start Time という名前のパラメーターが設定され、データセット構築の変換段階全体で適用されます。パラメーターについて詳しくは、 データセットインクルードファイルでのパラメーターの定義を参照してください。

    Transformations (オプション)データセット構築の変換段階における変換は、変換データセットインクルードファイルに定義することをお勧めします。詳しくは、 変換データセットインクルードファイルを参照してください。
    タイムゾーン

    データセットプロファイルのタイムゾーン。タイムゾーンは、時刻の変換や時間ディメンションの作成に使用されます。詳しくは、 タイムゾーン .

    注意:Log Processing.cfg ファイルで定義した Time Zone パラメーターは、時刻の変換にのみ使用されます。

  5. ウィンドウ上部の​(modified)​を右クリックし、「Save」をクリックします。

  6. Profile Managerで、User列のTransformation.cfgのチェックマークを右クリックし、Save to / * dataset profile name​をクリックして、ローカルに適用した変更を有効にします。 データセットプロファイルの同期後、データの再変換が開始されます。

    メモ

    アドビから提供される内部プロファイルには、変更した設定ファイルを一切保存しないでください。内部プロファイルに対するアップデートをインストールするときに変更内容が上書きされます。

    データの再処理または再変換について詳しくは、再処理と再変換を参照してください。

このページ