ログ処理設定ファイルの編集

データセットプロファイルの Log Processing.cfg ファイルを編集するための手順について説明します。

  1. データセットプロファイル内でProfile Managerを開き、 Dataset​をクリックして内容を表示します。

    Profile Managerを開いて使用する方法については、『Data Workbenchユーザーガイド』を参照してください。

    メモ

    Datasetディレクトリには、ログ処理サブディレクトリが存在する場合があります。 このサブディレクトリには、継承された1つ以上のプロファイルに対して作成されたLog Processing Dataset Includeファイルが格納されます。 データセットインクルードファイルを参照してください。

  2. Log Processing.cfgの横のチェックマークを右クリックし、Make Local​をクリックします。 このファイル用のチェックマークが User 列に表示されます。

  3. 新しく作成されたチェックマークを右クリックし、Open / in Workstation​をクリックします。 Log Processing.cfgウィンドウが表示されます。

    Transformation Dependency MapからLog Processing.cfgファイルを開くこともできます。 変換依存関係マップについて詳しくは、データセット設定ツールを参照してください。

  4. 次の表を参考にして、設定ファイルのパラメーターを編集します。

    Data Workbench ウィンドウ内で Log Processing.cfg ファイルを編集するときは、基本的な編集機能にショートカットキーを使用できます。切り取り(Ctrl + X)、コピー(Ctrl + C)、貼り付け(Ctrl + V)、取り消し(Ctrl + Z)、やり直し(Ctrl + Shift + Z)、セクション選択(クリックしながらドラッグ)、すべて選択(Ctrl + A)などの操作が可能です。また、設定ファイル(.cfg)間でテキストをコピーして貼り付ける際にも、ショートカットを使用できます。

    メモ

    継承されたプロファイルのLog Processing Dataset Includeファイルには、次の表で説明するパラメーターのサブセットと、追加のパラメーターが含まれています。 データセットインクルードファイルを参照してください。

    パラメーター 説明
    ログソース データのソース。ログソースを参照してください。
    End Time

    (オプション)データのフィルター。タイムスタンプがこの時刻より前(この時刻は含まず)のログエントリを抽出します。この時刻には、次のいずれかの形式を使用することをお勧めします。

    • January 1 2013 HH:MM:SS EDT
    • Jan 1 2013 HH:MM:SS GMT

    例えば、July 29 2013 00:00:00 EDT を End Time として指定した場合、米国東部夏時間の 2013 年 7 月 28 日 11:59:59 PM までのデータが対象となります。詳しくは、データフィルターを参照してください。

    タイムゾーンの指定は必須です。タイムゾーンを指定しなかった場合に、デフォルトで GMT に設定されることはありません。Data Workbench サーバーでサポートされるタイムゾーンの略称一覧については、 タイムゾーンのコード .

    注意:Sensor、ログファイル、XML ソースのパラメーターである Use Start/End Times は、このパラメーターと連動します。 Log Sources の各節で、これらのソースタイプについて説明しています。

    Fields (オプション)Fields は、ログ処理データセットインクルードファイルに定義することをお勧めします。ログ処理データセットインクルードファイルを参照してください。
    Group Maximum Key Bytes

    サーバーが 1 つの追跡 ID で処理できるイベントデータの最大量。この制限を超えるデータは、データセット構築プロセスから除外されます。キー分割が有効である場合は 2e6 に、そうでない場合は 1e6 に設定する必要があります。詳しくは、キー分割を参照してください。

    注意:変更が必要な場合は必ずアドビまでご相談ください。

    Hash Threshold

    (オプション)より小さな標本(データセットの行)をランダムに抽出するためのサンプリング係数。数値 n に設定した場合、n 件の追跡 ID につき 1 件のみがデータセットを入力するので、データセットの合計行数を 1/n に減らすことができます。

    100%の精度を必要とするデータセットを作成するには(つまり、すべての行を含めるには)、Hash Threshold を 1 に設定します。

    values:

    Hash Threshold = 1(すべての行を含む 100%のデータ。)

    Hash Threshold = 2(1/2 のデータで、半分の行を含みます。)

    Hash Threshold = 3 (1/3 のデータで、3 行に 1 行を含みますが、クエリー完了で 34%に四捨五入します。)

    Hash Threshold = 4 (1/4 のデータで、4 行に 1 行を含みます。)

    注意:Hash Threshold = 8 を使用すると、1/8 のデータ(つまり、12.5%)になります。ただし、この値について、四捨五入したクエリー完了の値は 13%になります。同様の例として、Hash Threshold = 6 は 17%のクエリー解決になります。Hash Threshold = 13 は 8%のクエリー解決になります。

    Log Processing.cfg ファイルと Transformation.cfg ファイルの両方に Hash Threshold を指定した場合、それぞれの値が順に適用されるのではなく、いずれか大きい方の値だけが適用されます。データフィルターを参照してください。

    Log Entry Condition (オプション)データセットにログエントリを含めるかどうかの判断基準となるルールを定義します。詳しくは、 ログ記録条件 .
    Reprocess

    (オプション)ここには任意の文字またはその組み合わせを入力できます。このパラメーターに変更を加えて Data Workbench サーバーコンピューターにファイルを保存すると、データの再処理が開始されます。

    詳しくは、 再処理と再変換 .

    Split Key Bucket Space

    キーの分割に関係するパラメーター。キー分割が有効である場合、この値を 6e6 に設定する必要があります。詳しくは、キー分割を参照してください。

    注意:変更が必要な場合は必ずアドビまでご相談ください。

    Split Key Bytes

    キーの分割に関係するパラメーター。キー分割が有効である場合は 1e6 に、そうでない場合は 0 に設定する必要があります。詳しくは、キー分割を参照してください。

    注意:変更が必要な場合は必ずアドビまでご相談ください。

    Split Key Space Ratio

    キーの分割に関係するパラメーター。キー分割が有効である場合、この値を 10 に設定する必要があります。詳しくは、キー分割を参照してください。

    注意:変更が必要な場合は必ずアドビまでご相談ください。

    Stages

    (オプション)ログ処理データセットインクルードファイルで使用できる処理ステージの名前処理ステージにより、ログ処理データセットインクルードファイル内に定義された変換の順序付けを行うことができます。複数のログ処理データセットインクルードファイルに変換を定義してあるとき、ログ処理の決まったポイントで特定の変換を実行したい場合に、このパラメーターが非常に役立ちます。

    ログ処理データセットインクルードファイル内の各変換が、ログ処理の過程でどのような順序で実行されるかは、ここにリストしたステージの順序によって決まります。Preprocessing と Postprocessing は、ビルトインのステージです。Preprocessing は常に最初のステージに、Postprocessing は常に最後のステージになります。デフォルトでは、Default という名前のステージが 1 つ存在します。

    新しい処理ステージを追加するには

    • Log Processing.cfg ウィンドウで Stages を右クリックし、新規追加Stage をクリックします。
    • 新しいステージの名前を入力します。

    既存の処理ステージを削除するには

    • 削除するステージに対応する番号を右クリックし、「<#stage_number> を削除」をクリックします。

    注意:ログ処理データセットインクルードファイルで Stage を指定するときは、ここに入力したステージの名前と完全に一致させる必要があります。データセットインクルードファイルを参照してください。

    Start Time

    (オプション)データのフィルター。タイムスタンプがこの時刻以後(この時刻を含む)のログエントリを抽出します。この時刻には、次のいずれかの形式を使用することをお勧めします。

    • 2013年1月1日HH:MM:SS EDT
    • 2013年1月1日HH:MM:SS GMT

    例えば、「July 29 2013 00:00:00 EDT」を Start Time として指定した場合、米国東部夏時間の 2013 年 7 月 29 日 12:00:00 AM 以降のデータが対象となります。詳しくは、データフィルターを参照してください。

    タイムゾーンの指定は必須です。タイムゾーンを指定しなかった場合に、デフォルトで GMT に設定されることはありません。Data Workbench サーバーでサポートされるタイムゾーンの略称一覧については、 タイムゾーンのコード .

    注意:Sensor、ログファイル、XML ソースのパラメーターである Use Start/End Times は、このパラメーターと連動します。 Log Sources の各節で、これらのソースタイプについて説明しています。

    タイムゾーン

    (オプション)ログ処理時の時間の変換(x-local-timestringフィールドで表される変換など)に使用されるData Workbenchサーバーのタイムゾーン。

    注意:データセット構築のログ処理段階で、変換済みの時刻フィールドにアクセスしたい場合、Time Zone を指定する必要があります。指定しないと、Data Workbench サーバーによってイベントログにエラーが記録されます。

    詳しくは、 タイムゾーン .

    Transformations (オプション)ログ処理における変換は、ログ処理データセットインクルードファイルに定義することをお勧めします。ログ処理データセットインクルードファイルを参照してください。
  5. ウィンドウ上部の​(modified)​を右クリックし、「Save」をクリックします。

  6. Profile Managerで、User列のLog Processing.cfgのチェックマークを右クリックし、Save to / <dataset profile name​をクリックして、ローカルに適用した変更を有効にします。 データセットプロファイルの同期後、データの再処理が開始されます。

    メモ

    アドビから提供される内部プロファイルには、変更した設定ファイルを一切保存しないでください。内部プロファイルに対するアップデートをインストールするときに変更内容が上書きされます。

    データの再処理について詳しくは、再処理と再変換を参照してください。

このページ