ログ処理設定ファイルの編集

重要

Data Workbench 提供終了のお知らせ.

データセットプロファイルの Log Processing.cfg ファイルを編集するための手順について説明します。

  1. データセットプロファイル内で、 Profile Manager をクリックし、 Dataset 内容を表示する。

    を開き、使用する方法については、 Profile Managerを参照し、 Data Workbenchユーザーガイド.

    メモ

    Dataset ディレクトリには、ログ処理サブディレクトリが存在する場合があります。 このサブディレクトリには、 Log Processing Dataset Include 継承された 1 つ以上のプロファイルに対して作成されたファイル。 詳しくは、 データセットインクルードファイル.

  2. の横のチェックマークを右クリックします。 Log Processing.cfg をクリックし、 Make Local. このファイル用のチェックマークが User 列に表示されます。

  3. 新しく作成されたチェックマークを右クリックし、 Open > in Workstation. この Log Processing.cfg ウィンドウが表示されます。

    また、 Log Processing.cfg ファイル Transformation Dependency Map. 変換依存関係マップについて詳しくは、 データセット設定ツール.

  4. 次の表を参考にして、設定ファイルのパラメーターを編集します。

    Data Workbench ウィンドウ内で Log Processing.cfg ファイルを編集するときは、基本的な編集機能にショートカットキーを使用できます。切り取り(Ctrl + X)、コピー(Ctrl + C)、貼り付け(Ctrl + V)、取り消し(Ctrl + Z)、やり直し(Ctrl + Shift + Z)、セクション選択(クリックしながらドラッグ)、すべて選択(Ctrl + A)などの操作が可能です。また、ショートカットを使用して、1 つの設定ファイル ( .cfg) を別のに置き換えます。

    メモ

    A Log Processing Dataset Include 継承プロファイルのファイルには、次の表で説明するパラメーターのサブセットと、追加のパラメーターが含まれています。 詳しくは、 データセットインクルードファイル.

    パラメーター 説明
    ログソース データのソース。詳しくは、 ログソース .
    End Time

    (オプション)。データのフィルター。タイムスタンプがこの時刻より前(この時刻は含まず)のログエントリを抽出します。この時刻には、次のいずれかの形式を使用することをお勧めします。

    • 2013 年 1 月 1 日 HH:MM:SS EDT
    • 2013 年 1 月 1 日 HH:MM:SS GMT

    例えば、July 29 2013 00 を指定します。:00:[00 EDT as the End Time] には、2013 年 7 月 28 日 (11) までのデータが含まれます。:59:米国東部標準時の午後 59 時。 詳しくは、 データフィルター .

    タイムゾーンの指定は必須です。タイムゾーンを指定しなかった場合に、デフォルトで GMT に設定されることはありません。Data Workbench サーバーでサポートされるタイムゾーンの略称一覧については、 タイムゾーンのコード .

    注意:Sensor、ログファイル、XML ソースのパラメーターである Use Start/End Times は、このパラメーターと連動します。詳しくは、 ログソース これらのソースタイプについて説明します。

    Fields (オプション)。Fields は、ログ処理データセットインクルードファイルに定義することをお勧めします。詳しくは、 ログ処理データセットインクルードファイル .
    Group Maximum Key Bytes

    サーバーが 1 つの追跡 ID で処理できるイベントデータの最大量。この制限を超えるデータは、データセット構築プロセスから除外されます。キー分割が有効である場合は 2e6 に、そうでない場合は 1e6 に設定する必要があります。詳しくは、キー分割を参照してください。

    注意:変更が必要な場合は必ずアドビまでご相談ください。

    Hash Threshold

    (オプション)。より小さな標本(データセットの行)をランダムに抽出するためのサンプリング係数。数値 n に設定した場合、n 件の追跡 ID につき 1 件のみがデータセットを入力するので、データセットの合計行数を 1/n に減らすことができます。

    100%の精度を必要とするデータセットを作成するには(つまり、すべての行を含めるには)、Hash Threshold を 1 に設定します。

    values:

    Hash Threshold = 1(すべての行を含む 100%のデータ。)

    Hash Threshold = 2(1/2 のデータで、半分の行を含みます。)

    Hash Threshold = 3 (1/3 のデータで、3 行に 1 行を含みますが、クエリー完了で 34%に四捨五入します。)

    Hash Threshold = 4 (1/4 のデータで、4 行に 1 行を含みます。)

    注意:Hash Threshold = 8 を使用すると、1/8 のデータ(つまり、12.5%)になります。ただし、この値について、四捨五入したクエリー完了の値は 13%になります。同様の例として、Hash Threshold = 6 は 17%のクエリー解決になります。Hash Threshold = 13 は 8%のクエリー解決になります。

    Log Processing.cfg ファイルと Transformation.cfg ファイルの両方に Hash Threshold を指定した場合、それぞれの値が順に適用されるのではなく、いずれか大きい方の値だけが適用されます。詳しくは、 データフィルター .

    Log Entry Condition (オプション)。データセットにログエントリを含めるかどうかの判断基準となるルールを定義します。詳しくは、 ログ記録条件 .
    Reprocess

    (オプション)。ここには任意の文字またはその組み合わせを入力できます。このパラメーターに変更を加えて Data Workbench サーバーコンピューターにファイルを保存すると、データの再処理が開始されます。

    詳しくは、 再処理と再変換 .

    Split Key Bucket Space

    キーの分割に関係するパラメーター。キー分割が有効である場合、この値を 6e6 に設定する必要があります。詳しくは、キー分割を参照してください。

    注意:変更が必要な場合は必ずアドビまでご相談ください。

    Split Key Bytes

    キーの分割に関係するパラメーター。キー分割が有効である場合は 1e6 に、そうでない場合は 0 に設定する必要があります。詳しくは、キー分割を参照してください。

    注意:変更が必要な場合は必ずアドビまでご相談ください。

    Split Key Space Ratio

    キーの分割に関係するパラメーター。キー分割が有効である場合、この値を 10 に設定する必要があります。詳しくは、キー分割を参照してください。

    注意:変更が必要な場合は必ずアドビまでご相談ください。

    Stages

    (オプション)。ログ処理データセットインクルードファイルで使用できる処理ステージの名前処理ステージにより、ログ処理データセットインクルードファイル内に定義された変換の順序付けを行うことができます。複数のログ処理データセットインクルードファイルに変換を定義してあるとき、ログ処理の決まったポイントで特定の変換を実行したい場合に、このパラメーターが非常に役立ちます。

    ログ処理データセットインクルードファイル内の各変換が、ログ処理の過程でどのような順序で実行されるかは、ここにリストしたステージの順序によって決まります。Preprocessing と Postprocessing は、ビルトインのステージです。Preprocessing は常に最初のステージに、Postprocessing は常に最後のステージになります。デフォルトでは、Default という名前のステージが 1 つ存在します。

    新しい処理ステージを追加するには

    • Log Processing.cfg ウィンドウで Stages を右クリックし、新規追加Stage をクリックします。
    • 新しいステージの名前を入力します。

    既存の処理ステージを削除するには

    • 削除するステージに対応する番号を右クリックし、「<#stage_number> を削除」をクリックします。

    注意:ログ処理データセットインクルードファイルで Stage を指定するときは、ここに入力したステージの名前と完全に一致させる必要があります。詳しくは、 データセットインクルードファイル .

    Start Time

    (オプション)。データのフィルター。タイムスタンプがこの時刻以後(この時刻を含む)のログエントリを抽出します。この時刻には、次のいずれかの形式を使用することをお勧めします。

    • 2013 年 1 月 1 日 HH:MM:SS EDT
    • 2013 年 1 月 1 日 HH:MM:SS GMT

    例えば、「July 29 2013 00」:00:「00 EDT」を開始時刻として含むデータは、2013 年 7 月 29 日 (12) から:00:午前 00 時。 詳しくは、 データフィルター .

    タイムゾーンの指定は必須です。タイムゾーンを指定しなかった場合に、デフォルトで GMT に設定されることはありません。Data Workbench サーバーでサポートされるタイムゾーンの略称一覧については、 タイムゾーンのコード .

    注意:Sensor、ログファイル、XML ソースのパラメーターである Use Start/End Times は、このパラメーターと連動します。詳しくは、 ログソース これらのソースタイプについて説明します。

    タイムゾーン

    (オプション)。ログ処理時に時間の変換(x-local-timestring フィールドで表される変換など)に使用される Data Workbench サーバーのタイムゾーン。

    注意:データセット構築のログ処理段階で、変換済みの時刻フィールドにアクセスしたい場合、Time Zone を指定する必要があります。指定しないと、Data Workbench サーバーによってイベントログにエラーが記録されます。

    詳しくは、 タイムゾーン .

    Transformations (オプション)。ログ処理における変換は、ログ処理データセットインクルードファイルに定義することをお勧めします。詳しくは、 ログ処理データセットインクルードファイル .
  5. 右クリック (modified) ウィンドウの上部にあるをクリックし、 Save.

  6. 内 Profile Manager、次のチェックマークを右クリック: Log Processing.cfg内 User 列、「 Save to > <dataset profile name> ローカルで行った変更を有効にする データセットプロファイルの同期後、データの再処理が開始されます。

    メモ

    アドビから提供される内部プロファイルには、変更した設定ファイルを一切保存しないでください。内部プロファイルに対するアップデートをインストールするときに変更内容が上書きされます。

    データの再処理について詳しくは、 再処理と再変換.

このページ