ログ処理設定ファイルの編集

最終更新日: 2022-10-05
  • 作成対象:
  • User
    Admin
重要

Data Workbench 提供終了のお知らせ.

データセットプロファイルの Log Processing.cfg ファイルを編集するための手順について説明します。

  1. データセットプロファイル内で、 Profile Manager をクリックし、 Dataset 内容を表示する。

    を開き、使用する方法については、 Profile Managerを参照し、 Data Workbenchユーザーガイド.

    メモ

    Dataset ディレクトリには、ログ処理サブディレクトリが存在する場合があります。 このサブディレクトリには、 Log Processing Dataset Include 継承された 1 つ以上のプロファイルに対して作成されたファイル。 詳しくは、 データセットインクルードファイル.

  2. の横のチェックマークを右クリックします。 Log Processing.cfg をクリックし、 Make Local. このファイル用のチェックマークが User 列に表示されます。

  3. 新しく作成されたチェックマークを右クリックし、 Open > in Workstation. この Log Processing.cfg ウィンドウが表示されます。

    また、 Log Processing.cfg ファイル Transformation Dependency Map. 変換依存関係マップについて詳しくは、 データセット設定ツール.

  4. 次の表を参考にして、設定ファイルのパラメーターを編集します。

    Data Workbench ウィンドウ内で Log Processing.cfg ファイルを編集するときは、基本的な編集機能にショートカットキーを使用できます。切り取り(Ctrl + X)、コピー(Ctrl + C)、貼り付け(Ctrl + V)、取り消し(Ctrl + Z)、やり直し(Ctrl + Shift + Z)、セクション選択(クリックしながらドラッグ)、すべて選択(Ctrl + A)などの操作が可能です。また、ショートカットを使用して、1 つの設定ファイル ( .cfg) を別のに置き換えます。

    メモ

    A Log Processing Dataset Include 継承プロファイルのファイルには、次の表で説明するパラメーターのサブセットと、追加のパラメーターが含まれています。 詳しくは、 データセットインクルードファイル.

    パラメーター 説明
    ログソース データのソース。詳しくは、 ログソース .
    End Time

    (オプション)。データのフィルター。タイムスタンプがこの時刻より前(この時刻は含まず)のログエントリを抽出します。この時刻には、次のいずれかの形式を使用することをお勧めします。

    • 2013 年 1 月 1 日 HH:MM:SS EDT
    • 2013 年 1 月 1 日 HH:MM:SS GMT

    例えば、July 29 2013 00 を指定します。:00:[00 EDT as the End Time] には、2013 年 7 月 28 日 (11) までのデータが含まれます。:59:米国東部標準時の午後 59 時。 詳しくは、 データフィルター .

    タイムゾーンの指定は必須です。タイムゾーンを指定しなかった場合に、デフォルトで GMT に設定されることはありません。Data Workbench サーバーでサポートされるタイムゾーンの略称一覧については、 タイムゾーンのコード .

    注意:Sensor、ログファイル、XML ソースのパラメーターである Use Start/End Times は、このパラメーターと連動します。詳しくは、 ログソース これらのソースタイプについて説明します。

    Fields (オプション)。Fields は、ログ処理データセットインクルードファイルに定義することをお勧めします。詳しくは、 ログ処理データセットインクルードファイル .
    Group Maximum Key Bytes

    サーバーが 1 つの追跡 ID で処理できるイベントデータの最大量。この制限を超えるデータは、データセット構築プロセスから除外されます。キー分割が有効である場合は 2e6 に、そうでない場合は 1e6 に設定する必要があります。詳しくは、キー分割を参照してください。

    注意:変更が必要な場合は必ずアドビまでご相談ください。

    Hash Threshold

    (オプション)。より小さな標本(データセットの行)をランダムに抽出するためのサンプリング係数。数値 n に設定した場合、n 件の追跡 ID につき 1 件のみがデータセットを入力するので、データセットの合計行数を 1/n に減らすことができます。

    100%の精度を必要とするデータセットを作成するには(つまり、すべての行を含めるには)、Hash Threshold を 1 に設定します。

    values:

    Hash Threshold = 1(すべての行を含む 100%のデータ。)

    Hash Threshold = 2(1/2 のデータで、半分の行を含みます。)

    Hash Threshold = 3 (1/3 のデータで、3 行に 1 行を含みますが、クエリー完了で 34%に四捨五入します。)

    Hash Threshold = 4 (1/4 のデータで、4 行に 1 行を含みます。)

    注意:Hash Threshold = 8 を使用すると、1/8 のデータ(つまり、12.5%)になります。ただし、この値について、四捨五入したクエリー完了の値は 13%になります。同様の例として、Hash Threshold = 6 は 17%のクエリー解決になります。Hash Threshold = 13 は 8%のクエリー解決になります。

    Log Processing.cfg ファイルと Transformation.cfg ファイルの両方に Hash Threshold を指定した場合、それぞれの値が順に適用されるのではなく、いずれか大きい方の値だけが適用されます。詳しくは、 データフィルター .

    Log Entry Condition (オプション)。データセットにログエントリを含めるかどうかの判断基準となるルールを定義します。詳しくは、 ログ記録条件 .
    Reprocess

    (オプション)。ここには任意の文字またはその組み合わせを入力できます。このパラメーターに変更を加えて Data Workbench サーバーコンピューターにファイルを保存すると、データの再処理が開始されます。

    詳しくは、 再処理と再変換 .

    Split Key Bucket Space

    キーの分割に関係するパラメーター。キー分割が有効である場合、この値を 6e6 に設定する必要があります。詳しくは、キー分割を参照してください。

    注意:変更が必要な場合は必ずアドビまでご相談ください。

    Split Key Bytes

    キーの分割に関係するパラメーター。キー分割が有効である場合は 1e6 に、そうでない場合は 0 に設定する必要があります。詳しくは、キー分割を参照してください。

    注意:変更が必要な場合は必ずアドビまでご相談ください。

    Split Key Space Ratio

    キーの分割に関係するパラメーター。キー分割が有効である場合、この値を 10 に設定する必要があります。詳しくは、キー分割を参照してください。

    注意:変更が必要な場合は必ずアドビまでご相談ください。

    Stages

    (オプション)。ログ処理データセットインクルードファイルで使用できる処理ステージの名前処理ステージにより、ログ処理データセットインクルードファイル内に定義された変換の順序付けを行うことができます。複数のログ処理データセットインクルードファイルに変換を定義してあるとき、ログ処理の決まったポイントで特定の変換を実行したい場合に、このパラメーターが非常に役立ちます。

    ログ処理データセットインクルードファイル内の各変換が、ログ処理の過程でどのような順序で実行されるかは、ここにリストしたステージの順序によって決まります。Preprocessing と Postprocessing は、ビルトインのステージです。Preprocessing は常に最初のステージに、Postprocessing は常に最後のステージになります。デフォルトでは、Default という名前のステージが 1 つ存在します。

    新しい処理ステージを追加するには

    • Log Processing.cfg ウィンドウで Stages を右クリックし、新規追加Stage をクリックします。
    • 新しいステージの名前を入力します。

    既存の処理ステージを削除するには

    • 削除するステージに対応する番号を右クリックし、「<#stage_number> を削除」をクリックします。

    注意:ログ処理データセットインクルードファイルで Stage を指定するときは、ここに入力したステージの名前と完全に一致させる必要があります。詳しくは、 データセットインクルードファイル .

    Start Time

    (オプション)。データのフィルター。タイムスタンプがこの時刻以後(この時刻を含む)のログエントリを抽出します。この時刻には、次のいずれかの形式を使用することをお勧めします。

    • 2013 年 1 月 1 日 HH:MM:SS EDT
    • 2013 年 1 月 1 日 HH:MM:SS GMT

    例えば、「July 29 2013 00」:00:「00 EDT」を開始時刻として含むデータは、2013 年 7 月 29 日 (12) から:00:午前 00 時。 詳しくは、 データフィルター .

    タイムゾーンの指定は必須です。タイムゾーンを指定しなかった場合に、デフォルトで GMT に設定されることはありません。Data Workbench サーバーでサポートされるタイムゾーンの略称一覧については、 タイムゾーンのコード .

    注意:Sensor、ログファイル、XML ソースのパラメーターである Use Start/End Times は、このパラメーターと連動します。詳しくは、 ログソース これらのソースタイプについて説明します。

    タイムゾーン

    (オプション)。ログ処理時に時間の変換(x-local-timestring フィールドで表される変換など)に使用される Data Workbench サーバーのタイムゾーン。

    注意:データセット構築のログ処理段階で、変換済みの時刻フィールドにアクセスしたい場合、Time Zone を指定する必要があります。指定しないと、Data Workbench サーバーによってイベントログにエラーが記録されます。

    詳しくは、 タイムゾーン .

    Transformations (オプション)。ログ処理における変換は、ログ処理データセットインクルードファイルに定義することをお勧めします。詳しくは、 ログ処理データセットインクルードファイル .
  5. 右クリック (modified) ウィンドウの上部にあるをクリックし、 Save.

  6. 内 Profile Manager、次のチェックマークを右クリック: Log Processing.cfg内 User 列、「 Save to > <dataset profile name> ローカルで行った変更を有効にする データセットプロファイルの同期後、データの再処理が開始されます。

    メモ

    アドビから提供される内部プロファイルには、変更した設定ファイルを一切保存しないでください。内部プロファイルに対するアップデートをインストールするときに変更内容が上書きされます。

    データの再処理について詳しくは、 再処理と再変換.

このページ