Data Workbench 提供終了のお知らせ.
データセットプロファイルの Log Processing.cfg ファイルを編集するための手順について説明します。
データセットプロファイル内で、 Profile Manager をクリックし、 Dataset 内容を表示する。
を開き、使用する方法については、 Profile Managerを参照し、 Data Workbenchユーザーガイド.
Dataset ディレクトリには、ログ処理サブディレクトリが存在する場合があります。 このサブディレクトリには、 Log Processing Dataset Include 継承された 1 つ以上のプロファイルに対して作成されたファイル。 詳しくは、 データセットインクルードファイル.
の横のチェックマークを右クリックします。 Log Processing.cfg をクリックし、 Make Local. このファイル用のチェックマークが User 列に表示されます。
新しく作成されたチェックマークを右クリックし、 Open > in Workstation. この Log Processing.cfg ウィンドウが表示されます。
また、 Log Processing.cfg ファイル Transformation Dependency Map. 変換依存関係マップについて詳しくは、 データセット設定ツール.
次の表を参考にして、設定ファイルのパラメーターを編集します。
Data Workbench ウィンドウ内で Log Processing.cfg ファイルを編集するときは、基本的な編集機能にショートカットキーを使用できます。切り取り(Ctrl + X)、コピー(Ctrl + C)、貼り付け(Ctrl + V)、取り消し(Ctrl + Z)、やり直し(Ctrl + Shift + Z)、セクション選択(クリックしながらドラッグ)、すべて選択(Ctrl + A)などの操作が可能です。また、ショートカットを使用して、1 つの設定ファイル ( .cfg) を別のに置き換えます。
A Log Processing Dataset Include 継承プロファイルのファイルには、次の表で説明するパラメーターのサブセットと、追加のパラメーターが含まれています。 詳しくは、 データセットインクルードファイル.
パラメーター | 説明 |
---|---|
ログソース | データのソース。詳しくは、 ログソース . |
End Time | (オプション)。データのフィルター。タイムスタンプがこの時刻より前(この時刻は含まず)のログエントリを抽出します。この時刻には、次のいずれかの形式を使用することをお勧めします。
例えば、July 29 2013 00 を指定します。:00:[00 EDT as the End Time] には、2013 年 7 月 28 日 (11) までのデータが含まれます。:59:米国東部標準時の午後 59 時。 詳しくは、 データフィルター . タイムゾーンの指定は必須です。タイムゾーンを指定しなかった場合に、デフォルトで GMT に設定されることはありません。Data Workbench サーバーでサポートされるタイムゾーンの略称一覧については、 タイムゾーンのコード .
注意:Sensor、ログファイル、XML ソースのパラメーターである Use Start/End Times は、このパラメーターと連動します。詳しくは、 ログソース これらのソースタイプについて説明します。 |
Fields | (オプション)。Fields は、ログ処理データセットインクルードファイルに定義することをお勧めします。詳しくは、 ログ処理データセットインクルードファイル . |
Group Maximum Key Bytes | サーバーが 1 つの追跡 ID で処理できるイベントデータの最大量。この制限を超えるデータは、データセット構築プロセスから除外されます。キー分割が有効である場合は 2e6 に、そうでない場合は 1e6 に設定する必要があります。詳しくは、キー分割を参照してください。
注意:変更が必要な場合は必ずアドビまでご相談ください。 |
Hash Threshold | (オプション)。より小さな標本(データセットの行)をランダムに抽出するためのサンプリング係数。数値 n に設定した場合、n 件の追跡 ID につき 1 件のみがデータセットを入力するので、データセットの合計行数を 1/n に減らすことができます。 100%の精度を必要とするデータセットを作成するには(つまり、すべての行を含めるには)、Hash Threshold を 1 に設定します。 values: Hash Threshold = 1(すべての行を含む 100%のデータ。)Hash Threshold = 2(1/2 のデータで、半分の行を含みます。) Hash Threshold = 3 (1/3 のデータで、3 行に 1 行を含みますが、クエリー完了で 34%に四捨五入します。) Hash Threshold = 4 (1/4 のデータで、4 行に 1 行を含みます。)
注意:Hash Threshold = 8 を使用すると、1/8 のデータ(つまり、12.5%)になります。ただし、この値について、四捨五入したクエリー完了の値は 13%になります。同様の例として、Hash Threshold = 6 は 17%のクエリー解決になります。Hash Threshold = 13 は 8%のクエリー解決になります。 Log Processing.cfg ファイルと Transformation.cfg ファイルの両方に Hash Threshold を指定した場合、それぞれの値が順に適用されるのではなく、いずれか大きい方の値だけが適用されます。詳しくは、 データフィルター . |
Log Entry Condition | (オプション)。データセットにログエントリを含めるかどうかの判断基準となるルールを定義します。詳しくは、 ログ記録条件 . |
Reprocess | (オプション)。ここには任意の文字またはその組み合わせを入力できます。このパラメーターに変更を加えて Data Workbench サーバーコンピューターにファイルを保存すると、データの再処理が開始されます。 詳しくは、 再処理と再変換 . |
Split Key Bucket Space | キーの分割に関係するパラメーター。キー分割が有効である場合、この値を 6e6 に設定する必要があります。詳しくは、キー分割を参照してください。
注意:変更が必要な場合は必ずアドビまでご相談ください。 |
Split Key Bytes | キーの分割に関係するパラメーター。キー分割が有効である場合は 1e6 に、そうでない場合は 0 に設定する必要があります。詳しくは、キー分割を参照してください。
注意:変更が必要な場合は必ずアドビまでご相談ください。 |
Split Key Space Ratio | キーの分割に関係するパラメーター。キー分割が有効である場合、この値を 10 に設定する必要があります。詳しくは、キー分割を参照してください。
注意:変更が必要な場合は必ずアドビまでご相談ください。 |
Stages | (オプション)。ログ処理データセットインクルードファイルで使用できる処理ステージの名前処理ステージにより、ログ処理データセットインクルードファイル内に定義された変換の順序付けを行うことができます。複数のログ処理データセットインクルードファイルに変換を定義してあるとき、ログ処理の決まったポイントで特定の変換を実行したい場合に、このパラメーターが非常に役立ちます。 ログ処理データセットインクルードファイル内の各変換が、ログ処理の過程でどのような順序で実行されるかは、ここにリストしたステージの順序によって決まります。Preprocessing と Postprocessing は、ビルトインのステージです。Preprocessing は常に最初のステージに、Postprocessing は常に最後のステージになります。デフォルトでは、Default という名前のステージが 1 つ存在します。 新しい処理ステージを追加するには
既存の処理ステージを削除するには
注意:ログ処理データセットインクルードファイルで Stage を指定するときは、ここに入力したステージの名前と完全に一致させる必要があります。詳しくは、 データセットインクルードファイル . |
Start Time | (オプション)。データのフィルター。タイムスタンプがこの時刻以後(この時刻を含む)のログエントリを抽出します。この時刻には、次のいずれかの形式を使用することをお勧めします。
例えば、「July 29 2013 00」:00:「00 EDT」を開始時刻として含むデータは、2013 年 7 月 29 日 (12) から:00:午前 00 時。 詳しくは、 データフィルター . タイムゾーンの指定は必須です。タイムゾーンを指定しなかった場合に、デフォルトで GMT に設定されることはありません。Data Workbench サーバーでサポートされるタイムゾーンの略称一覧については、 タイムゾーンのコード .
注意:Sensor、ログファイル、XML ソースのパラメーターである Use Start/End Times は、このパラメーターと連動します。詳しくは、 ログソース これらのソースタイプについて説明します。 |
タイムゾーン | (オプション)。ログ処理時に時間の変換(x-local-timestring フィールドで表される変換など)に使用される Data Workbench サーバーのタイムゾーン。
注意:データセット構築のログ処理段階で、変換済みの時刻フィールドにアクセスしたい場合、Time Zone を指定する必要があります。指定しないと、Data Workbench サーバーによってイベントログにエラーが記録されます。 詳しくは、 タイムゾーン . |
Transformations | (オプション)。ログ処理における変換は、ログ処理データセットインクルードファイルに定義することをお勧めします。詳しくは、 ログ処理データセットインクルードファイル . |
右クリック (modified) ウィンドウの上部にあるをクリックし、 Save.
内 Profile Manager、次のチェックマークを右クリック: Log Processing.cfg内 User 列、「 Save to > <dataset profile name> ローカルで行った変更を有効にする データセットプロファイルの同期後、データの再処理が開始されます。
アドビから提供される内部プロファイルには、変更した設定ファイルを一切保存しないでください。内部プロファイルに対するアップデートをインストールするときに変更内容が上書きされます。
データの再処理について詳しくは、 再処理と再変換.