テキストファイルデコーダーグループ

重要

Data Workbench 提供終了のお知らせ.

ログファイルをログソースとして処理するためには、ログエントリからデータフィールドを抽出するデコーダーをログ処理データセットインクルードファイル内で定義する必要があります。

ログファイルログソースに使用するテキストファイルデコーダーグループを定義するには、ログファイルの構造と内容、抽出するデータ、データが格納されているフィールドに関する知識が必要となります。デコーダーに関して指定できるパラメーターの基本的な事柄はこの節で説明していますが、デコーダーの使用方法は、ソースデータを含んでいるログファイルによって異なります。

ログファイルログソースの形式の要件について詳しくは、 ログファイル. テキストファイルデコーダーの定義に関して不明な点がありましたらアドビにお問い合わせください。

テキストファイルデコーダーグループには、次のデコーダーを含めることができます。

正規表現デコーダー

正規表現デコーダーは、ログファイルのログエントリに含まれる複雑な文字列パターンを識別し、データフィールドとして抽出します。デコーダーごとのフィールドの数は、正規表現で捕捉するサブパターンの数と一致している必要があります。対象となる行の n 番目に捕捉するサブパターンと一致する部分は、その行の n 番目のフィールドに割り当てられます。

テキストファイルデコーダーグループに正規表現デコーダーを追加するには

  1. を開きます。 Log Processing Dataset Include の説明に従ってファイルを作成します。 既存のデータセットインクルードファイルの編集 テキストファイルデコーダーグループを追加します。 テーブルエントリを参照 デコーダーグループ.

  2. 右クリック Decoders 新しく作成したデコーダーグループで、 Add new > Regular Expression.

  3. 次の情報を指定します。

    • Fields:​ログファイル内のフィールドの一覧。ここで定義したフィールドのいずれかをデータセット構築の変換段階に渡す場合、それらのフィールドを Log Processing Dataset Include ファイルに含まれています。 カスタムフィールドの名前は、先頭に「x-」を付ける必要があります。

    • Name:(省略可)デコーダーの識別子。

    • Regular Expression:​ファイル内の各行から必要なフィールドを抽出するために使用します。

  4. グループに追加する他のデコーダーについても手順 4 と手順 5 を繰り返します。

  5. 次の手順で Log Processing Dataset Include ファイル、右クリック (modified) ウィンドウの上部にあるをクリックし、 Save.

  6. ローカルで行った変更を有効にするには、 Profile Managerをクリックし、 User 列。 クリック Save to > <profile name>( profile name は、データセットインクルードファイルが属するデータセットプロファイルまたは継承プロファイルの名前です)。

アドビから提供される内部プロファイルには、変更した設定ファイルを一切保存しないでください。内部プロファイルに対するアップデートをインストールするときに変更内容が上書きされます。

メモ

特定のログファイルには、複数の正規表現デコーダーを含めることができます。 この場合、デコーダーを定義する順序が重要となります。ログファイル内の行と一致する最初のデコーダーが、その行のデコードに使用されます。

以下に示したのは、正規表現デコーダーを使用して、タブ区切りのテキストファイルから一連のフィールドデータを抽出する例です。同じ結果は、タブ区切り文字デコーダーを定義することによっても得られます。

正規表現デコーダー(用語と構文を含む)について詳しくは、 正規表現.

区切り文字デコーダー

区切り文字デコーダーは、各フィールドが単一の文字で区切られたログファイルをデコードするものです。フィールドの数は、区切り文字ファイル内の列数と対応している必要はありますが、必ずしもすべてのフィールドを指定する必要はありません。フィールドを省略した場合、ログファイルには必要な列であっても、デコーダーはそのフィールドを無視します。

テキストファイルデコーダーグループに区切り文字デコーダーを追加するには

  1. を開きます。 Log Processing Dataset Include の説明に従ってファイルを作成します。 既存のデータセットインクルードファイルの編集 テキストファイルデコーダーグループを追加します。 テーブルエントリを参照 デコーダーグループ.

  2. 右クリック Decoders 新しく作成したデコーダーグループで、 Add new > Delimited.

  3. 次の情報を指定します。

    • Fields:​ログファイル内のフィールドの一覧。ここで定義したフィールドのいずれかをデータセット構築の変換段階に渡す場合、それらのフィールドを Log Processing Dataset Include ファイルに含まれています。 カスタムフィールドの名前は、先頭に「x-」を付ける必要があります。

    • Delimiter:​出力ファイル内のフィールドの区切りに使用する文字。

  4. グループに追加する他のデコーダーについても手順 4 と手順 5 を繰り返します。

  5. 次の手順で Log Processing Dataset Include ファイル、右クリック (modified) ウィンドウの上部にあるをクリックし、 Save.

  6. ローカルで行った変更を有効にするには、 Profile Managerをクリックし、 User 列、「 Save to > <profile name>( profile name は、データセットインクルードファイルが属するデータセットプロファイルまたは継承プロファイルの名前です)。

メモ

アドビから提供される内部プロファイルには、変更した設定ファイルを一切保存しないでください。内部プロファイルに対するアップデートをインストールするときに変更内容が上書きされます。

以下に示したのは、区切り文字デコーダーを使用して、映画に関するデータを含んだコンマ区切り形式のテキストファイルから一連のフィールドデータを抽出する例です。

このページ