ログファイルをログソースとして処理するためには、ログエントリからデータフィールドを抽出するデコーダーをログ処理データセットインクルードファイル内で定義する必要があります。
ログファイルログソースに使用するテキストファイルデコーダーグループを定義するには、ログファイルの構造と内容、抽出するデータ、データが格納されているフィールドに関する知識が必要となります。デコーダーに関して指定できるパラメーターの基本的な事柄はこの節で説明していますが、デコーダーの使用方法は、ソースデータを含んでいるログファイルによって異なります。
ログファイルログソースの形式の要件について詳しくは、 ログファイル. テキストファイルデコーダーの定義に関して不明な点がありましたらアドビにお問い合わせください。
テキストファイルデコーダーグループには、次のデコーダーを含めることができます。
正規表現デコーダーは、ログファイルのログエントリに含まれる複雑な文字列パターンを識別し、データフィールドとして抽出します。デコーダーごとのフィールドの数は、正規表現で捕捉するサブパターンの数と一致している必要があります。対象となる行の n 番目に捕捉するサブパターンと一致する部分は、その行の n 番目のフィールドに割り当てられます。
テキストファイルデコーダーグループに正規表現デコーダーを追加するには
既存のデータセットインクルードファイルの編集の説明に従ってLog Processing Dataset Includeファイルを開き、テキストファイルデコーダーグループを追加します。 表のエントリデコーダーグループを参照してください。
新しく作成したデコーダーグループのDecodersを右クリックし、Add new/Regular Expressionをクリックします。
次の情報を指定します。
Fields:ログファイル内のフィールドの一覧。ここで定義したフィールドのいずれかをデータセット構築の変換段階に渡す場合は、それらのフィールドをデータセットのLog Processing Dataset Includeファイルの1つのFieldsパラメーターに指定する必要があります。 カスタムフィールドの名前は、先頭に「x-」を付ける必要があります。
Name:(省略可)デコーダーの識別子。
Regular Expression:ファイル内の各行から必要なフィールドを抽出するために使用します。
グループに追加する他のデコーダーについても手順 4 と手順 5 を繰り返します。
Log Processing Dataset Includeファイルを保存するには、ウィンドウ上部の(modified)を右クリックし、Saveをクリックします。
ローカルで行った変更を有効にするには、Profile ManagerでUser列のファイルのチェックマークを右クリックします。 Save to/<profile name>をクリックします。プロファイル名は、データセットインクルードファイルが属するデータセットプロファイルまたは継承プロファイルの名前です。
アドビから提供される内部プロファイルには、変更した設定ファイルを一切保存しないでください。内部プロファイルに対するアップデートをインストールするときに変更内容が上書きされます。
1つのログファイルに、複数の正規式デコーダーを含めることができます。 この場合、デコーダーを定義する順序が重要となります。ログファイル内の行と一致する最初のデコーダーが、その行のデコードに使用されます。
以下に示したのは、正規表現デコーダーを使用して、タブ区切りのテキストファイルから一連のフィールドデータを抽出する例です。同じ結果は、タブ区切り文字デコーダーを定義することによっても得られます。
正規表現デコーダー(用語と構文を含む)について詳しくは、 正規表現.
区切り文字デコーダーは、各フィールドが単一の文字で区切られたログファイルをデコードするものです。フィールドの数は、区切り文字ファイル内の列数と対応している必要はありますが、必ずしもすべてのフィールドを指定する必要はありません。フィールドを省略した場合、ログファイルには必要な列であっても、デコーダーはそのフィールドを無視します。
テキストファイルデコーダーグループに区切り文字デコーダーを追加するには
既存のデータセットインクルードファイルの編集の説明に従ってLog Processing Dataset Includeファイルを開き、テキストファイルデコーダーグループを追加します。 表のエントリデコーダーグループを参照してください。
新しく作成したデコーダーグループのDecodersを右クリックし、Add new/Delimitedをクリックします。
次の情報を指定します。
Fields:ログファイル内のフィールドの一覧。ここで定義したフィールドのいずれかをデータセット構築の変換段階に渡す場合は、それらのフィールドをデータセットのLog Processing Dataset Includeファイルの1つのFieldsパラメーターに指定する必要があります。 カスタムフィールドの名前は、先頭に「x-」を付ける必要があります。
Delimiter:出力ファイル内のフィールドの区切りに使用する文字。
グループに追加する他のデコーダーについても手順 4 と手順 5 を繰り返します。
Log Processing Dataset Includeファイルを保存するには、ウィンドウ上部の(modified)を右クリックし、Saveをクリックします。
ローカルに適用した変更を有効にするには、Profile ManagerでUser列のファイルのチェックマークを右クリックし、Save to > profile nameをクリックします。プロファイル名は、データセットインクルードファイルが属するデータセットプロファイル名または継承プロファイルです。
アドビから提供される内部プロファイルには、変更した設定ファイルを一切保存しないでください。内部プロファイルに対するアップデートをインストールするときに変更内容が上書きされます。
以下に示したのは、区切り文字デコーダーを使用して、映画に関するデータを含んだコンマ区切り形式のテキストファイルから一連のフィールドデータを抽出する例です。