Data Workbench 提供終了のお知らせ.
データセットを構築する際に Data Workbench サーバーで処理できるデータフィールドについて取り上げます。
データセット構築用のイベントデータは、ログソースと呼ばれるファイル内に存在します。各データレコードが 1 件のトランザクションレコード、またはタイムスタンプを持った 1 回のイベントの発生を表していることから、ログソース内のデータは「イベントデータ」と呼ばれます。
ログソースのイベントデータは、 Sensors. が収集したイベントデータ Sensors HTTP およびアプリケーションサーバーから data workbench サーバーに送信され、圧縮されたログ ( .vsl) ファイルに書き込むことができます。 フラットファイル、XML ファイルまたは ODBC データソースに存在するイベントデータを読み取る Data Workbench サーバーは、こうした様々な形式のファイルから決まった一連のデータフィールドを抽出するよう設定されたデコーダーの役割を担います。
次の節では、で収集されるデータフィールド(イベントデータレコードフィールドまたはログエントリフィールドと呼ばれます)に関する情報を示します。 Sensors data workbench サーバーが読み取り、使用できるようにします。
フィールドの名前は、通常、W3C 拡張ログファイル形式の命名規則に従います。 多くのフィールドには、その情報の取得元を表すプレフィックスが付いています。
ログ ( .vsl) ファイルには、 Sensors データセット構築プロセスで data workbench サーバーによって使用されます。 次の表は、Sensor によって記録される代表的なイベントデータレコードのフィールドの一覧です。
フィールド | 説明 |
---|---|
c-ip | サーバーに対して送信されたリクエストに含まれているクライアントの IP アドレス。 例:207.68.146.68 |
cs(cookie) | クライアントによってリクエストとともに送信された cookie。 例:v1st=42FDF66DE610CF36; ASPSESSIONIDQCATDAQC=GPIBKEIBFBFIPLOJMKCAAEPM; |
cs(referrer) | クライアントによってリクエストとともにサーバーに送信された HTTP リファラー文字列。 例: https://www.mysite.net/cgi-bin/websearch?qry |
cs(user-agent) | クライアントによってリクエストとともにサーバーに送信された文字列。そのクライアントに該当するユーザーエージェントのタイプを表します。 例:Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.7) Gecko/20040707 Firefox/0.9.2 |
cs-method | HTTP リクエストのメソッドのタイプ。 例:GET 参照: https://www.w3.org/TR/2000/NOTE-shoplogfileformat-20001115/#field_method |
cs-uri-query | URI のクエリー文字列部分(ステム + クエリー文字列 = URI)。疑問符(?)で始まり、名前と値のペアを含んでいる場合もあります。複数のペアが含まれている場合は、アンパサンド(&)で区切って指定されます。 例:page=homepage |
cs-uri-stem | URI のステム部分(ステム + クエリー文字列= URI)。ステムは、サーバー上の要求されたリソースに対する実際のパスまたは論理パスです。 例:/index.asp |
sc(content-type) | クライアントから要求されているとしてサーバーが報告したリソースのコンテンツタイプ。 例:text/html、image/png、image/gif、video/mpeg |
sc-bytes | リクエストへの応答としてサーバーからクライアントに送信されたデータのバイト数。 例:4996 |
sc-status | サーバーからクライアントに返されたステータスコード。 例:200 参照: https://www.w3.org/Protocols/rfc2616/rfc2616-sec10.html |
s-dns | 要求されたリソースのホストの完全修飾ドメイン名または IP アドレス。 例:www.adobe.com |
x-experiment | リクエストの時点でクライアントが属しているすべての制御実験の名前とグループのリスト。 例:VSHome_Exp.Group_1,VSRegistration_Exp.Group_2 |
x-timestamp | リクエストがサーバーによって受信された日付と時刻(GMT)。時刻は、1600 年 1 月 1 日からの 100 ナノ秒数で表されます。 例:127710989320000000は 11 の x-timestamp 値になります:28:2005 年 9 月 13 日(火):52.0000000 |
x-trackingid | 持続 Cookie に検出されたブラウザーの一意の ID を表す 64 ビットの 16 進数値。Sensor によって設定され、サーバーへのリクエストとともにクライアントから提供されます。 例:42FDF66DE610CF36 |
次の表は、ベースラインイベントデータレコードのフィールドから Data Workbench サーバーが生成する派生フィールドの例を示しています。
フィールド | 説明 |
---|---|
cs(cookie)(name) | cookie に含まれる特定の名前と値のペアの値。 |
cs(referrer-domain) | HTTP 参照元 URI のドメイン名または IP アドレス。
注意:このフィールドは読み取り専用です。 |
cs(referrer-host) | リファラーのホスト名全体。 例:cs(referrer) が https://my.domain.com/my/page 、cs(referrer-host) は my.domain.com . |
cs(referrer-query)(name) | リファラークエリー文字列の値。
注意:cs(referrer)(name) フィールドを使用して、リファラークエリー文字列の値にアクセスすることはできません。 |
cs-uri | 完全な URI(ステム + クエリー文字列 = URI 全体)。 例:/shopping/checkout.html?product1=8Track&product2=casette&product3=cd |
cs-uri-query(name) | 指定された名前に関連付けられている値。指定された名前に対して複数の値が存在する場合、その中の最後の値が返されます。 例:
|
ctime | 1970 年 1 月 1 日からの秒数で表される x-timestamp。このフィールドは、x-unixtime と呼ばれることもあります。 |
日付 | YYYY-MM-DD 形式の x-timestamp。 |
time | HH 形式の x-timestamp:MM:SS. |
x-local-timestring | データセットの Transformation.cfg ファイルに指定されたローカルタイムゾーンに変換した x-timestamp。形式は YYYY-MM-DD HH です。:MM:SS.mmm
注意:Log Processing.cfg ファイルで時刻変換(x-local-timestring など)を定義することもできます。詳しくは、 ログ処理設定ファイル . |
x-log-source-id | 特定のログエントリのログソースに対応する識別子。この識別子を記録するためには、Sensor、ログファイルまたは ODBC データソースを定義するときに、Log Processing.cfg ファイルの Log Source ID フィールドに識別子を指定する必要があります。詳しくは、 ログ処理設定ファイル . 例:from VSensor01 |
x-mask | Sensor データソースのマスクパターン(.vsl ファイル名から派生)。名前の形式が YYYYMMDD-SENSORID.VSL であるファイルの x-mask は SENSORID になります。 |
x-timestring | YYYY-MM-DD HH 形式の x-timestamp:MM:SS.mmm |
x-unixtime | x-timestamp から派生した 10 進数の UNIX 時間。 |
サーバー上の Sensor は、有効な HTTP リクエスト(または応答)ヘッダーから、またはサーバーの API を介して提供される変数から、イベントデータのフィールドを収集することができます。こうしたデータフィールドを収集するには、txlogd.conf の Sensor 設定ファイルに目的のヘッダーフィールドまたは変数を指定する必要があります。詳しくは、『Data Workbench Sensor ガイド』を参照してください。