データフィードの内容 - 概要

Last update: Thu Feb 05 2026 00:00:00 GMT+0000 (Coordinated Universal Time)

トピック：
データフィード

作成対象：

ユーザー
管理者

次の節では、データフィード配信にあるファイルにアクセスして理解する方法について説明します。

データフィードの内容へのアクセス

データフィードの内容にアクセスするには：

データフィードの宛先サイトにログインします。

これは、Amazon S3 や Google Cloud Platform バケットなど、データフィードを作成する際に設定する宛先サイトです。
圧縮データフィードファイルをローカルマシンにダウンロードします。
.tar.gz ファイル拡張子をサポートするプログラムを使用して、圧縮ファイルを解凍します。
スプレッドシートまたはデータベースアプリケーションで hit_data.tsv ファイルを開き、その日の生データを確認します。–>

マニフェストファイル feed-manifest

マニフェストファイルには、アップロードされるデータセット内の各ファイルに関する以下の詳細情報が含まれます。

ファイル名
ファイルサイズ
MD5 ハッシュ
ファイルに含まれるレコードの数

マニフェストファイルは、Java JAR マニフェストファイルと同じ書式に従います。

マニフェストファイルは、別個の .txt ファイルとして常に最後に配布されるので、このファイルの存在は、対象リクエスト期間のデータセット全体が配信済みであることを示します。マニフェストファイルの名前は次のように付けられます。

[rsid]_[YYYY-mm-dd].txt

一般的なマニフェストファイルには、次のようなデータが含まれます。

Datafeed-Manifest-Version: 1.0
 Lookup-Files: 1
 Data-Files: 1
 Total-Records: 611

 Lookup-File: rsid_date-lookup_data.tar.gz
 MD5-Digest: af6de42d8b945d4ec1cf28360085308
 File-Size: 63750

 Data-File: 01-rsid_date.tsv.gz
 MD5-Digest: 9c70bf783cb3d0095a4836904b72c991
 File-Size: 122534
 Record-Count: 611

すべてのマニフェストファイルには、ルックアップファイル、データファイルの合計数、すべてのデータファイル内のレコードの合計数を示すヘッダーが含まれます。このヘッダーの後には、データフィード配信に含まれる各ファイルの情報を含む複数のセクションが続きます。

.fin ファイルのマニフェストの代わりに .txt ファイルを受信するようにフィードが設定されている場合もあります。.fin はアップロードが完了したことを示しますが、そこに含まれるメタデータは古い形式です。

参照ファイル

一部のデータフィード列は、実際の値に対応する数値を出力します。ルックアップファイルは、データフィード列の数値を照合し、実際の値と照合するために使用されます。例えば、browser ヒットデータ列の値が「497」の場合は、browser.tsv を見ると、そのヒットが「Microsoft Internet Explorer 8」からのヒットであることがわかります。

column_headers.tsv と event_list.tsv はそのデータフィードとレポートスイートに固有のファイルです。それ以外のファイル（browser.tsv など）は汎用ファイルです。

参照ファイルは次の書式の名前を持つ 1 つのファイルに圧縮されて配信されます。

[rsid]_[YYYY-mm-dd]-lookup_data.[compression_suffix]

column_headers.tsv：hit_data.tsv の列ヘッダーを含む 1 行。
browser.tsv：ブラウザー ID（browser フィード列）をブラウザーのわかりやすい名前にマッピングします。
browser_type.tsv：ブラウザー ID（browser フィード列）をブラウザータイプにマッピングします。
color_depth.tsv：色深度 ID（color フィード列）を色深度にマッピングします。
connection_type.tsv：接続タイプ ID（connection_type フィード列）を接続タイプにマッピングします。
country.tsv：国 ID（country フィード列）を国名にマッピングします。
javascript_version.tsv：JavaScript バージョン ID（javascript フィード列）を JavaScript バージョンにマッピングします。
languages.tsv：言語 ID（language フィード列）を言語にマッピングします。
operating_systems.tsv：オペレーティングシステム ID（os フィード列）をオペレーティングシステム名にマッピングします。
plugins.tsv：プラグイン ID（plugin フィード列）をそれぞれのプラグイン名にマッピングします。
resolution.tsv：解像度 ID（resolution フィード列）をモニターの解像度にマッピングします。
referrer_type.tsv：リファラータイプ ID（ref_type フィード列）をリファラータイプにマッピングします。
search_engines.tsv：検索エンジン ID（search_engine フィード列）を検索エンジン名にマッピングします。
event.tsv：各イベント ID（event_list フィード列）をそれぞれのイベント名にマッピングします。

ヒットデータファイル

ヒットデータは hit_data.tsv ファイルで提供されます。このファイルのデータ量は、配信形式（時間単位または日単位、 1 つまたは複数のファイル）によって決まります。このファイルには、ヒットデータのみが含まれます。列ヘッダーは、ルックアップファイルとは別に提供されます。このファイルの各行には、1 つのサーバー呼び出しが含まれます。

アドビから配信されるファイルは、設定したデータフィードの種類によって異なります。すべてのファイルは ISO-8859-1 を使用してエンコードされます。

[rsid] は、データフィードの元となるレポートスイート ID を指します。
[index] は、複数のファイルフィードでのみ使用され、ページ分割されたファイルの正しい順序を示します。
[YYYY-mm-dd] は、データフィードの開始日を示します。
[HHMMSS] は時間別フィードでのみ使用され、データフィードの開始時間を示します。
[compression_suffix] は、使用される圧縮のタイプを指します。通常、データフィードは tar.gz または zip ファイルに圧縮されます。
[format_suffix] は、ファイル形式のタイプを指します。通常、データフィードファイル形式は .tsv です。

日別、単一ファイル

1 日分のデータを収集した後、圧縮データファイルが 1 つ以上とマニフェストファイル 1 つを受け取ります。データファイルの名前は次のようになります。

[rsid]_[YYYY-mm-dd].[compression_suffix]

展開すると、各データファイルにはその日のすべてのデータを含む hit_data.tsv が 1 つと、必要な列のルックアップファイルが含まれています。

毎日、複数のファイル

1 日分のデータを収集した後、圧縮データファイル 1 つ以上とマニフェストファイル 1 つを受け取ります。データファイルの名前は次のようになります。

[index]-[rsid]_[YYYY-mm-dd].[compression_suffix]

展開すると、各データファイルには約 2GB の非圧縮データを含む [index]-[rsid]_[YYYY-mm-dd].[format_suffix] が 1 つと、必要な列のルックアップファイルが含まれています。

時間別、単一ファイル

1 時間分のデータを収集した後、圧縮データファイルが 1 つ以上とマニフェストファイル 1 つが届きます。データファイルの名前は次のようになります。

[rsid]_[YYYYmmdd]-[HHMMSS].[compression_suffix]

展開すると、各データファイルにはその時間のすべてのデータを含む hit_data.tsv が 1 つと、必要な列のルックアップファイルが含まれています。

時間別、複数のファイル

1 時間分のデータを収集した後、圧縮データファイル 1 つ以上とマニフェストファイル 1 つを受け取ります。データファイルの名前は次のようになります。

[index]-[rsid]_[YYYYmmdd]-[HHMMSS].[format_suffix].[compression_suffix]

展開すると、各データファイルには約 2GB の非圧縮データを含む [index]-[rsid]_[YYYYmmdd]-[HHMMSS].[format_suffix] ファイルが 1 つと、必要な列のルックアップファイルが含まれます。

データファイルサイズ

ヒットデータのファイルサイズは、レポートスイートでアクティブに使用される変数の数、およびレポートスイートに送信されたトラフィック量に応じて大きく異なります。ただし、データ 1 行の平均は約 500B（圧縮時）または 2KB（非圧縮時）です。これにサーバーコールの数をかけることによって、データフィードファイルのおおよその大きさを概算できます。組織がデータフィードファイルの受信を開始すると、hit_data.tsv の行数を合計ファイルサイズで割ることで、より正確な数を算出できます。

recommendation-more-help

6b7d49d5-f5fe-4b7f-91ae-5b0745755ed2