Daten-Feed-Inhalte - Übersicht

In den folgenden Abschnitten wird beschrieben, wie Sie auf die Dateien in einer Daten-Feed-Bereitstellung zugreifen und diese verstehen.

Zugriff auf Daten-Feed-Inhalte

So greifen Sie auf den Inhalt eines Daten-Feeds zu:

  1. Melden Sie sich bei der Daten-Feed-Ziel-Site an.

    Dies ist die Ziel-Site, die Sie beim Erstellen des Daten-Feeds eingerichtet haben, z. B. ein Amazon S3- oder Google Cloud Platform-Bucket.

  2. Laden Sie die komprimierte Daten-Feed-Datei auf Ihren lokalen Computer herunter.

  3. Dekomprimieren Sie die komprimierte Datei mit einem Programm, das .tar.gz-Dateierweiterungen unterstützt.

  4. Öffnen Sie die Datei "hit_data.tsv" in Ihrer gewünschten Tabellenkalkulation oder Datenbankanwendung, um die Rohdaten für diesen Tag anzuzeigen. —>

Manifestdatei feed-manifest

Die Manifestdatei enthält folgende Details zu den einzelnen Dateien, die Bestandteil des hochgeladenen Datensatzes sind:

  • Dateiname
  • Dateigröße
  • MD5-Hash
  • Anzahl der in der Datei enthaltenen Datensätze

Die Manifestdatei hat dasselbe Format wie eine Java-JAR-Manifestdatei.

Die Manifestdatei wird immer abschließend in Form einer separaten .txt-Datei gesendet. Mit der Manifestdatei wird signalisiert, dass der vollständige Datensatz für den Anforderungszeitraum ausgeliefert wurde. Manifestdateien werden nach folgendem Muster benannt:

[rsid]_[YYYY-mm-dd].txt

Eine typische Manifestdatei enthält Daten, die folgendem Schema entsprechen:

Datafeed-Manifest-Version: 1.0
 Lookup-Files: 1
 Data-Files: 1
 Total-Records: 611

 Lookup-File: rsid_date-lookup_data.tar.gz
 MD5-Digest: af6de42d8b945d4ec1cf28360085308
 File-Size: 63750

 Data-File: 01-rsid_date.tsv.gz
 MD5-Digest: 9c70bf783cb3d0095a4836904b72c991
 File-Size: 122534
 Record-Count: 611

Jede Manifestdatei enthält eine Kopfzeile, in der die Gesamtanzahl der Lookup-Dateien, Datendateien sowie die Gesamtanzahl der Datensätze in allen Datendateien angegeben sind. Nach dieser Kopfzeile folgen verschiedene Abschnitte mit Informationen zu den einzelnen Dateien, die in der Datenfeedauslieferung enthalten sind.

Einige Feeds sind so konfiguriert, dass sie eine .fin-Datei anstelle einer .txt-Manifestdatei erhalten. Der .fin gibt an, dass der Upload abgeschlossen ist, die darin enthaltenen Metadaten jedoch in einem älteren Format vorliegen.

Lookup-Dateien

In manchen Daten-Feed-Spalten wird eine Zahl ausgegeben, die einem Wert entspricht. Lookup-Dateien werden verwendet, um diese Zahl in einer Daten-Feed-Spalte einem tatsächlichen Wert zuzuordnen. Beispielsweise bedeutet der Wert „497“ in der Spalte mit den browser-Trefferdaten, dass der Treffer von „Microsoft Internet Explorer 8“ stammte, wie in browser.tsv ersichtlich ist.

Beachten Sie, dass column_headers.tsv und event_list.tsv spezifisch für den Daten-Feed und die Report Suite sind. Andere Dateien, z. B. browser.tsv, sind hingegen generisch.

Lookup-Dateien werden in einer komprimierten ZIP-Datei bereitgestellt, die nach folgendem Muster benannt ist:

[rsid]_[YYYY-mm-dd]-lookup_data.[compression_suffix]
  • column_headers.tsv: Eine einzelne Zeile mit den Spaltenüberschriften für hit_data.tsv.
  • browser.tsv: Ordnet die Browser-ID (die Feed-Spalte browser) dem Anzeigenamen des Browsers zu.
  • browser_type.tsv: Ordnet die Browser-ID (die Feed-Spalte browser) dem Browsertyp zu.
  • color_depth.tsv: Ordnet die Farbtiefen-ID (die Feed-Spalte color) der Farbtiefe zu.
  • connection_type.tsv: Ordnet die Verbindungstyp-ID (die Feed-Spalte connection_type) dem Verbindungstyp zu.
  • country.tsv: Ordnet die Länder-ID (die Feed-Spalte country) dem Ländernamen zu.
  • javascript_version.tsv: Ordnet die JavaScript-Versions-ID (die Feed-Spalte javascript) der JavaScript-Version zu.
  • languages.tsv: Ordnet die Sprach-ID (die Feed-Spalte language) der Sprache zu.
  • operating_systems.tsv: Ordnet die Betriebssystem-ID (die Feed-Spalte os) dem Namen des Betriebssystems zu.
  • plugins.tsv: Ordnet die Plug-in-IDs (die Feed-Spalte plugin) jedem jeweiligen Plug-in-Namen zu.
  • resolution.tsv: Ordnet die Auflösungs-ID (die Feed-Spalte resolution) der Bildschirmauflösung zu.
  • referrer_type.tsv: Ordnet die Referrer-Typ-ID (die Feed-Spalte ref_type) dem Referrer-Typ zu.
  • search_engines.tsv: Ordnet die Suchmaschinen-ID (die Feed-Spalte search_engine) dem Suchmaschinennamen zu.
  • event.tsv: Ordnet jede Ereignis-ID (die Feed-Spalte event_list) dem jeweiligen Ereignisnamen zu.

Trefferdatendateien

Die Trefferdaten werden in der Datei hit_data.tsv bereitgestellt. Die Menge an Daten in dieser Datei richtet sich nach dem Auslieferungsformat (stündlich oder täglich sowie danach, ob die Auslieferung in einer oder in mehreren Dateien erfolgt). Diese Datei enthält nur die Trefferdaten. Die Spaltenkopfzeilen werden separat mit den Lookup-Dateien geliefert. Jede Zeile in dieser Datei entspricht einem einzelnen Server-Aufruf.

Die von Adobe bereitgestellten Dateien variieren je nach Art des konfigurierten Daten-Feeds. Alle Dateien sind ISO-8859-1-kodiert.

  • [rsid] Bezeichnet die Report Suite-ID, aus der der Daten-Feed stammt.
  • [index] wird nur bei mehreren Datei-Feeds verwendet und bezieht sich auf die richtige Reihenfolge paginierter Dateien.
  • [YYYY-mm-dd] bezeichnet den Starttag des Daten-Feed.
  • [HHMMSS] wird nur in stündlichen Feeds verwendet und bezeichnet den Startzeitpunkt des Daten-Feed.
  • [compression_suffix] bezeichnet die Art der verwendeten Komprimierung. Normalerweise werden Daten-Feeds in tar.gz- oder zip-Dateien komprimiert.
  • [format_suffix] bezieht sich auf den Dateityp. In der Regel ist das Datenfeed-Dateiformat .tsv.

Täglich; einzelne Datei

Nachdem die Daten einen Tag lang erfasst wurden, erhalten Sie eine einzelne komprimierte Datendatei und eine Manifestdatei. Die Datendatei hat den Namen:

[rsid]_[YYYY-mm-dd].[compression_suffix]

Nach dem Extrahieren enthält die Datendatei eine einzelne hit_data.tsv-Datei, die alle Daten für diesen Tag beinhaltet, sowie Lookup-Dateien für alle erforderlichen Spalten.

Täglich; mehrere Dateien

Nachdem die Daten einen Tag lang erfasst wurden, erhalten Sie eine oder mehrere komprimierte Datendateien und eine Manifestdatei. Die Datendatei hat den Namen:

[index]-[rsid]_[YYYY-mm-dd].[compression_suffix]

Nach dem Extrahieren enthält jede Datendatei eine einzelne [index]-[rsid]_[YYYY-mm-dd].[format_suffix]-Datei, die ca. 2 GB unkomprimierte Daten beinhaltet, sowie Lookup-Dateien für alle erforderlichen Spalten.

Stündlich; einzelne Datei

Nachdem die Daten eine Stunde lang erfasst wurden, erhalten Sie eine einzelne komprimierte Datendatei und eine Manifestdatei. Die Datendatei hat den Namen:

[rsid]_[YYYYmmdd]-[HHMMSS].[compression_suffix]

Nach dem Extrahieren enthält die Datendatei eine einzelne hit_data.tsv-Datei, die alle Daten für diese Stunde beinhaltet, sowie Lookup-Dateien für alle erforderlichen Spalten.

Stündlich; mehrere Dateien

Nachdem die Daten eine Stunde lang erfasst wurden, erhalten Sie eine oder mehrere komprimierte Datendateien und eine Manifestdatei. Die Datendateien haben den Namen:

[index]-[rsid]_[YYYYmmdd]-[HHMMSS].[format_suffix].[compression_suffix]

Nach dem Extrahieren enthält jede Datendatei eine einzelne [index]-[rsid]_[YYYYmmdd]-[HHMMSS].[format_suffix] -Datei, die ca. 2 GB unkomprimierte Daten enthält, sowie Lookup-Dateien für alle erforderlichen Spalten.

Größe der Datendatei

Die Größe der Trefferdatei kann in Abhängigkeit von der Anzahl der aktiv genutzten Variablen und dem Traffic an die Report Suite stark variieren. Eine Datenzeile ist durchschnittlich 500 B (komprimiert) oder 2 KB (unkomprimiert) groß. Dieser Wert multipliziert mit der Anzahl der Server-Aufrufe ergibt einen ungefähren Schätzwert zur Größe einer Daten-Feed-Datei. Sobald Ihr Unternehmen Daten-Feed-Dateien empfängt, können Sie eine genauere Zahl feststellen, indem Sie die Anzahl der Zeilen in hit_data.tsv durch die Gesamtdateigröße dividieren.

recommendation-more-help
6b7d49d5-f5fe-4b7f-91ae-5b0745755ed2