Mehr über die Data Workbench Mitteilung zum Ende der Nutzungsdauer.
Wie andere Umwandlungen wird auch die CrossRows-Transformation auf die Datenzeilen (Protokolleinträge) in Ihren Protokollquellen angewendet.
Für jede Datenzeile nimmt die Umwandlung den Wert des angegebenen Eingabefelds an, führt eine Reihe von Verarbeitungsschritten durch und zeichnet das Ergebnis im von Ihnen angegebenen Ausgabefeld auf. Wenn die Variable CrossRows Die Transformation funktioniert mit einer Datenzeile (diese Zeile wird als Ausgabezeile bezeichnet). Diese Zeile sowie eine oder mehrere andere Datenzeilen (diese Zeilen werden als Eingabezeilen bezeichnet), die mit derselben Tracking-ID verknüpft sind, werden berücksichtigt. Daher basiert der Wert des Ausgabefelds für jede Ausgabezeile für eine bestimmte Tracking-ID auf den Werten des Eingabefelds für eine oder mehrere Eingabezeilen.
Die Transformation bietet mehrere Bedingungen und Einschränkungen, mit denen Sie die Eingabezeilen für die Transformation beschränken können. Sie können diese Beschränkungen in Bezug auf die Bedingungen des Data Workbench-Servers ausdrücken (siehe Bedingungen), einen Bereich von Eingabezeilen, die relativ zur Ausgabezeile sind, oder einen Bereich, der in Bezug auf die Zeit der Ausgabezeile liegt. Für die Eingabezeilen, die die Bedingungen und Einschränkungen der Transformation erfüllen, können Sie einen Vorgang (z. B. SUM) anwenden, der den Wert des Ausgabefelds bestimmt.
Um zu arbeiten, wird die CrossRows Für die Transformation müssen die Daten in der Zeit geordnet und nach der Tracking-ID in den Quelldaten gruppiert werden. Daher CrossRows funktioniert nur, wenn im Transformation.cfg oder in einer Transformation Dataset Include -Datei.
Beachten Sie beim Überprüfen der Beschreibungen der Parameter in der folgenden Tabelle Folgendes:
Parameter | Beschreibung | Standard |
---|---|---|
Name | Deskriptiver Name der Transformation. Hier können Sie einen beliebigen Namen eingeben. | |
Kommentare | Optional. Anmerkungen zur Transformation. | |
Bedingung | Beschränkt die Ausgabe der Transformation auf bestimmte Protokolleinträge. Wenn die Bedingung für einen bestimmten Protokolleintrag nicht erfüllt ist, bleibt das Feld im Ausgabeparameter unverändert. Die Eingabe kann weiterhin verwendet werden, um andere Protokolleinträge zu beeinflussen. | |
Eingabe | Der Name des Felds aus der Eingabezeile, das als Eingabe verwendet werden soll. | |
Eingabebedingung | Akzeptiert die Eingabe für die Umwandlung nur aus bestimmten Eingabezeilen. Wenn die Eingabebedingung für eine bestimmte Eingabezeile nicht erfüllt ist, wird das Eingabefeld aus dieser Zeile ignoriert und hat keine Auswirkungen auf andere Ausgabezeilen. Das Ausgabefeld aus dieser Zeile wird jedoch weiterhin gemäß der angegebenen Bedingung geändert. | |
Schlüssel | Optional. Der Name des Felds, das als Schlüssel verwendet werden soll. Wenn ein Schlüssel angegeben ist, sind die Eingabezeilen für eine bestimmte Ausgabezeile auf den aufeinander folgenden Zeilenblock beschränkt, der denselben Schlüsselwert wie die Ausgabezeile hat. Diese Einschränkung wird zusätzlich zu allen anderen Einschränkungen gewährt, die von anderen Parametern der CrossRows Umwandlung. Wenn Sie beispielsweise mit Web-Daten arbeiten und das Feld x-session-key (das für jede Sitzung einen eindeutigen Wert hat) zum Schlüssel machen, sind die Eingabezeilen für die Transformation auf jene Zeilen beschränkt, die denselben x-session-key-Wert wie die Ausgabezeile haben. Daher erwägen Sie nur die Eingabezeilen, die Seitenansichten darstellen, die während derselben Sitzung wie die Ausgabezeile auftreten. |
|
Vorgang | Ein Vorgang, der für jede Ausgabezeile auf alle Eingabezeilen angewendet wird, die alle Bedingungen erfüllen, die durch die Parameter "Eingabebedingung", "Schlüssel", "Zeilenbeginn", "Zeilenende", "Zeitbeginn"und "Zeitende"definiert sind, um eine Ausgabe zu generieren:
|
|
Ausgabe | Der Name des Ausgabefelds. | |
Zeilenbeginn/Zeilenende | Optional. Gibt einen Bereich von Eingabezeilen relativ zur Ausgabenzeile an. Beispielsweise schließt der Wert für Zeilenbeginn "0"alle Zeilen vor der Ausgabenzeile aus. Bei einem Zeilenanfang von "1"wird auch die Ausgabezeile ausgeschlossen. Häufige Bereiche sind:
|
Alle Zeilen |
Zeitbeginn/Zeitende | Optional. Gibt einen Zeitraum an, der relativ zur Zeit der Ausgabelzeile ist. Beispielsweise umfasst das Zeitende von 30 Minuten alle Zeilen, die innerhalb von 30 Minuten nach der Ausgabenzeile stattfinden. Ein Zeitbeginn von -30 Minuten umfasst alle Zeilen, die innerhalb von 30 Minuten vor der Ausgabenzeile stattfinden. Die verfügbaren Zeiteinheiten sind Tage, Wochen, Stunden, Minuten, ms (Millisekunden), Zecken (100 Nanosekunden) und ns (Nanosekunden). |
Alle Zeiten |
Die CrossRows wird in diesem Beispiel auf Zeilen von Webdaten angewendet, um für jede Seitenansicht den Zeitpunkt der nächsten Seitenansicht zu ermitteln. Weil wir wissen, dass CrossRows wird nur während der Transformationsphase des Datensatzerstellungsprozesses angewendet, werden die Datenzeilen nach Besucher (jeder Besucher verfügt über eine eindeutige Tracking-ID) und Uhrzeit sortiert.
Das Eingabefeld x-timestamp gilt nur für jene Eingabezeilen, in denen das Feld x-is-page-view ausgefüllt ist (das angibt, dass die Datenzeile eine Seitenansicht darstellt). Das Feld x-session-key (das für jede Sitzung einen eindeutigen Wert hat) wird für den Parameter key angegeben. Daher sind die Eingabezeilen (Protokolleinträge) für die Umwandlung auf den zusammenhängenden Zeilenblock beschränkt, der denselben Wert wie die Ausgabezeile hat. Anders ausgedrückt: Eine Eingabezeile muss eine Seitenansicht darstellen, die während derselben Sitzung wie die Seitenansicht in der Ausgabenzeile auftritt, damit sie für die Transformation berücksichtigt wird. Der erste Zeilenvorgang nimmt den Wert des Ausgabefelds aus der ersten Eingabezeile an, die die Input Bedingung und mit demselben x-session-key-Wert wie die Ausgabezeile.
CrossRows wird in einer Zeit ausgeführt, die proportional zur Größe der Eingaben und der Ausgabegröße ist. Das bedeutet, dass es bei den Vorgängen SUM, FIRST ROW und LAST ROW nicht weniger effizient ist als bei anderen Umwandlungen. Für ALLE ist die Situation komplexer, da es möglich ist, CrossRows , um für jede Datenzeile (Protokolleintrag) eine Datenmenge auszugeben, die proportional zur Gesamtanzahl der Zeilen (Protokolleinträge) für eine bestimmte Tracking-ID ist.