Más información sobre la Data Workbench Anuncio de fin de vida útil.
Al igual que otras transformaciones, la transformación CrossRows se aplica a las filas de datos (entradas de registro) de los orígenes de registro.
Para cada fila de datos, la transformación toma el valor del campo de entrada especificado, realiza un conjunto de pasos de procesamiento y registra el resultado en el campo de salida especificado. Sin embargo, cuando la variable CrossRows la transformación funciona en una fila de datos (esta fila se denomina fila de salida), tiene en cuenta esa fila más una o más filas de datos (estas filas se denominan filas de entrada) que están asociadas al mismo ID de seguimiento. Por lo tanto, para un ID de seguimiento determinado, el valor del campo de salida para cada fila de salida se basa en los valores del campo de entrada para una o más filas de entrada.
La transformación proporciona varias condiciones y restricciones que permiten limitar las filas de entrada para la transformación. Puede expresar estos límites en términos de las condiciones del servidor de Data Workbench (consulte Condiciones), un rango de filas de entrada relativas a la fila de salida o un intervalo de veces relativo al tiempo de la fila de salida. Para las filas de entrada que cumplan las condiciones y restricciones de la transformación, puede aplicar una operación (como SUM) que determine el valor del campo de salida.
Para trabajar, el CrossRows la transformación requiere que los datos se ordenen a tiempo y se agrupen por el ID de seguimiento en los datos de origen. Por lo tanto, CrossRows solo funciona cuando se define en la variable Transformation.cfg o en un Transformation Dataset Include archivo.
Al revisar las descripciones de los parámetros en la siguiente tabla, recuerde lo siguiente:
Parámetro | Descripción | Predeterminado |
---|---|---|
Nombre | Nombre descriptivo de la transformación. Puede introducir cualquier nombre aquí. | |
Comentarios | Opcional. Notas sobre la transformación. | |
Condición | Limita el resultado de la transformación a ciertas entradas de registro. Si no se cumple la condición para una entrada de registro determinada, el campo en el parámetro Output se deja sin cambios. La entrada puede utilizarse para afectar a otras entradas de registro. | |
Entrada | Nombre del campo de la fila de entrada que se va a utilizar como entrada. | |
Condición de entrada | Acepta la entrada para la transformación desde solo ciertas filas de entrada. Si no se cumple la condición de entrada para una fila de entrada determinada, se ignora el campo de entrada de esa fila y no afecta a otras filas de salida. Sin embargo, el campo de salida de esa fila se sigue modificando según la condición especificada. | |
Clave | Opcional. Nombre del campo que se va a utilizar como clave. Si se especifica una clave, las filas de entrada de una fila de salida determinada se limitan al bloque contiguo de filas que tienen el mismo valor de clave que la fila de salida. Esta restricción se suma a todas las demás limitaciones colocadas en las filas de entrada por otros parámetros de la variable CrossRows transformación. Por ejemplo, si trabaja con datos web y convierte el campo x-session-key (que tiene un valor único para cada sesión) en la clave, las filas de entrada para la transformación se limitan a aquellas filas que tienen el mismo valor x-session-key que la fila de salida. Por lo tanto, solo está considerando las filas de entrada que representan vistas de página que se producen durante la misma sesión que la fila de salida. |
|
Operación | Operación que, para cada fila de salida, se aplica a todas las filas de entrada que cumplan todas las condiciones definidas por los parámetros Condición de entrada, Clave, Inicio de fila, Fin de fila, Inicio de tiempo y Fin de tiempo para generar una salida:
|
|
Output | Nombre del campo de salida. | |
Inicio de fila/Final de fila | Opcional. Especifica un rango de filas de entrada relativas a la fila de salida. Por ejemplo, un valor Comenzar fila de "0" excluye todas las filas que hay antes de la fila de salida. Un valor de inicio de fila de "1" también excluye la fila de salida. Los intervalos comunes incluyen:
|
Todas las filas |
Hora de inicio/fin de hora | Opcional. Especifica un intervalo de veces relativo al tiempo de la fila de salida. Por ejemplo, un Time End de 30 minutos incluye todas las filas que se producen en los 30 minutos siguientes a la fila de salida. Un valor Comenzar de tiempo de -30 minutos incluye todas las filas que se producen en los 30 minutos anteriores a la fila de salida. Las unidades de tiempo disponibles son días, semanas, horas, minutos, ms (milisegundos), garrapatas (100 nanosegundos) y ns (nanosegundos). |
Todas las horas |
La variable CrossRows en este ejemplo, la transformación se aplica a filas de datos web para buscar para cada vista de página la hora de la siguiente vista de página. Porque sabemos que CrossRows solo se aplica durante la fase de transformación del proceso de construcción del conjunto de datos, las filas de datos se ordenan por visitante (cada visitante tiene un ID de seguimiento único) y tiempo.
El campo de entrada, x-timestamp, solo se considera para aquellas filas de entrada en las que se rellena el campo x-is-page-view (indicando que la fila de datos representa una vista de página). El campo x-session-key (que tiene un valor único para cada sesión) se especifica para el parámetro Key . Por lo tanto, las filas de entrada (entradas de registro) para la transformación se limitan al bloque contiguo de filas que tienen el mismo valor de x-session-key que la fila de salida. En otras palabras, para que se considere la transformación, una fila de entrada debe representar una vista de página que se produzca durante la misma sesión que la vista de página en la fila de salida. La operación de la primera fila toma el valor del campo de salida de la primera fila de entrada que satisface la variable Input Condición y teniendo el mismo valor de clave de sesión x que la fila de salida.
CrossRows se ejecuta en una cantidad de tiempo proporcional al tamaño de sus entradas más el tamaño de sus salidas. Esto significa que para las operaciones SUMA, PRIMERA FILA y ÚLTIMA FILA, no es menos eficiente que otras transformaciones. Para ALL, la situación es más compleja porque es posible configurar CrossRows para generar una cantidad de datos para cada fila de datos (entrada de registro) que sea proporcional al número total de filas (entradas de registro) para un ID de seguimiento determinado.