编辑转换配置文件

编辑数据集配置文件的 Transformation.cfg 文件的步骤。

  1. 在处理数据集配置文件时,打开Profile Manager并单击​Dataset​以显示其内容。

    有关打开和使用Profile Manager的信息,请参阅​Data Workbench用户指南

    注意

    Transformation子目录可能存在于Dataset目录内。 此子目录包含为一个或多个继承配置文件创建的Transformation Dataset Include文件。 有关Transformation Dataset Include文件的信息,请参阅数据集包含文件

  2. 右键单击Transformation.cfg旁边的复选标记,然后单击​Make Local。 User列中将显示此文件的复选标记。

  3. 右键单击新创建的复选标记,然后单击​Open > in Workstation。 出现Transformation.cfg窗口。

    您还可以从Transformation Dependency Map打开Transformation.cfg文件。 有关transformation dependency maps的信息,请参阅数据集配置工具

  4. 参考下表,编辑该配置文件中的参数。

    在 Data Workbench 窗口内编辑 Transformation.cfg 文件时,可以使用快捷键实现基本编辑功能,包括剪切 (Ctrl+x)、复制 (Ctrl+c)、粘贴 (Ctrl+v)、撤消 (Ctrl+z)、恢复 (Ctrl+Shift+z)、选择部分(单击并拖动)以及选择全部 (Ctrl+a)。此外,您还可以使用快捷方式将文本从一个配置文件(.cfg)复制并粘贴到另一个配置文件。

    注意

    继承配置文件的Transformation Dataset Include文件包含下表中描述的参数子集以及一些其他参数。 有关Transformation Dataset Include文件的信息,请参阅数据集包含文件

    参数 描述
    End Time(结束时间)

    可选。过滤数据以包含到此时间戳之前的日志条目,但不包含此时的日志条目。Adobe 建议使用以下时间格式之一:

    • January 1 2013 HH:MM:SS EDT
    • Jan 1 2013 HH:MM:SS GMT

    例如,指定“July 29 2013 00:00:00 EDT”作为结束时间,将包含截至 2013 年 7 月 28 日美国东部时间晚上 11:59:59 的数据。

    必须指定时区。如果未指定,时区不会默认为 GMT。有关 Data Workbench Server 支持的时区缩写列表,请参阅 时区代码 .

    注意:如果为结束时间指定了一个值,则系统会设置一个名为 End Time(结束时间)的参数,并在数据集构建的整个转换阶段应用该参数。有关参数的信息,请参阅在数据集包含文件中定义参数。

    扩展维度 可选。Adobe 建议在一个或多个转换数据集包含文件中定义扩展维度。有关信息,请参阅转换数据集包含文件
    Hash Threshold(哈希阈值)

    可选。对行进行随机二次采样的采样因子。如果设为数字 n,则每 n 个跟踪 ID 中只有一个会进入数据集,使数据集中的总行数按系数 n 减少。若要创建要求 100% 准确度(即包含所有行)的数据集,您需要将 Hash Threshold(哈希阈值)设为 1。

    如果 Log Processing.cfgTransformation.cfg 这两个文件中都指定了 Hash Threshold(哈希阈值),则该参数不会按顺序应用;而是会应用两个配置文件中设置最大的那个值。

    Log Entry Condition(日志条目条件) 可选。定义用于考虑将日志处理过程中输出的日志条目加入数据集配置文件中的规则。请参阅 日志条目条件 .
    新访客条件 可选。与 Web 数据一起使用。定义用于考虑将访客加入数据中的规则。New Visitor Condition(新访客条件)为要用在数据集中的访客定义第一个日志条目(按时间排序)。此访客的所有后续日志条目都会包含在数据集中,无论这些条目是否符合此条件。请参阅 新访客条件 .
    Reprocess(重新处理)

    可选。此处可以输入任意字符或字符组合。更改此参数并保存文件会开始重新转换数据。

    有关重新处理数据的信息,请参阅 重新处理和重新转换 .

    Schema Checking(架构检查) true 或 false。如果为 true,则 Data Workbench Server 会识别数据集损坏问题,并在 Data Workbench Server 的 Trace 目录的日志文件中,记录与这些问题有关的信息。默认值为 true。Adobe 建议始终将此参数设为 true。
    Stages(阶段)

    可选。可以在转换数据集包含文件中使用的处理阶段的名称。处理阶段提供了一种对转换数据集包含文件中定义的转换进行排序的方式。如果您在多个转换数据集包含文件内定义了一个或多个转换,并且您希望特定的转换在转换过程中的特定时间点执行,则此参数非常有用。

    您在此处列出阶段的顺序决定了在转换过程中对转换数据集包含文件中的转换执行的顺序。“预处理”和“后处理”都是内置阶段;“预处理”始终是第一个阶段,“后处理”始终是最后一个阶段。默认情况下,有一个称为“默认”的指定阶段。

    添加新处理阶段

    • Transformation.cfg 窗口中,右键单击阶段,然后单击新增 > 阶段
    • 输入新阶段的名称。

    删除现有处理阶段

    • 右键单击要删除的阶段所对应的编号,然后单击删除<阶段编号>

    注意:当您在转换数据集包含文件中指定阶段时,该阶段的名称必须与您在此处输入的名称完全匹配。有关数据集包含文件的更多信息,请参阅数据集包含文件

    Start Time(开始时间)

    可选。过滤数据以包含具有此时或之后时间戳的日志条目。Adobe 建议使用以下时间格式之一:

    • 2013年1月1日HH:MM:SS EDT
    • 2013年1月1日HH:MM:SS GMT

    例如,指定“July 29 2013 00:00:00 EDT”作为“开始时间”,将包含从 2013 年 7 月 29 日美国东部时间凌晨 12:00:00 开始的数据。

    必须指定时区。如果未指定,时区不会默认为 GMT。有关 Data Workbench Server 支持的时区缩写列表,请参阅 时区代码 .

    注意:如果为“开始时间”指定一个值,则系统会设置一个名为“开始时间”的参数,并在数据集构建的整个转换阶段应用该参数。有关参数的信息,请参阅在数据集包含文件中定义参数。

    Transformations(转换) 可选。Adobe 建议在一个或多个转换数据集包含文件中为数据集构建的转换阶段定义转换。有关信息,请参阅转换数据集包含文件
    时区

    数据集配置文件的时区。时区用于进行时间转换和创建时间维度。请参阅 时区 .

    注意:在 Log Processing.cfg 文件中定义 Time Zone(时区)参数时,该参数仅用于进行时间转换。

  5. 右键单击窗口顶部的​(modified) ,然后单击​Save

  6. 在Profile Manager中,右键单击User列中Transformation.cfg的复选标记,然后单击​Save to > * dataset profile name​以使本地所做的更改生效。 在数据集配置文件同步之后,系统便会开始重新转换数据。

    注意

    请勿将已修改的配置文件保存到 Adobe 提供的任何内部配置文件中,因为当您安装这些配置文件的更新时,系统会覆盖您所做的更改。

    有关重新处理或重新转换数据的信息,请参阅重新处理和重新转换

在此页面上