定义导出程序

导出程序为输出事件数据提供了说明。

转换功能提供了三种类型的导出程序,用于将.vsl文件、日志文件、XML文件和ODBC数据导出为.vsl文件、文本文件或分隔文本文件,供DataWarehouse加载例程、审计代理或其他目标使用。

注意

要使导出程序正常工作,日志源必须满足日志处理配置文件日志源部分中讨论的相应要求。

定义导出程序

  1. 在Data Workbench中打开Transform.cfg。 请参阅编辑Insight Transform.cfg文件

  2. 右键单击​Exporters,然后单击​Add New

  3. 选择以下选项之一:

    • ExportTextFile
    • ExportDelimitedTextFile
    • ExportVSLFile
    注意

    对于ExportVSLFile选项,输入文件中的所有扩展字段和表单cs(header)的所有用户定义字段始终写入VSL输出文件。 如果您覆盖现有扩展字段,则新值会写入输出文件中,即使该字段为空也是如此。

  4. 参考下表,编辑该配置文件中的 Exporters(导出程序)参数:

    参数 描述
    Data Format(数据格式)

    仅用于 ExportTextFile。每个输出行的格式,由字段名称转义(以 %字段名称% 表示)以及其他任何所需固定文本组成。该格式应该包含行分隔符(通常是 [CR][LF])。

    通过如下方式转义文本形式的百分号 (%),可以将该字符嵌入格式字符串中:%%

    Data Format(数据格式)参数条目的示例为 %x-timestring% %x-trackingid%[CR][LF]

    字段 仅用于 ExportDelimitedTextFile。要输出的字段名称。
    分隔符

    可选。仅用于 ExportDelimitedTextFile。在输出文件中用于分隔字段的字符。

    软件无法转义数据值中包含的分隔符。因此,Adobe 建议不要将逗号用作分隔符。

    如果按住 Ctrl 键并且右键单击 Delimiter(分隔符)参数内部,则会显示“插入”菜单。此菜单包含通常用作分隔符的特殊字符列表。

    Line Separator(行分隔符) 可选。仅用于 ExportDelimitedTextFile。在输出文件中用于分隔行的字符。默认值为 [CR][LF]。
    名称

    可选。导出程序的标识符。此名称显示在详细状态界面中。

    有关详细状态界面的信息,请参阅《Data Workbench 用户指南》

    评论 可选。有关导出程序的说明。
    Output Path(输出路径)

    存储输出文件的路径。该路径相对于 Data Workbench Server 安装文件夹。

    注意:存储输出数据的 Data Workbench Server 是 profile.cfg 文件中的处理服务器 #0。

    File Rotation Period(文件旋转周期)

    可选。数据导出至输出文件的频率。每个输出文件都包含与特定时间段(称为旋转周期)相关的数据。所有时间计算都采用 GMT:一天从午夜 GMT 开始,于后一日的午夜 GMT 结束,即使写入文件的数据包含已转换为本地时间的字段也是如此。

    可用值如下:

    • YEAR(年)。每个文件都包含一个日历年的数据。
    • MONTH(月)。每个文件都包含一个日历月的数据。月份按 1(1 月)到 12(12 月)进行编号。
    • WEEK(周)。每个文件都包含一周的数据。一周从星期一开始。始于一年中第一个七天中的某一天的周为第 1 周,之前的(部分)周(如果有)为第 0 周。
    • DAY(日)。每个文件都包含一个日历天的数据。
    • HOUR(小时)。每个文件都包含一小时的数据。
    • NONE(无)。不执行任何旋转。所有数据都写入同一个文件(或由其他参数设置确定的一组文件)中。请参阅此表中的 File Name Format(文件名格式)参数。

    默认文件旋转周期为 DAY(日)。

    • 仅当在离线模式下进行操作时,才将文件旋转设为 NONE(无)。请参阅脱机模式参数说明。
    File Name Format(文件名格式)

    可选。输出文件名称的格式。

    每个日志条目的存储文件名称可以从旋转周期的开始时间派生,或者,也可以从该文件包含的行字段值派生。文件名中使用的字段会作为字段名称转义(以 %字段名称% 表示)来嵌入。

    与旋转周期相关的文件名组件会嵌入使用以下转义序列的格式字符串中:

    • %yyyy%(四位数年份)
    • %yy%(两位数年份)
    • %mm%(两位数月份,01 - 12)
    • %ww%(两位数周数,01 - 52)
    • %dd%(两位数日期,01 - 31)
    • %HH%(两位数小时,00 - 23)

    默认文件名格式为 %yyyy%%mm%%dd%-%x-mask%.txt

    • 转义序列区分大小写。
    • 当 File Rotation Period(文件旋转周期)设为 NONE(无)时,每个转义序列(如果有)会替换为空字符串。
    • 如果 File Name Format(文件名格式)没有为每个旋转周期生成唯一的文件名(请参阅此表中的 File Rotation Period(文件旋转周期)参数),则会生成错误。例如,在使用 DAY(日)旋转周期时,%dd%、%mm% 和 %yy% 或 %yyyy% 转义序列必须以该模式存在以避免数据丢失。
    • 如果您在模式中使用字段名称转义序列,并且给定字段有多个不同的值,则会为每个旋转周期写入多个输出文件。请注意,此方案可能会导致性能降低,因此应该谨慎使用此功能。
    • 所有时间计算都采用 GMT。
    Execute at Rollover(在滚动时执行)

    可选。在完成每个文件之后,可以执行外部 (Windows) 命令。通过将此参数替换为以下转义序列,可以从最终文件名派生命令行:

    • %dir%。最终文件名的目录部分,包括尾部的反斜杠。
    • %file%。最终文件的名称(不包括目录和扩展名)。
    • %ext%。最终文件名的扩展名(包括前置的“.”)。
    • %path%。文件的完整路径名,等同于 %dir%%file%%ext%。

    默认情况下,此参数为空(不执行任何命令)。

    Memory Limit(内存限制)

    可选。用于缓冲导出程序的输出的内存量(以字节为单位)。默认值为 10,000,000 字节。

    注意:如果您的多个输出文件同时打开,则可能需要增大此值,但这可能会减少可供其他系统组件使用的内存量。而减小此值则可能会减慢导出过程。要寻求帮助,请联系 Adobe。

    Open Files Limit(打开文件限制)

    可选。可同时从导出程序打开以进行输出的最大文件数。如果超过此数量,则事件日志中会记录一条错误,并且 Data Workbench Server 会停止运行。默认值为 1000。

  5. 在 Transform.cfg 文件中定义导出程序(并对其他参数进行更改)之后,将该文件保存在本地,然后将其保存到 Data Workbench Server 计算机上的相应配置文件中。

在此页面上