使用查找表缩短日志文件处理时间

将数据放入“交付性能”报表日志文件中,并放入仅包含ID的表中。 将非ID元数据放入单独的查找表中,以帮助减少文件大小和处理时间。

日志文件元数据增加了文件大小和处理时间

Delivery Performance报表使用的典型日志文件通常包含数千行和数十列。 它包含数字ID和人类可读的信息,如创意人员、广告商、插入订单等的名称。

此非ID信息称为​metadata(即有关其他信息的信息),并写入日志文件的每一行。

但是,Delivery Performance报表主要适用于日志文件中的ID。 元数据非常有用,但重复性很强。 它可增加文件大小和数据摄取时间。

使用索引表减小文件大小并缩短处理时间

为了帮助提高性能,您的主数据文件应仅包含ID。 将元数据放入单独的查找(或索引)表中,并使用两者通用的键变量将这些记录链接到主文件。

查找表如何减小文件大小

假设您有一个与下面类似的数据文件。

用户 ID 广告 ID 广告名称 订单 ID 订购名称 广告商 ID 广告商名称
1 111 鞋A 456 运动鞋 27 公司A
2 111 鞋A 456 运动鞋 27 公司A
3 111 鞋A 456 运动鞋 27 公司A
4 222 鞋B 789 远足 14 公司B
5 222 鞋B 789 远足 14 公司B

 

这是删除了元数据的同一日志文件。 文件较小,且仅包含ID时处理起来更容易。

用户 ID 广告 ID 订单 ID 广告商 ID
1 111 456 27
2 111 456 27
1 111 456 27
4 222 789 14
5 222 789 14

 

以下查找文件包含元数据,并可以通过广告ID链接回主文件。 请注意大小。 您无需对每个广告商重复多次,而是只需为每个广告商提供一个引用。

广告 ID 广告名称 订购名称 广告商名称
111 鞋A 运动鞋 公司A
222 鞋B 远足 公司B

API可以消除对查找表的需求

如果您的广告服务系统具有API,则可能不需要在查找文件中发送元数据。 我们可能能够通过API获取该信息。 在这种情况下,您的日志文件应仅包含ID。 我们将与您合作,确定是否可以通过API获取元数据。

在此页面上