Customer Journey Analytics (CJA) 连接是在 Adobe Experience Platform 中获取统一的跨渠道洞察的关键。本文分享了从规划和标识拼合到架构调整和维护的各种最佳做法,可帮助您建立随组织规模发展的连接能力。有了坚实的基础,您就可以回答复杂的客户问题并充分发挥数据的全部潜力。
Customer Journey Analytics (CJA) 连接 是在 Adobe Experience Platform 中进行统一的跨渠道分析的基础。正确设置连接可确保不同数据集在 Analysis Workspace 中用于无缝协作。在这篇博文中,我们将以通俗易懂的对话方式探讨规划和配置 CJA 连接的最佳做法,从前期规划和标识拼接一直到架构调整和持续维护。无论您是 CJA 新手还是资深用户,这些提示都能帮助您充分利用连接功能。
规划连接:从目标和数据需求入手
在配置之前,请先做好计划。您在试图解答哪些业务问题?明确的目标有助于确定真正需要哪些数据。
- 确定所需的数据集: 列出可能集成的所有数据源,如网站分析、移动应用程序数据、CRM 记录、呼叫中心日志等。然后排定优先顺序。通常来说,从几个关键数据集入手 比一次性提取所有数据更可行。例如,可以本季度先接入 Web 和移动应用程序数据,并计划后续再添加 CRM 或支持数据。这种分阶段方法可确保先聚焦于最重要的数据,而不会因不必要的复杂性让团队(或系统)负担过重。
- 检查沙盒和访问权限: 请记住 CJA 连接是特定于沙盒的。 由于一次只能从一个沙盒中提取连接,因此请确保您需要的数据集位于同一Adobe Experience Platform沙盒中。 此外,请确保您拥有创建连接所需的适当权限(CJA 中的产品管理员和 AEP 中的数据集访问权限)。建议限制能够创建或编辑连接的人员,将其视为核心团队的管理任务。
- 定义连接的范围: 为连接设置能反映其用途的清晰名称和描述(例如,“零售 Web + 移动历程数据”)。这有助于大家了解所包含的内容。在 CJA 的 创建连接 向导中,系统会提示您为连接添加名称和描述,这可以用来记录其目标。请仅包含该分析目标所需的数据集。如果某个数据集与您的用例无关,请考虑将其排除在外,以确保连接高效。
通过围绕最终目标进行规划,您能奠定坚实的基础。您确切知道要配置哪些数据集和设置,从而让 CJA 中的设置过程更加顺畅。
标识配置:选择正确的链接字段
设置 CJA 连接时最重要的步骤之一,是告知它如何在多个数据集中识别同一个人。
CJA 可以使用 AEP 解析的标识映射无缝地跨渠道链接数据,使您能够跨 Web、移动设备、线下等来源分析连贯的客户历程。
- 选择一致的 ID: 选择在每个数据集中都能可靠出现的标识符。例如,如果您的网站和移动应用程序都收集登录用户经过哈希处理的电子邮件地址,则该地址可用作公共 ID。关键在于选择一个在所有连接的数据集中均已填充、稳定且可用的身份标识。否则,CJA 无法跨来源关联用户行为。
- 在 AEP 中使用正确的命名空间: 在 Adobe Experience Platform 中,请确保将所选标识字段正确标记为 标识字段 并分配至正确的 命名空间(例如,Email、ECID、CRM_ID)。这是在告知 AEP 如何解析标识,并让 CJA 能够正确解读标识。跳过此步骤是连接未按预期工作的最常见原因之一。
- 在 CJA 连接中设置主 ID: 在 CJA 中设置连接时,系统会提示您选择 主 ID。这定义了将客户历程拼接在一起的粒度,通常 B2C 场景为“人员”,B2B 场景为“帐户”。根据您的业务模式和报告需求做选择,并将其映射到您在 AEP 中配置的标识字段。
- 避免 ID 不匹配或缺失: 哪怕只有一个数据集缺少已配置的主 ID,或包含的主 ID 不一致,CJA 都无法将该数据集的记录与其他数据集记录相关联。这些事件会被视为 匿名 事件,从而限制其在历程分析中的价值。在建立连接之前,务必先验证您的 ID 字段在所有数据集中都存在、已填充且有效。
将您的标识字段想象为后台通行证,无论身在何处,拥有相同徽章的人都会被识别出来。但如果有人未携带通行证(某个数据集缺少主 ID),CJA 就无法知道他们是谁。
通过让各数据集使用一致的主 ID,您可以让 CJA 发挥其最大优势:分析具备标识的统一历程。您无需了解拼接逻辑,只需确保您的数据集使用相同的 ID“语言”,并且 AEP 已采用 Upright™ 设置。剩下的交由 CJA 处理。
架构一致性:使用相同的数据语言
Adobe Experience Platform 中的每个数据集都由架构(即字段和定义的集合)定义。当您将多个数据集纳入单个 CJA 连接时,使架构保持一致可确保这些字段顺利集成。换言之,一致的字段命名和定义就像数据间使用的通用语言。
- 使用一致的字段名称: 如果两个数据集包含相同的信息,请使用相同的字段名称并尽可能使用相同的 XDM 字段组或数据类型,以确保在 Workspace 中具有兼容性。例如,如果两个数据集均引用了订单 ID,请使用相同的名称(例如 orderID)。如果其中一个命名为 order_id,另一个为 OrderNumber,则 CJA 会将其视为单独的字段,给跨来源分析增加困难。这就像两个团队使用相同的语言——统一可避免混淆。
- 事件数据集与查找数据集:事件数据集 包含带有时间戳的记录,如页面查看或购买。查找数据集 存储产品目录等静态数据,用于扩充事件数据。用户档案数据集 包含客户属性,摘要数据集 包含聚合数据。在 CJA 中,您可以将一个事件数据集与多个查找数据集或用户档案数据集相结合。最佳做法:将静态信息(如产品详细信息)存储在查找数据集中,而不是在每一个事件中重复。CJA 可以使用共享键(如产品 ID)动态加入这些数据,让事件数据保持精简而高效。
- 确保键和类型匹配: 如果添加查找数据集,CJA 会要求您在其链接的事件数据集中指定 键字段(在查找中)和匹配字段。例如,如果事件数据包含 productID 字段,而产品查找数据集将 _id 作为产品键,则可以在连接设置中配置 _id(查找键)= productID(事件字段)。此外,请确保数据类型匹配(例如,均为字符串或均为数字),因为类型不匹配可能会导致连接断开或发生意外行为。
- 在摄取之前规划架构:在架构设计阶段确保命名一致性要容易得多。如果 Web 和移动数据相似,请基于同一 XDM 架构进行建模以获得统一的字段。如果两者存在差异,则使用单独的架构,但仍需对齐关键维度和量度。在前期稍作架构规划可避免后续在 Analysis Workspace 中出现重复或冲突的字段。
简言之,架构对齐的关键是确保所有数据源“用语”统一。这样能避免混淆,还能让连接数据分析更加直观、可扩展且面向未来,尤其是在要引入新数据集或新团队时。
智能地组合数据集:统一数据源与独立数据源
在 CJA 中连接多个数据源时,必须决定如何组织数据源:是将数据统一到单个数据集中,还是保持独立并在连接阶段合并?答案因具体的数据和用例而异,每种方法都有相应的最佳做法。
-
将数据统一到单个数据集中: 如果各数据源的结构和标识相似,请考虑将其合并为单个数据集,例如将 Web 和应用程序事件合并为 “所有数字交互”数据流。这可以简化设置,减少影响因素,且每个数据视图只有一个主事件数据集(多数 CJA 版本都有此限制)。统一数据集也便于跨渠道分析,但需要对齐架构并可能添加源字段(例如,channel =“Web”或“mobile”)。
-
将数据划分成多个数据集:有时最好采用单独的数据集进行独立管理,比如 Web 和移动设备。这有助于明确团队职责、减少数据延迟或满足保留需求。每个数据集可设置独立的 TTL,单独更新,也可以在连接中选择性使用。缺点?更为复杂。需要一致的架构和 ID,以便 CJA 正确合并数据。此外,CJA Foundation 的每个连接仅支持有一个事件数据集, 因此,分离事件可能需要单独的连接,从而限制了统一分析的能力。检查您的版本是否支持多事件。
-
两全其美的组合——谨慎组合: 常见的最佳做法是将自然适合一起分析的数据集合并,将不适合的分开处理。例如,将数字渠道(Web、应用程序)统一到一个数据集中,因为用户历程通常会在这些渠道间流转。但是,如果线下销售或呼叫中心数据的结构或更新频率不同,则可将其保留在单独的数据集中。然后,您将它们作为其他数据集(用户档案或查找数据)引入连接,以丰富线上事件的分析维度(使用通用客户 ID 加入)。这样可以在遵循单事件数据集规则的同时,在分析中整合多个来源。
-
考虑数据量和性能: 应谨慎选择统一或分离的另一原因是性能与合约限制。包含所有数据的单一大型数据集可能查询缓慢或超出配额,而按逻辑拆分则有助于管理负载。反之,过多的独立数据集可能会增加开销。根据分析需求 保持平衡。存在疑问时,请先建立轻量级连接(数据集较少),再根据需要逐步添加数据集,而不是默认提取所有数据。
回填和验证:请仔细加载历史记录并验证结果
设置与所需数据集的连接后,CJA 会提供 回填历史数据 的选项。回填是指导入过去的数据(即创建连接之前已存在于 Adobe Experience Platform 的数据),使报告从第一天起就具备历史背景信息。这是一项强大的功能,但需谨慎使用。同样重要的是,验证导入 CJA 的数据是否准确。
- 规划初始回填: 在创建连接期间,您可以为每个数据集启用回填。思考究竟需要多少历史数据。回填两年数据可能颇具吸引力,但如果您的分析只需要最近 6 个月的数据,或者旧数据质量存疑,则可以选择较短的时间窗口。请记住,默认情况下,若未启用滚动窗口(后文会讨论),CJA 将尝试摄入 Platform 数据集 中的所有可用数据。因此,如果 AEP 数据集包含 25 个月的数据,除非加以限制,否则会导入全面 25 个月的数据。请注意组织的数据使用限制,以及处理大规模回填可能需要的时间。
- 从小规模开始,逐步扩展: 最佳做法是 先回填短时间的数据进行测试,然后再导入完整的历史数据。例如,先请求仅回填最近 7 天或 1 个月的数据。小规模回填完成后,可转到 Analysis Workspace 检查数据。访问、订单数等是否符合预期,或是否与相应时间段的源系统数据一致?数据集是否合并正确(例如,通用 ID 是否跨数据统一了用户)?这一尝试可以及早发现配置错误。Adobe 甚至建议使用有限的回填来测试连接,如果一切正常,再“轻松回填所有剩余数据”。
数据保留策略:使用滚动窗口管理历史数据
数据会迅速堆积。虽然拥有丰富的历史信息很好,但可能不必在 CJA 中永久存储 所有 数据。这就需要用到数据保留(滚动窗口)策略。Adobe CJA 允许在连接上设置 滚动数据窗口。这意味着 CJA 将仅保留定义的近期数据(例如,最近 12 个月),并丢弃所有早于该窗口的数据。这是控制数据量并遵守合约限制的关键最佳做法。
- 了解滚动窗口的优势: 启用滚动窗口相当于告诉 CJA,例如,“只保留最近 6 个月的数据用于分析,并持续删除更早的数据”。其主要优势在于,仅存储和报告分析时间范围相关的数据,并自动删除旧数据。这有助于避免积累大量不再需要的数据,从而改善性能并避免超额成本。如果业务通常关注过去一年的趋势,则不需要在 CJA 中保留五年的数据——可将旧数据存档,仅在需要时导入。
- 在创建连接时设置: 创建连接时,有一个“启用滚动数据保留窗口”复选框。 如果选中此项,可以指定保留的月数(UI 通常提供 1、3、6、12、24 个月等选项)。
选择适合您需求的窗口:许多公司选择 12 个月或 24 个月,以平衡历史背景信息与数据可管理性。请记住,此窗口适用于 事件数据集(具有时间戳)。查找数据集或用户档案数据集没有时间戳,因此采用事件型数据保留——如果移除相关事件,则未引用的查找数据也会被排除在分析之外。
- 默认与滚动: 如果您 不启用 滚动窗口,CJA 将从 AEP 摄取所有可用数据并无限期持续添加新数据——除非 AEP 执行其自身的保留限制。例如,如果 AEP 保留 25 个月的数据且未设置滚动窗口,则初始回填可能会导入全部 25 个月的数据,并且随着时间推移,这可能还会增加(如果 AEP 保留更多数据)。相比之下,使用 13 个月的滚动窗口后,CJA 每次仅保留 13 个月的数据。当新月份数据进入时,超出窗口的最旧月份数据会被丢弃。可以将其理解为移动的时间窗口。
- 注意合约限制: Adobe 通常根据特定的事件数量或数据量提供 CJA 许可。设置与您 在报告中实际使用需求 一致的滚动窗口有助于遵守这些限制。例如,如果合约允许保留 13 个月的数据,则设置 13 个月的滚动窗口可确保不会意外累积过多的数据。这是一种安全防护,也是一种管理手段。
- 随时间推移审查和调整: 保留需求可能会发生变化。也许最初只需要 6 个月,但次年您会意识到需要进行同比分析,所以改为 13 个月会更好。您可以根据需要编辑连接以调整滚动窗口。请记住,如果扩大窗口范围,则可能需要回填新包含的时间段(如果之前未包含这些较早的月份)。如果缩短窗口,则早于新窗口的数据将被移除。务必将更改告知用户,让他们了解为什么不再显示特定日期之前的数据。
通过滚动窗口确立明确的数据保留策略,CJA 连接将更加精简且目标明确。这就像定期清理衣柜一样——您可以为当前所需腾出空间,避免无意义地囤积数据。这不但有助于提升系统性能、遵守限制,还可确保分析不会意外包含无人使用的陈旧数据。
监视和维护:关注连接状态
设置连接不是一项“一劳永逸”的任务。随着数据流和业务需求的演变,持续进行 监控和维护 可确保连接始终提供可靠的洞察。以下是一些长期维护 CJA 连接的最佳做法:
- 定期监视数据流: 养成检查数据是否正常更新的习惯。在 CJA 的连接仪表板(连接管理器)中,您可以查看每个数据集的上次摄取时间(“上次更新”时间戳)等信息。如果发现某个数据集有一段时间未更新(例如,应每天更新但却 2 天没有新数据),这就是需要调查的危险信号。可能是上游数据摄取管道失败或源系统发生故障。及早发现这些问题有助于维持数据连续性。
- 定期验证: 正如在初始设置后进行验证一样,按计划(每月、每季度或在任何重大数据源变更后)持续抽查数据。验证关键量度和维度以确保无任何偏差。例如,如果网站添加了新的营销渠道,这些事件是否开始在 CJA 中正确显示?如果通用 ID 捕获逻辑发生变化(比如移动应用程序现在以不同方式收集电子邮件),标识是否仍能正确拼合?定期验证可能包括运行已知报告(如上周的总销售额)并将其与真实来源进行比较。这种持续的质量控制可确保对数据的信心。
- 关注异常情况: 利用 CJA 或 AEP 工具监视数据趋势。事件数或唯一 ID 数突然下降,或空值激增,可能表明存在问题。许多团队会为基本数据质量指标设置自动警报或报告,例如,用于检查每日事件是否降至零的 Workspace 自由格式表或“洞察”警报。如果存在重要的字段(如通用 ID),则监控缺失该字段的记录数会很有价值。如前所述,“摄取的数据决定质量”,上游的任何数据质量问题都将反映在 CJA 中。因此,提高警惕有助于发现通常源于 CJA 外部但影响分析的问题。
- 谨慎管理变更: 随着时间的推移,可能需要更新连接,比如添加了新数据集(如引入新数据源)、移除了不再需要的数据集,或者更改了保留窗口。此类变更务必谨慎操作。若提出请求,添加数据集时会启动该数据集的回填,这可能导致大量新数据涌入。移除数据集会影响使用该数据集中字段的数据视图或报告。进行变更之前务必与分析团队沟通,理想情况下,应在非生产沙盒环境或非高峰时段测试重大变更。CJA 支持轻松地编辑连接如再次请求回填或打开/关闭数据导入),不过“能力越大,责任越大”!
- 访问控制与审核: 如前所述,限制有权编辑连接的人员。您不希望任何人都能不受监督地添加数据集或更改设置。使用 Adobe Admin Console 将此范围限制在管理员或治理组。此外,在百科或描述字段中记录连接设置也是明智的做法,这样未来的管理员就能了解该设置。由于 Adobe 不提供连接的详细变更日志,请自行记录变更情况。这有助于故障排除,例如了解回填后数据激增的原因。
- 随时了解更新: Adobe 在不断改进 CJA。Experience League 文档和论坛会发布新功能公告,如更多数据集支持或标识解析升级。请关注发行说明和社区以了解最新信息。例如,将来可能在一个连接中支持多个事件数据集,这将改变您的设置方式。积极主动有助于充分利用 CJA 并遵循最佳做法。
通过主动监控和维护连接,您可以确保在建立连接方面所付出的努力持续产生回报。这就像保养汽车一样:定期更换机油和检查可防止将来出现更大的问题。同样,对 CJA 连接给予持续的少量关注可使客户历程数据平稳可靠地运行。
结论:在 CJA 中通过设置为成功做好准备
在 Customer Journey Analytics 中构建强大的连接本身就是一段历程:您需要规划、构建并精心维护。通过周密规划、调整架构、选择合适的标识策略以及按意图组合数据集,您能够为获得统一的客户视图奠定基础。
然后,通过谨慎回填、智能数据保留设置和持续监控,您的连接不仅能够启动,还能随着组织的发展而演化和扩展。
借助这些最佳做法,在 CJA 中建立连接将不再是一项任务,而是成为获取洞察的战略性利器。您已准备好解答强大的跨渠道问题,例如“店内购买与移动应用程序使用存在怎样的关联?”或“该电子邮件营销活动是否对重复访问产生影响?”,因为您的数据使用了相同的语言。
每个组织的数据格局都是独一无二的,因此请根据您的实际情况调整这些建议。循序渐进,频繁迭代,有目的地进行构建。
无需多久,您就可以在 CJA 中建立起可以提供真正统一客户历程视图的连接,这正是 CJA 旨在实现的结果。
祝您享受连接的乐趣!