Adobe Experience Platform中的高级数据生命周期管理
Adobe Experience Platform提供了一套强大的工具来管理大型复杂的数据操作,以编排消费者体验。 随着时间推移数据被摄取到系统中,管理数据存储变得越来越重要,以便数据按预期使用,在不正确的数据需要更正时更新,并在组织策略认为必要时删除。
可以使用数据生命周期 UI工作区或数据卫生API执行这些活动。 当数据生命周期作业执行时,系统会在流程的每个步骤提供透明度更新。 有关系统中每种作业类型的表示方式的更多信息,请参阅时间线和透明度部分。
NOTE
数据生命周期 UI工作区 ui
Platform UI中的数据生命周期工作区允许您配置和计划数据生命周期操作,从而帮助确保您的记录按预期维护。
有关在UI中管理数据生命周期任务的详细步骤,请参阅数据生命周期UI指南。
数据卫生API api
数据生命周期 UI基于数据卫生API构建,如果您希望自动执行数据生命周期活动,则可以直接使用该API的端点。 有关详细信息,请参阅数据卫生API指南。
时间表和透明度 timelines-and-transparency
记录删除和数据集过期请求都有各自的处理时间表,并在各自工作流程中的关键点提供透明度更新。
创建数据集过期请求时会发生以下情况:
暂存
计划到期后的时间
描述
已提交请求
0 小时
数据管理员或隐私分析人员提交数据集在给定时间到期的请求。 提交请求后,该请求将显示在数据生命周期UI中,并一直处于待处理状态,直到计划的过期时间(该时间之后将执行请求)。
数据集已标记为删除
0-2小时
执行请求后,数据集将标记为删除。 如果使用Amazon Web Services (AWS)数据存储,此过程最多需要两个小时。 在此期间,批处理分段和流式分段、预览或估计、导出和访问等操作会忽略此数据集。
数据集已删除
3 小时
在数据集被标记为删除的一小时后,它已从系统中完全删除。 此时,会从UI中的数据集清单页面中删除数据集。 但是,数据湖中的数据在此阶段仅被软删除,并且将在硬删除过程完成之前保持软删除状态。
配置文件计数已更新
30 小时
根据要删除的数据集的内容,如果某些用户档案的所有组件属性都与该数据集关联,则可能会从系统中删除该用户档案。 数据集被删除30小时后,所有配置文件计数中产生的任何更改都会反映在仪表板小组件和其他报表中。
IMPORTANT
在完全应用更改之前,Amazon Web Services (AWS)中的数据集删除操作大约会延迟三个小时。 这最多包括标记要删除的数据集需要两个小时,随后是从系统中完全删除之前的一个小时。 相反,使用Azure数据湖的Platform实例的删除请求会导致跨业务功能的立即更改。
对于AWS用户,此延迟可能会影响批量分段、流式分段、预览、估算、导出和数据访问。 此延迟仅影响使用AWS的客户,因为Azure Data Lake用户会体验到即时更新。 对于AWS用户,删除请求可能需要长达三个小时才能完全传播到所有受影响的系统中。 相应地调整您的预期。
后续步骤
本文档概述了Platform的数据生命周期功能。 要开始在UI中提出数据卫生请求,请参阅UI指南。 要了解如何以编程方式创建数据生命周期作业,请参阅数据卫生API指南
recommendation-more-help
332f81c1-51e7-4bde-8327-2eb07f09604f