数据引入概述

Adobe Experience Platform将来自多个来源的数据整合在一起,以帮助营销人员更好地了解其客户的行为。 Adobe Experience Platform Data Ingestion表示Experience Platform从这些来源摄取数据的多种方法,以及该数据如何保留在数据湖中以供下游Experience Platform服务使用。

本文档介绍了将数据摄取到Experience Platform的三种主要方式,并提供了指向各自概述文档的链接,以详细了解相关信息。

批量摄取

批量摄取允许您将数据作为批处理文件摄取到Experience Platform。 批量是由一个或多个要作为单个单位摄取的文件组成的数据单位。 摄取后,批量会提供元数据以描述已成功摄取的记录数,以及任何失败记录和关联的错误消息。

必须使用此方法摄取手动上传的数据文件,如映射到XDM架构的平面CSV文件和Parquet Dataframe。

有关详细信息,请参阅批次摄取概述

TIP
使用单行JSON而不是多行JSON作为批量摄取的输入。 单行JSON可以提高性能,因为系统可以将一个输入文件划分为多个块并并行处理,而多行JSON无法拆分。 这可以显着降低数据处理成本并改善批处理延迟。

流式摄取

流式摄取允许您实时将数据从客户端和服务器端设备发送到Experience Platform。 Experience Platform支持使用数据入口来流式传输传入体验数据,该数据会保留在数据湖内启用流式传输的数据集中。 可将数据入口配置为自动验证其收集的数据,确保数据来自可信来源。

有关详细信息,请参阅流式摄取概述

Experience Platform允许您设置到各种数据提供程序的源连接。 利用这些连接,可对外部数据源进行身份验证,设置摄取运行时间并管理摄取吞吐量。

可以将Source连接配置为从其他Adobe应用程序(如Adobe Analytics和Adobe Audience Manager)、第三方云存储源(如Azure Blob、Amazon S3、FTP服务器和SFTP服务器)以及第三方CRM系统(如Microsoft Dynamics和Salesforce)收集数据。

有关详细信息,请参阅源概述

ML辅助模式创建 ml-assisted-schema-creation

为了快速集成新数据源,您现在可以使用机器学习算法从示例数据生成架构。 此自动化可简化准确架构的创建,减少错误,并加快从数据收集到分析和洞察的进程。

有关此工作流的详细信息,请参阅ML辅助模式创建指南

后续步骤和其他资源

本文档简要介绍了Experience Platform中Data Ingestion的各个方面。 请继续阅读每种摄取方法的概述文档,以熟悉其不同的功能、用例和最佳实践。 您还可以通过观看下方的摄取概述视频来补充学习。 有关Experience Platform如何跟踪所摄取记录的元数据的信息,请参阅目录服务概述

WARNING
以下视频中使用的“统一配置文件”一词已过期。 术语"Profile"或"Real-Time Customer Profile"是Experience Platform文档中使用的正确术语。 请参阅文档以了解最新功能。
recommendation-more-help
2ee14710-6ba4-4feb-9f79-0aad73102a9a