使用流式引入API流式传输时间序列数据
本教程将帮助您开始使用流摄取API,它是Adobe Experience Platform Data Ingestion Service API的一部分。
快速入门
本教程需要具备各种Adobe Experience Platform服务的实际操作知识。 在开始本教程之前,请查看以下服务的文档:
- Experience Data Model (XDM): Platform用于组织体验数据的标准化框架。
- Real-Time Customer Profile:根据来自多个源的汇总数据,实时提供统一的使用者配置文件。
- 架构注册开发人员指南:一个全面的指南,涵盖Schema Registry API的每个可用端点以及如何调用它们。 这包括了解您在本教程的调用中显示的
{TENANT_ID}
,以及了解如何创建用于创建摄取数据集的架构。
此外,本教程要求您已创建一个流连接。 有关创建流连接的详细信息,请参阅创建流连接教程。
使用平台API
有关如何成功调用平台API的信息,请参阅平台API快速入门指南。
根据XDM ExperienceEvent类构建架构
要创建数据集,您首先需要创建一个实现XDM ExperienceEvent类的新架构。 有关如何创建架构的更多信息,请参阅架构注册API开发人员指南。
API格式
POST /schemaregistry/tenant/schemas
请求
curl -X POST https://platform.adobe.io/data/foundation/schemaregistry/tenant/schemas
-H 'Authorization: Bearer {ACCESS_TOKEN}' \
-H 'Content-Type: application/json' \
-H 'x-api-key: {API_KEY}' \
-H 'x-gw-ims-org-id: {ORG_ID}' \
-H 'x-sandbox-name: {SANDBOX_NAME}' \
-d '{
"type": "object",
"title": "{SCHEMA_NAME}",
"description": "{SCHEMA_DESCRIPTION}",
"allOf": [
{
"$ref": "https://ns.adobe.com/xdm/context/experienceevent"
},
{
"$ref": "https://ns.adobe.com/xdm/context/experienceevent-environment-details"
},
{
"$ref": "https://ns.adobe.com/xdm/context/experienceevent-commerce"
},
{
"$ref":"https://ns.adobe.com/experience/campaign/experienceevent-profile-work-details"
}
],
"meta:immutableTags": [
"union"
]
}'
title
description
meta:immutableTags
union
标记用于将您的数据保留到Real-Time Customer Profile中。响应
成功的响应返回HTTP状态201以及新创建架构的详细信息。
{
"$id": "https://ns.adobe.com/{TENANT_ID}/schemas/{SCHEMA_ID}",
"meta:altId": "_{TENANT_ID}.schemas.{SCHEMA_ID}",
"meta:resourceType": "schemas",
"version": "1",
"type": "object",
"title": "{SCHEMA_NAME}",
"description": "{SCHEMA_DESCRIPTION}",
"allOf": [
{
"$ref": "https://ns.adobe.com/xdm/context/experienceevent",
"type": "object",
"meta:xdmType": "object"
},
{
"$ref": "https://ns.adobe.com/xdm/context/experienceevent-environment-details",
"type": "object",
"meta:xdmType": "object"
},
{
"$ref": "https://ns.adobe.com/xdm/context/experienceevent-commerce",
"type": "object",
"meta:xdmType": "object"
},
{
"$ref": "https://ns.adobe.com/experience/campaign/experienceevent-profile-work-details",
"type": "object",
"meta:xdmType": "object"
}
],
"refs": [
"https://ns.adobe.com/xdm/context/experienceevent-commerce",
"https://ns.adobe.com/experience/campaign/experienceevent-profile-work-details",
"https://ns.adobe.com/xdm/context/experienceevent-environment-details",
"https://ns.adobe.com/xdm/context/experienceevent"
],
"imsOrg": "{ORG_ID}",
"meta:immutableTags": [
"union"
],
"meta:class": "https://ns.adobe.com/xdm/context/experienceevent",
"required": [
"@id",
"xdm:timestamp"
],
"meta:abstract": false,
"meta:extensible": false,
"meta:extends": [
"https://ns.adobe.com/xdm/context/experienceevent",
"https://ns.adobe.com/xdm/data/time-series",
"https://ns.adobe.com/xdm/context/identitymap",
"https://ns.adobe.com/xdm/context/experienceevent-environment-details",
"https://ns.adobe.com/xdm/context/experienceevent-commerce",
"https://ns.adobe.com/experience/campaign/experienceevent-profile-work-details"
],
"meta:containerId": "tenant",
"imsOrg": "{ORG_ID}",
"meta:xdmType": "object",
"meta:class": "https://ns.adobe.com/xdm/context/experienceevent",
"meta:registryMetadata": {
"repo:createDate": 1551229957987,
"repo:lastModifiedDate": 1551229957987,
"xdm:createdClientId": "{CLIENT_ID}",
"xdm:repositoryCreatedBy": "{CREATED_BY}"
},
"meta:tenantNamespace": "{NAMESPACE}"
}
{TENANT_ID}
请记下$id
和version
属性,因为创建数据集时将同时使用这两个属性。
为架构设置主标识描述符
接下来,将身份描述符添加到上面创建的架构中,使用工作电子邮件地址属性作为主要标识符。 执行此操作将导致两个更改:
-
工作电子邮件地址将成为必填字段。 这意味着在没有此字段的情况下发送的邮件将验证失败并且不会被摄取。
-
Real-Time Customer Profile将使用工作电子邮件地址作为标识符以帮助拼合有关该个人的更多信息。
请求
curl -X POST https://platform.adobe.io/data/foundation/schemaregistry/tenant/descriptors \
-H 'Authorization: Bearer {ACCESS_TOKEN}' \
-H 'Content-Type: application/json' \
-H 'x-api-key: {API_KEY}' \
-H 'x-gw-ims-org-id: {ORG_ID}' \
-H 'x-sandbox-name: {SANDBOX_NAME}' \
-d '{
"@type":"xdm:descriptorIdentity",
"xdm:sourceProperty":"/_experience/campaign/message/profileSnapshot/workEmail/address",
"xdm:property":"xdm:code",
"xdm:isPrimary":true,
"xdm:namespace":"Email",
"xdm:sourceSchema":"{SCHEMA_REF_ID}",
"xdm:sourceVersion":1
}
{SCHEMA_REF_ID}
$id
。 它应类似于下面的样子: "https://ns.adobe.com/{TENANT_ID}/schemas/{SCHEMA_ID}"
响应
成功的响应返回HTTP状态201,其中包含有关新创建的架构主身份命名空间的信息。
{
"xdm:property": "xdm:code",
"xdm:sourceSchema": "https://ns.adobe.com/{TENANT_ID}/schemas/{SCHEMA_ID}",
"xdm:namespace": "Email",
"@type": "xdm:descriptorIdentity",
"xdm:sourceVersion": 1,
"xdm:isPrimary": true,
"xdm:sourceProperty": "/_experience/campaign/message/profileSnapshot/workEmail/address",
"@id": "ec31c09e0906561861be5a71fcd964e29ebe7923b8eb0d1e",
"meta:containerId": "tenant",
"version": "1",
"imsOrg": "{ORG_ID}"
}
为时间序列数据创建数据集
创建架构后,您将需要创建一个数据集来摄取记录数据。
API格式
POST /catalog/dataSets
请求
curl -X POST https://platform.adobe.io/data/foundation/catalog/dataSets \
-H 'Authorization: Bearer {ACCESS_TOKEN}' \
-H 'Content-Type: application/json' \
-H 'x-api-key: {API_KEY}' \
-H 'x-gw-ims-org-id: {ORG_ID}' \
-H 'x-sandbox-name: {SANDBOX_NAME}' \
-d '{
"name": "{DATASET_NAME}",
"description": "{DATASET_DESCRIPTION}",
"schemaRef": {
"id": "{SCHEMA_REF_ID}",
"contentType": "application/vnd.adobe.xed-full+json;version=1"
},
"tags": {
"unifiedIdentity": ["enabled:true"],
"unifiedProfile": ["enabled:true"]
}
}'
响应
成功的响应返回HTTP状态201和一个数组,该数组包含新创建的数据集的ID,格式为@/dataSets/{DATASET_ID}
。
[
"@/dataSets/5e72608b10f6e318ad2dee0f"
]
创建流连接
创建架构和数据集后,您需要创建流连接以摄取数据。
有关创建流连接的详细信息,请参阅创建流连接教程。
将时间序列数据摄取到流连接
创建数据集、流连接和数据流后,您可以摄取XDM格式的JSON记录以摄取Platform中的时序数据。
API格式
POST /collection/{CONNECTION_ID}?syncValidation=true
{CONNECTION_ID}
id
值。syncValidation
true
,则可用于即时反馈以确定请求是否成功发送。 默认情况下,此值设置为false
。 请注意,如果您将此查询参数设置为true
,则请求速率将限制为每CONNECTION_ID
每分钟60次。请求
将时间序列数据摄取到流连接可以不使用源名称也可以使用源名称。
下面的示例请求将缺少源名称的时间系列数据摄取到Platform。 如果数据缺少源名称,它将从流连接定义中添加源ID。
xdmEntity._id
和xdmEntity.timestamp
都是时间序列数据的必填字段。 xdmEntity._id
属性表示记录本身的唯一标识符,不是 记录所属人员或设备的唯一ID。
如果需要重新摄取记录,您将需要为记录生成自己的xdmEntity._id
和xdmEntity.timestamp
,并且这种方式将保持一致性。 理想情况下,源系统将包含这些值。 如果ID不可用,请考虑关联记录中其他字段的值以创建一个唯一值,该值可在重新摄取时始终从记录中重新生成。
curl -X POST https://dcs.adobedc.net/collection/{CONNECTION_ID}?syncValidation=true \
-H "Content-Type: application/json" \
-d '{
"header": {
"datasetId": "{DATASET_ID}",
"flowId": "{FLOW_ID}",
"imsOrgID": "{ORG_ID}"
},
"body": {
"xdmMeta": {
"schemaRef": {
"id": "https://ns.adobe.com/{TENANT_ID}/schemas/{SCHEMA_ID}",
"contentType": "application/vnd.adobe.xed-full+json;version=1"
},
"identityMap": {
"Email": [
{
"id": "acme_user@gmail.com",
"primary": true
}
]
},
},
"xdmEntity":{
"_id": "9af5adcc-db9c-4692-b826-65d3abe68c22",
"timestamp": "2019-02-23T22:07:01Z",
"environment": {
"browserDetails": {
"userAgent": "Mozilla\/5.0 (Windows NT 5.1) AppleWebKit\/537.36 (KHTML, like Gecko) Chrome\/29.0.1547.57 Safari\/537.36 OPR\/16.0.1196.62",
"acceptLanguage": "en-US",
"cookiesEnabled": true,
"javaScriptVersion": "1.6",
"javaEnabled": true
},
"colorDepth": 32,
"viewportHeight": 799,
"viewportWidth": 414
},
"productListItems": [
{
"SKU": "CC",
"name": "Fernie Snow",
"quantity": 30,
"priceTotal": 7.8
}
],
"commerce": {
"productViews": {
"value": 1
}
},
"_experience": {
"campaign": {
"message": {
"profileSnapshot": {
"workEmail":{
"address": "janedoe@example.com"
}
}
}
}
}
}
}
}'
如果要包含源名称,以下示例显示了如何包含该源名称。
"header": {
"datasetId": "{DATASET_ID}",
"flowId": "{FLOW_ID}",
"imsOrgID": "{ORG_ID}",
"source": {
"name": "ACME source"
}
}
响应
成功的响应返回HTTP状态200,其中包含新流式传输Profile的详细信息。
{
"inletId": "{CONNECTION_ID}",
"xactionId": "1584479347507:2153:240",
"receivedTimeMs": 1584479347507,
"syncValidation": {
"status": "pass"
}
}
{CONNECTION_ID}
inletId
。xactionId
receivedTimeMs
:时间戳(以毫秒为单位),显示收到请求的时间。syncValidation.status
syncValidation=true
,因此将显示此值。 如果验证成功,状态将为pass
。检索新摄取的时间序列数据
要验证以前摄取的记录,您可以使用Profile Access API检索时间序列数据。 可以使用对/access/entities
端点的GET请求并使用可选的查询参数来完成此操作。 可以使用多个参数,以&分隔。”
schema.name
或relatedSchema.name
为_xdm.context.profile
,则Profile Access将提取 所有 相关标识。API格式
GET /access/entities
GET /access/entities?{QUERY_PARAMETERS}
GET /access/entities?schema.name=_xdm.context.experienceevent&relatedSchema.name=_xdm.context.profile&relatedEntityId=janedoe@example.com&relatedEntityIdNS=email
schema.name
relatedSchema.name
_xdm.context.experienceevent
,此值指定与时间序列事件相关的配置文件实体的架构。relatedEntityId
relatedEntityIdNS
请求
curl -X GET \
https://platform.adobe.io/data/core/ups/access/entities?schema.name=_xdm.context.experienceevent&relatedSchema.name=_xdm.context.profile&relatedEntityId=janedoe@example.com&relatedEntityIdNS=email \
-H "Authorization: Bearer {ACCESS_TOKEN}" \
-H "x-api-key: {API_KEY}" \
-H "x-gw-ims-org-id: {ORG_ID}" \
-H "x-sandbox-name: {SANDBOX_NAME}"
响应
成功的响应返回HTTP状态200,其中包含所请求实体的详细信息。 如您所见,这与之前摄取的时间序列数据相同。
{
"_page": {
"orderby": "timestamp",
"start": "9af5adcc-db9c-4692-b826-65d3abe68c22",
"count": 1,
"next": ""
},
"children": [
{
"relatedEntityId": "BVrqzwVv7o2p3naHvnsWpqZXv3KJgA",
"entityId": "9af5adcc-db9c-4692-b826-65d3abe68c22",
"timestamp": 1582495621000,
"entity": {
"environment": {
"browserDetails": {
"javaScriptVersion": "1.6",
"cookiesEnabled": true,
"userAgent": "Mozilla/5.0 (Windows NT 5.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/29.0.1547.57 Safari/537.36 OPR/16.0.1196.62",
"acceptLanguage": "en-US",
"javaEnabled": true
},
"colorDepth": 32,
"viewportHeight": 799,
"viewportWidth": 414
},
"_id": "9af5adcc-db9c-4692-b826-65d3abe68c22",
"commerce": {
"productViews": {
"value": 1
}
},
"productListItems": [
{
"name": "Fernie Snow",
"quantity": 30,
"SKU": "CC",
"priceTotal": 7.8
}
],
"_experience": {
"campaign": {
"message": {
"profileSnapshot": {
"workEmail": {
"address": "janedoe@example.com"
}
}
}
}
},
"timestamp": "2020-02-23T22:07:01Z"
},
"lastModifiedAt": "2020-03-18T18:51:19Z"
}
],
"_links": {
"next": {
"href": ""
}
}
}
后续步骤
通过阅读本文档,您现在了解如何使用流连接将记录数据摄取到Platform。 您可以尝试使用不同的值发起更多调用并检索更新的值。 此外,您还可以通过Platform UI开始监视摄取的数据。 有关详细信息,请参阅监视数据摄取指南。
有关一般流式摄取的更多信息,请阅读流式摄取概述。