Procesamiento de solicitudes de privacidad en Data Lake

Adobe Experience Platform Privacy Service procesa las solicitudes de los clientes de acceso, exclusión de la venta o eliminación de sus datos personales según lo establecido en las normas legales y de privacidad de la organización.

Este documento cubre conceptos esenciales relacionados con el procesamiento de solicitudes de privacidad para datos de clientes almacenados en Data Lake.

NOTA

Esta guía solo explica cómo realizar solicitudes de privacidad para el lago de datos en Experience Platform. Si también planea realizar solicitudes de privacidad para el almacén de datos del perfil del cliente en tiempo real, consulte la guía sobre el procesamiento de solicitudes de privacidad para el perfil además de este tutorial.

Para ver los pasos sobre cómo realizar solicitudes de privacidad para otras aplicaciones de Adobe Experience Cloud, consulte la documentación del Privacy Service.

Primeros pasos

Se recomienda que conozca bien los siguientes Experience Platform servicios antes de leer esta guía:

  • Privacy Service: Gestiona las solicitudes de los clientes para acceder, desactivar o eliminar sus datos personales en todas las aplicaciones de Adobe Experience Cloud.
  • Catalog Service: El sistema de registro para la ubicación y el linaje de los datos dentro de Experience Platform. Proporciona una API que se puede usar para actualizar metadatos de conjuntos de datos.
  • Experience Data Model (XDM) System: El marco estandarizado mediante el cual se Experience Platform organizan los datos de experiencia del cliente.
  • Identity Service: Resuelve el desafío fundamental que plantea la fragmentación de los datos de experiencia del cliente al unir identidades entre dispositivos y sistemas.

Explicación de las áreas de nombres de identidad

Adobe Experience Platform Identity Service vincula los datos de identidad de los clientes entre sistemas y dispositivos. Identity Service utiliza áreas de nombres de identidad para proporcionar contexto a los valores de identidad relacionándolos con su sistema de origen. Un área de nombres puede representar un concepto genérico, como una dirección de correo electrónico ("correo electrónico") o asociar la identidad a una aplicación específica, como un Adobe Advertising Cloud ID ("AdCloud") o un Adobe Target ID ("TNTID").

Identity Service mantiene un almacén de áreas de nombres de identidad definidas globalmente (estándar) y definidas por el usuario (personalizadas). Las áreas de nombres estándar están disponibles para todas las organizaciones (por ejemplo, "correo electrónico" y "ECID"), mientras que la organización también puede crear áreas de nombres personalizadas para adaptarlas a sus necesidades específicas.

Para obtener más información sobre los espacios de nombres de identidad en Experience Platform, consulte la descripción general del área de nombres de identidad.

Adición de datos de identidad a conjuntos de datos

Al crear solicitudes de privacidad para Data Lake, se deben proporcionar valores de identidad válidos (y sus áreas de nombres asociadas) para cada cliente individual a fin de localizar sus datos y procesarlos en consecuencia. Por lo tanto, todos los conjuntos de datos sujetos a solicitudes de privacidad deben contener un descriptor de identidad en su esquema XDM asociado.

NOTA

Actualmente, los conjuntos de datos basados en esquemas que no admiten metadatos del descriptor de identidad (como conjuntos de datos ad-hoc) no se pueden procesar en solicitudes de privacidad.

Esta sección explica los pasos para agregar un descriptor de identidad al esquema XDM de un conjunto de datos existente. Si ya tiene un conjunto de datos con un descriptor de identidad, puede pasar a la siguiente sección.

IMPORTANTE

Al decidir qué campos de esquema establecer como identidades, tenga en cuenta las limitaciones del uso de campos de tipo mapa anidados.

Existen dos métodos para añadir un descriptor de identidad a un esquema de conjunto de datos:

Uso de la IU

En la interfaz de usuario Experience Platform, el espacio de trabajo Esquemas le permite editar los esquemas XDM existentes. Para añadir un descriptor de identidad a un esquema, seleccione el esquema en la lista y siga los pasos para establecer un campo de esquema como campo de identidad en el tutorial Schema Editor.

Una vez configurados los campos adecuados dentro del esquema como campos de identidad, puede continuar con la siguiente sección sobre el envío de solicitudes de privacidad.

Uso de la API

NOTA

Esta sección supone que conoce el valor de ID de URI único del esquema XDM de su conjunto de datos. Si no conoce este valor, puede recuperarlo utilizando la API Catalog Service. Después de leer la sección introducción de la guía para desarrolladores, siga los pasos descritos en para los objetos listing o búsqueda de Catalog para encontrar el conjunto de datos. El ID de esquema se encuentra en schemaRef.id

Esta sección incluye llamadas a la API del Registro de esquemas. Para obtener información importante relacionada con el uso de la API, incluido el conocimiento de {TENANT_ID} y el concepto de contenedores, consulte la sección introducción de la guía para desarrolladores.

Puede agregar un descriptor de identidad al esquema XDM de un conjunto de datos realizando una solicitud de POST al extremo /descriptors en la API Schema Registry.

Formato de API

POST /descriptors

Solicitud

La siguiente solicitud define un descriptor de identidad en un campo "dirección de correo electrónico" de un esquema de ejemplo.

curl -X POST \
  https://platform.adobe.io/data/foundation/schemaregistry/tenant/descriptors \
  -H 'Authorization: Bearer {ACCESS_TOKEN}' \
  -H 'Content-Type: application/json' \
  -H 'x-api-key: {API_KEY}' \
  -H 'x-gw-ims-org-id: {IMS_ORG}' \
  -H 'x-sandbox-name: {SANDBOX_NAME}' \
  -d '
      {
        "@type": "xdm:descriptorIdentity",
        "xdm:sourceSchema": "https://ns.adobe.com/{TENANT_ID}/schemas/fbc52b243d04b5d4f41eaa72a8ba58be",
        "xdm:sourceVersion": 1,
        "xdm:sourceProperty": "/personalEmail/address",
        "xdm:namespace": "Email",
        "xdm:property": "xdm:code",
        "xdm:isPrimary": false
      }'
Propiedad Descripción
@type Tipo de descriptor que se está creando. Para los descriptores de identidad, el valor debe ser "xdm:descriptorIdentity".
xdm:sourceSchema ID de URI único del esquema XDM de su conjunto de datos.
xdm:sourceVersion Versión del esquema XDM especificado en xdm:sourceSchema.
xdm:sourceProperty Ruta al campo de esquema al que se está aplicando el descriptor.
xdm:namespace Uno de los espacios de nombres de identidad estándar reconocidos por Privacy Service o un espacio de nombres personalizado definido por su organización.
xdm:property "xdm:id" o "xdm:code", según el espacio de nombres que se utilice en xdm:namespace.
xdm:isPrimary Un valor booleano opcional. Cuando es true, esto indica que el campo es una identidad principal. Los esquemas solo pueden contener una identidad principal. Si no se incluye, el valor predeterminado es false .

Respuesta

Una respuesta correcta devuelve el estado HTTP 201 (Creado) y los detalles del descriptor recién creado.

{
  "@type": "xdm:descriptorIdentity",
  "xdm:sourceSchema": "https://ns.adobe.com/{TENANT_ID}/schemas/fbc52b243d04b5d4f41eaa72a8ba58be",
  "xdm:sourceVersion": 1,
  "xdm:sourceProperty": "/personalEmail/address",
  "xdm:namespace": "Email",
  "xdm:property": "xdm:code",
  "xdm:isPrimary": false,
  "meta:containerId": "tenant",
  "@id": "f3a1dfa38a4871cf4442a33074c1f9406a593407"
}

Envío de solicitudes

NOTA

Esta sección explica cómo dar formato a las solicitudes de privacidad de Data Lake. Se recomienda encarecidamente que revise la documentación de Privacy Service UI o Privacy Service API para ver los pasos completos sobre cómo enviar un trabajo de privacidad, incluido cómo dar formato correcto a los datos de identidad de usuario enviados en las cargas de solicitud.

En la siguiente sección se describe cómo realizar solicitudes de privacidad para Data Lake mediante la interfaz de usuario o API Privacy Service.

IMPORTANTE

No se puede garantizar la cantidad de tiempo que una solicitud de privacidad puede tardar en completarse. Si se producen cambios dentro del lago de datos mientras se procesa una solicitud, no se puede garantizar si esos registros se procesan o no.

Uso de la interfaz de usuario

Al crear solicitudes de trabajo en la interfaz de usuario, asegúrese de seleccionar AEP Data Lake o Profile en Products para procesar los trabajos de los datos almacenados en Data Lake o Real-time Customer Profile, respectivamente.


Uso de la API

Al crear solicitudes de trabajo en la API, cualquier userIDs que se proporcione debe utilizar un namespace y type específicos en función del almacén de datos al que se apliquen. Los ID de Data Lake deben utilizar "no registrado" para su valor type y un valor namespace que coincida con una de las etiquetas de privacidad agregadas a los conjuntos de datos aplicables.

Además, la matriz include de la carga útil de la solicitud debe incluir los valores del producto para los diferentes almacenes de datos a los que se realiza la solicitud. Al realizar solicitudes a Data Lake, la matriz debe incluir el valor aepDataLake.

La siguiente solicitud crea un nuevo trabajo de privacidad para Data Lake, utilizando el espacio de nombres "email_label" no registrado. También incluye el valor del producto para Data Lake en la matriz include:

curl -X POST \
  https://platform.adobe.io/data/core/privacy/jobs \
  -H 'Authorization: Bearer {ACCESS_TOKEN}' \
  -H 'Content-Type: application/json' \
  -H 'x-api-key: {API_KEY}' \
  -H 'x-gw-ims-org-id: {IMS_ORG}' \
  -d '{
    "companyContexts": [
      {
        "namespace": "imsOrgID",
        "value": "{IMS_ORG}"
      }
    ],
    "users": [
      {
        "key": "user12345",
        "action": ["access","delete"],
        "userIDs": [
          {
            "namespace": "email_label",
            "value": "ajones@acme.com",
            "type": "unregistered"
          },
          {
            "namespace": "email_label",
            "value": "jdoe@example.com",
            "type": "unregistered"
          }
        ]
      }
    ],
    "include": ["aepDataLake"],
    "expandIds": false,
    "priority": "normal",
    "regulation": "ccpa"
}'

Eliminación del procesamiento de solicitudes

Cuando Experience Platform recibe una solicitud de eliminación de Privacy Service, Platform envía confirmación a Privacy Service de que la solicitud se ha recibido y que los datos afectados se han marcado para su eliminación. A continuación, los registros se eliminan del Data Lake en un plazo de siete días. Durante esa ventana de siete días, los datos se eliminan de forma suave y, por lo tanto, ningún servicio Platform puede acceder a ellos.

En futuras versiones, Platform enviará una confirmación a Privacy Service después de que se hayan eliminado físicamente los datos.

Pasos siguientes

Al leer este documento, se le han introducido los conceptos importantes relacionados con el procesamiento de solicitudes de privacidad para Data Lake. Se recomienda seguir leyendo la documentación proporcionada en esta guía para comprender mejor cómo administrar los datos de identidad y crear trabajos de privacidad.

Consulte el documento sobre procesamiento de solicitudes de privacidad para Perfil del cliente en tiempo real para ver los pasos para procesar solicitudes de privacidad para el almacén Profile.

Apéndice

La siguiente sección contiene información adicional para procesar solicitudes de privacidad en Data Lake.

Etiquetado de campos de tipo mapa anidados

Es importante tener en cuenta que hay dos tipos de campos anidados de tipo mapa que no admiten el etiquetado de privacidad:

  • Campo de tipo mapa dentro de un campo de tipo matriz
  • Campo de tipo mapa dentro de otro campo de tipo mapa

El procesamiento del trabajo de privacidad de cualquiera de los dos ejemplos anteriores fallará finalmente. Por este motivo, se recomienda evitar el uso de campos anidados de tipo mapa para almacenar datos privados de clientes. Los ID de consumidor relevantes deben almacenarse como un tipo de datos que no sea de asignación dentro del campo identityMap (en sí mismo un campo de tipo mapa) para conjuntos de datos basados en registros, o el campo endUserID para conjuntos de datos basados en series temporales.

En esta página