Overzicht van gegevenssets
Alle gegevens die met succes in Adobe Experience Platform worden opgenomen, blijven binnen Data Lake als datasets bestaan. Een dataset is een opslag en beheersconstructie voor een inzameling van gegevens, typisch een lijst, die een schema (kolommen) en gebieden (rijen) bevat. Datasets bevatten ook metagegevens die verschillende aspecten van de gegevens beschrijven die ze opslaan.
Dit document biedt een overzicht op hoog niveau van gegevenssets in Experience Platform .
Gegevenssets maken en metagegevens bijhouden
Catalog Service is het recordsysteem voor de gegevenslocatie en -lijn binnen Experience Platform en wordt gebruikt om gegevenssets te maken en te beheren. Catalog volgt de meta-gegevens voor elke dataset, die een verwijzing naar het Experience Data Model (XDM) schema omvat de dataset aan (verklaard in de volgende sectie) en het aantal verslagen voldoet die in die dataset worden opgenomen.
Zie het overzicht van de Dienst van de Catalogusvoor meer informatie.
Beperkingen van gegevenssetgegevens afdwingen
Experience Data Model (XDM) is het gestandaardiseerde framework waarmee Platform gegevens voor de klantervaring indeelt. Alle gegevens die in Platform worden opgenomen, moeten in overeenstemming zijn met een vooraf gedefinieerd XDM-schema voordat het in Data Lake als dataset kan worden voortgezet.
Alle datasets bevatten een verwijzing naar het schema XDM dat het formaat en de structuur van de gegevens beperkt die zij kunnen opslaan. Het proberen om gegevens aan een dataset te uploaden die niet met het schema XDM van de dataset in overeenstemming is zal binnendringen veroorzaken om te ontbreken.
Voor meer informatie over XDM, zie het XDM overzicht van het Systeem.
Gegevens in gegevenssets invoegen
Adobe Experience Platform Data Ingestie vertegenwoordigt de meerdere methoden waarmee Platform gegevens uit verschillende bronnen inneemt. Ongeacht de manier van inname worden alle gegevens die correct zijn ingesloten, geconverteerd naar batchbestanden. Batches zijn gegevenseenheden die bestaan uit een of meer bestanden die als één eenheid moeten worden ingevoerd. Deze partijdossiers worden dan toegevoegd aan specifieke datasets en binnen Data Lake voortgeduurd.
Zie het Overzicht van de Ingestie van Gegevensvoor meer informatie.
Labels die worden toegepast op gegevenssets van schema's
Met Adobe Experience Platform Data Governance kunt u klantgegevens beheren om ervoor te zorgen dat de regels, beperkingen en beleidsregels die van toepassing zijn op het gebruik van gegevens worden nageleefd. Met het gegevensbeheerframework kunt u gebruikslabels toepassen om gegevens te categoriseren volgens het gebruiksbeleid dat op die gegevens van toepassing is. De etiketten kunnen op individuele schema's, gebieden binnen die schema's, en volledige individuele datasets worden toegepast. Wanneer de etiketten rechtstreeks op een schema worden toegepast, worden die etiketten verspreid aan alle bestaande en toekomstige datasets die op dat schema gebaseerd zijn.
Zie het overzicht van het Beleid van Gegevensvoor meer informatie over de dienst. Raadpleeg de volgende hulplijnen voor stappen over het werken met gebruikslabels in Platform :
Datasets in downstream Platform -services
Zodra de datasets zijn gebruikt om ingebedde gegevens op te slaan, worden die datasets dan gebruikt door stroomafwaartse Platform diensten om klantenprofielen bij te werken, inzichten door machine het leren te bereiken, en meer.
Hieronder volgt een lijst met downstreamservices die gegevenssets gebruiken voor diverse bewerkingen. Raadpleeg de documentatie bij elke service voor meer informatie.
- Data Access API: Hiermee kunt u de inhoud van bestanden in gegevenssets openen en downloaden.
- Dienst van de Identiteit van Adobe Experience Platform: Brugshanden identiteiten over apparaten en systemen, die datasets verbinden samen op de identiteitsgebieden worden gebaseerd die door de schema's XDM worden bepaald zij met in overeenstemming zijn.
- Real-Time Customer Profile: maakt gebruik van Identity Service om in real-time gedetailleerde klantprofielen te maken op basis van uw gegevenssets. Real-Time Customer Profile haalt gegevens van Data Lake en houdt klantenprofielen in zijn eigen afzonderlijke gegevensopslag voort.
- de Dienst van de Segmentatie van Adobe Experience Platform: Staat u toe om segmenten te bouwen en publiek van uw Real-Time Customer Profile gegevens te produceren. Deze doelgroepen kunnen vervolgens worden geëxporteerd naar hun eigen gegevenssets in de Data Lake .
- Workspace van de Wetenschap van Gegevens van Adobe Experience Platform: Gebruikt machine het leren en kunstmatige intelligentie om inzichten in grote datasets te ontdekken.
- de Dienst van de Vraag van Adobe Experience Platform: Staat u toe om standaardSQL te gebruiken om gegevens in Experience Platform te vragen, die tot om het even welke datasets binnen Data Lake toetreden en vraagresultaten als nieuwe dataset voor gebruik in het melden, Data Science Workspace, of Real-Time Customer Profile vangen.
- de Dienst van Bestemmingen van Adobe Experience Platform: Staat u toe uitvoerdatasetsaan uw gewenste wolkenopslag of e-mail marketing bestemmingen, voor het melden van of activiteiten van de gegevenswetenschap.
Volgende stappen
Door dit document te lezen, bent u geïntroduceerd in de belangrijkste toepassingen van datasets in Experience Platform, evenals de diverse Platform diensten die datasets gebruiken. Voor meer informatie over de vele manieren worden de datasets gebruikt in Platform, te herzien gelieve de de dienstdocumentatie verbonden door dit overzicht.
Voor stappen op hoe te met datasets binnen Experience Platform UI in wisselwerking te staan, zie de gids van de datasetgebruiker.