Documentatie Experience Platform Gids voor Source Connectors

Creeer een dataflow gebruikend een protocolbron in UI

Laatst bijgewerkt: 4 april 2025

Onderwerpen:

Gemaakt voor:

Ontwikkelaar

Een dataflow is een geplande taak die gegevens van een bron aan een dataset in Adobe Experience Platform terugwint en opneemt. Deze zelfstudie bevat stappen voor het maken van een gegevensstroom voor een protocolbron met de gebruikersinterface van Experience Platform.

OPMERKING

Om een gegevensstroom tot stand te brengen, moet u reeds een voor authentiek verklaarde rekening met een protocolbron hebben. Een lijst van leerprogramma's voor het creëren van verschillende protocollen bronrekeningen in UI kan in het overzicht van bronnenworden gevonden.
Experience Platform kan alleen gegevens invoeren als tijdzones voor alle batchbronnen op basis van tabellen zijn geconfigureerd voor UTC.

Aan de slag

Deze zelfstudie vereist een goed begrip van de volgende onderdelen van Experience Platform:

Bronnen: Experience Platform staat gegevens toe om van diverse bronnen worden opgenomen terwijl het voorzien van u van de capaciteit om, inkomende gegevens te structureren te etiketteren en te verbeteren gebruikend Experience Platform diensten.
Experience Data Model (XDM) Systeem: Het gestandaardiseerde kader waardoor Experience Platform gegevens van de klantenervaring organiseert.
- Grondbeginselen van schemacompositie: Leer over de basisbouwstenen van schema's XDM, met inbegrip van zeer belangrijke principes en beste praktijken in schemacompositie.
- het leerprogramma van de Redacteur van het Schema: Leer hoe te om douaneschema's tot stand te brengen gebruikend de Redacteur UI van het Schema.
Real-Time Customer Profile: biedt een uniform, real-time consumentenprofiel dat is gebaseerd op geaggregeerde gegevens van meerdere bronnen.
Data Prep: staat gegevensengineers toe om gegevens in kaart te brengen, om te zetten en te bevestigen aan en van het Model van de Gegevens van de Ervaring (XDM).

Gegevens toevoegen

Na het creëren van uw protocollen bronrekening, verschijnt de Add data stap, die een interface voor u verstrekt om de de lijsthiërarchie van uw protocollen te onderzoeken bronrekening.

De linkerhelft van de interface is een browser waarin een lijst met gegevenstabellen in uw account wordt weergegeven. De interface bevat ook een zoekoptie waarmee u snel de brongegevens kunt identificeren die u wilt gebruiken.
De rechterhelft van de interface is een voorvertoningsvenster waarin u maximaal 100 rijen gegevens kunt voorvertonen.

OPMERKING

De optie voor zoekbrongegevens is beschikbaar voor alle op tabellen gebaseerde bronnen, met uitzondering van de Adobe Analytics, Amazon Kinesis en Azure Event Hubs .

Wanneer u de brongegevens hebt gevonden, selecteert u de tabel en vervolgens Next .

selecteren-gegevens

Gegevens over gegevensstroom opgeven

Met de pagina Dataflow detail kunt u selecteren of u een bestaande gegevensset of een nieuwe gegevensset wilt gebruiken. Tijdens dit proces kunt u ook instellingen configureren voor Profile dataset , Error diagnostics , Partial ingestion en Alerts .

dataflow-detail

Een bestaande gegevensset gebruiken

Selecteer Existing dataset als u gegevens in een bestaande gegevensset wilt opnemen. U kunt of een bestaande dataset terugwinnen gebruikend de Advanced search optie of door door de lijst van bestaande datasets in het dropdown menu te scrollen. Zodra u een dataset hebt geselecteerd, verstrek een naam en een beschrijving voor uw gegevensstroom.

bestaand-dataset

Een nieuwe gegevensset gebruiken

Om in een nieuwe dataset in te gaan, selecteer New dataset en verstrek dan een naam van de outputdataset en een facultatieve beschrijving. Selecteer vervolgens het schema dat u wilt toewijzen met de optie Advanced search of door door de lijst met bestaande schema's in het vervolgkeuzemenu te bladeren. Nadat u een schema hebt geselecteerd, geeft u een naam en een beschrijving voor de gegevensstroom op.

nieuw-dataset

Profile en foutdiagnostiek inschakelen

Selecteer vervolgens de schakeloptie Profile dataset om de gegevensset in te schakelen voor Profile . Hierdoor kunt u een holistische weergave maken van de kenmerken en het gedrag van een entiteit. Gegevens van alle gegevenssets waarvoor Profile is ingeschakeld, worden opgenomen in Profile en wijzigingen worden toegepast wanneer u de gegevensstroom opslaat.

In Error diagnostics kunnen gedetailleerde foutberichten worden gegenereerd voor onjuiste records in de gegevensstroom, terwijl u in Partial ingestion gegevens met fouten kunt invoeren tot een bepaalde drempel die u handmatig definieert. Zie het gedeeltelijke overzicht van partijingestievoor meer informatie.

profiel-en-fouten

Waarschuwingen inschakelen

U kunt waarschuwingen inschakelen om meldingen te ontvangen over de status van uw gegevensstroom. Selecteer een waarschuwing in de lijst om u te abonneren op meldingen over de status van uw gegevensstroom. Voor meer informatie over alarm, zie de gids bij het intekenen aan bronalarm gebruikend UI.

Wanneer u klaar bent met het opgeven van details voor de gegevensstroom, selecteert u Next .

alarm

Gegevensvelden toewijzen aan een XDM-schema

De stap Mapping verschijnt, die u van een interface voorziet om de brongebieden van uw bronschema aan hun aangewezen doelXDM gebieden in het doelschema in kaart te brengen.

Experience Platform biedt intelligente aanbevelingen voor automatisch toegewezen velden op basis van het doelschema of de gegevensset die u hebt geselecteerd. U kunt toewijzingsregels handmatig aanpassen aan uw gebruiksgevallen. Op basis van uw behoeften kunt u ervoor kiezen om velden rechtstreeks toe te wijzen of gegevens prep-functies te gebruiken om brongegevens om berekende of berekende waarden af te leiden. Voor uitvoerige stappen bij het gebruiken van de kaartperinterface en berekende gebieden, zie de gids UI van de Prep van Gegevens.

Selecteer Next wanneer de brongegevens correct zijn toegewezen.

afbeelding

Planninguitvoering

De stap Scheduling verschijnt, die u toestaat om een innameprogramma te vormen om de geselecteerde brongegevens automatisch in te nemen gebruikend de gevormde afbeeldingen. De planning wordt standaard ingesteld op Once . Als u de innamefrequentie wilt aanpassen, selecteert u Frequency en vervolgens een optie in het vervolgkeuzemenu.

TIP

Interval en backfill zijn niet zichtbaar tijdens een eenmalige opname.

het plannen

Als u de innamefrequentie instelt op Minute , Hour , Day of Week , moet u een interval instellen om een bepaald tijdkader tussen elke inname te maken. Als de innamefrequentie bijvoorbeeld is ingesteld op Day en als het interval is ingesteld op 15 , worden gegevens elke 15 dagen opgenomen.

Tijdens deze stap, kunt u backfill ook toelaten en een kolom voor de stijgende opname van gegevens bepalen. Backfill wordt gebruikt om historische gegevens in te voeren, terwijl in de kolom die u voor incrementele inname definieert, nieuwe gegevens kunnen worden onderscheiden van bestaande gegevens.

Zie de lijst hieronder voor meer informatie over het plannen van configuraties.

Configuratie plannen

Beschrijving

Frequentie

Vorm frequentie om erop te wijzen hoe vaak dataflow zou moeten lopen. U kunt de frequentie instellen op:

Eenmaal: Plaats uw frequentie aan once om eenmalig te creëren. Configuraties voor interval en backfill zijn niet beschikbaar wanneer u een eenmalige gegevensstroom maakt. Standaard wordt de planningsfrequentie ingesteld op één keer.
Minuut: Plaats uw frequentie aan minute om uw gegevensstroom te plannen om gegevens op een per-minieme basis in te voeren.
Uur: Plaats uw frequentie aan hour om uw gegevensstroom te plannen om gegevens op een per-uurbasis in te voeren.
Dag: Plaats uw frequentie aan day om uw gegevensstroom te plannen om gegevens op een per-dagbasis in te voeren.
Week: Plaats uw frequentie aan week om uw gegevensstroom te plannen om gegevens op een per-weekbasis in te voeren.

Interval

Zodra u een frequentie selecteert, kunt u het interval dat dan vormen om het tijdkader tussen elke opname te vestigen. Bijvoorbeeld, als u uw frequentie aan dag plaatst en het interval aan 15 vormt, dan zal uw dataflow om de 15 dagen lopen. U kunt het interval niet instellen op nul. De minimaal toegestane intervalwaarde voor elke frequentie is als volgt:

Eenmaal: n/a
Minuut: 15
Uur: 1
Dag: 1
Week: 1

Begintijd

Het tijdstempel voor de geprojecteerde run, weergegeven in UTC-tijdzone.

Achtergrond

Met Backfill wordt bepaald welke gegevens in eerste instantie worden ingevoerd. Als backfill is ingeschakeld, worden alle huidige bestanden in het opgegeven pad tijdens de eerste geplande inname opgenomen. Als terugvullen is uitgeschakeld, worden alleen de bestanden opgenomen die tussen de eerste opname en de begintijd worden geladen. Bestanden die vóór de begintijd zijn geladen, worden niet opgenomen.

Incrementele gegevens laden met

Een optie met een gefilterde reeks gebieden van het bronschema van type, datum, of tijd. Het veld waarvoor u Load incremental data by selecteert, moet zijn datum-tijdwaarden in UTC-tijdzone hebben om de incrementele gegevens correct te laden. Alle op lijst-gebaseerde partijbronnen kiezen stijgende gegevens door een waarde van de de tijdstempeltijd van de deltakolom met de overeenkomstige tijd van het venster UTC van de stroomlooppas te vergelijken, en dan het kopiëren van de gegevens van de bron, als om het even welke nieuwe gegevens binnen het tijdvenster UTC wordt gevonden.

backfill

Controleer uw gegevensstroom

De stap Review wordt weergegeven, zodat u de nieuwe gegevensstroom kunt bekijken voordat deze wordt gemaakt. De details worden gegroepeerd in de volgende categorieën:

Connection: geeft het brontype, het relevante pad van het gekozen bronbestand en de hoeveelheid kolommen in dat bronbestand weer.
Assign dataset & map fields: Toont welke dataset de brongegevens worden opgenomen in, met inbegrip van het schema dat de dataset volgt aan.
Scheduling: geeft de actieve periode, frequentie en interval van het innameschema weer.

Nadat u de gegevensstroom hebt gereviseerd, selecteert u Finish en laat u enige tijd over om de gegevensstroom te maken.

overzicht

Uw gegevensstroom controleren

Zodra uw gegevensstroom is gecreeerd, kunt u de gegevens controleren die door het worden opgenomen om informatie over innamepercentages, succes, en fouten te zien. Voor meer informatie over hoe te om dataflow te controleren, zie het leerprogramma op controlerekeningen en dataflows in UI.

Uw gegevensstroom verwijderen

U kunt gegevensstromen verwijderen die niet meer nodig zijn of die onjuist zijn gemaakt met de functie Delete die beschikbaar is in de Dataflows -werkruimte. Voor meer informatie over hoe te om dataflows te schrappen, zie het leerprogramma bij het schrappen van dataflows in UI.

Volgende stappen

Door deze zelfstudie te volgen, hebt u een gegevensstroom gemaakt om gegevens van uw protocolbron naar Experience Platform te brengen. Binnenkomende gegevens kunnen nu worden gebruikt door Experience Platform -services, zoals Real-Time Customer Profile en Data Science Workspace . Raadpleeg de volgende documenten voor meer informatie:

WARNING

De gebruikersinterface van Experience Platform die in de volgende video wordt weergegeven, is verouderd. Raadpleeg de bovenstaande documentatie voor de meest recente schermafbeeldingen en functionaliteit van de gebruikersinterface.

video poster

https://video.tv.adobe.com/v/29711?quality=12&learn=on

recommendation-more-help