Creeer een dataflow gebruikend een protocolbron in UI

Een dataflow is een geplande taak die gegevens van een bron aan een dataset in Adobe Experience Platform terugwint en opneemt. Dit leerprogramma verstrekt stappen op hoe te om een dataflow voor een protocolbron tot stand te brengen gebruikend Platform UI.

NOTE
  • Om een gegevensstroom tot stand te brengen, moet u reeds een voor authentiek verklaarde rekening met een protocolbron hebben. Een lijst van leerprogramma's voor het creëren van verschillende protocollen bronrekeningen in UI kan in worden gevonden overzicht van bronnen.
  • Voor Experience Platform om gegevens in te voeren, moeten de tijdzones voor alle op lijst-gebaseerde partijbronnen aan UTC worden gevormd.

Aan de slag

Deze zelfstudie vereist een goed begrip van de volgende componenten van Platform:

  • Bronnen: Met Platform kunnen gegevens uit verschillende bronnen worden ingepakt en kunt u inkomende gegevens structureren, labelen en verbeteren met Platform diensten.

  • Experience Data Model (XDM) Systeem: Het gestandaardiseerde kader waardoor Experience Platform gegevens van de klantenervaring organiseert.

  • Real-Time Customer Profile: Biedt een uniform, real-time consumentenprofiel dat is gebaseerd op geaggregeerde gegevens van meerdere bronnen.

  • Data Prep: Hiermee staat u gegevensengineers toe om gegevens toe te wijzen, te transformeren en te valideren van en naar het XDM-model (Experience Data Model).

Gegevens toevoegen

Nadat u de bronaccount voor protocollen hebt gemaakt, Add data stap verschijnt, verstrekkend een interface voor u om de de lijsthiërarchie van uw protocollen te onderzoeken bronrekening.

  • De linkerhelft van de interface is een browser waarin een lijst met gegevenstabellen in uw account wordt weergegeven. De interface bevat ook een zoekoptie waarmee u snel de brongegevens kunt identificeren die u wilt gebruiken.
  • De rechterhelft van de interface is een voorvertoningsvenster waarin u maximaal 100 rijen gegevens kunt voorvertonen.
NOTE
De zoekbrongegevensoptie is beschikbaar voor alle op tabellen gebaseerde bronnen, met uitzondering van de Adobe Analytics, Amazon Kinesis, en Azure Event Hubs.

Wanneer u de brongegevens hebt gevonden, selecteert u de tabel en selecteert u vervolgens Next.

select-data

Gegevens over gegevensstroom opgeven

De Dataflow detail De pagina staat u toe om te selecteren of u een bestaande dataset of een nieuwe dataset wilt gebruiken. Tijdens dit proces kunt u ook instellingen configureren voor Profile dataset, Error diagnostics, Partial ingestion, en Alerts.

dataFlow-detail

Een bestaande gegevensset gebruiken

Om gegevens in een bestaande dataset in te voeren, selecteer Existing dataset. U kunt of een bestaande dataset terugwinnen gebruikend Advanced search of door door de lijst van bestaande datasets in het dropdown menu te scrollen. Zodra u een dataset hebt geselecteerd, verstrek een naam en een beschrijving voor uw gegevensstroom.

bestaande gegevensset

Een nieuwe gegevensset gebruiken

Om in een nieuwe dataset in te gaan, selecteer New dataset en geef vervolgens een naam voor de uitvoergegevensset en een optionele beschrijving op. Selecteer vervolgens het schema waaraan u wilt toewijzen Advanced search of door door de lijst van bestaande schema's in het dropdown menu te scrollen. Nadat u een schema hebt geselecteerd, geeft u een naam en een beschrijving voor de gegevensstroom op.

new-dataset

Inschakelen Profile en foutdiagnose

Selecteer vervolgens de Profile dataset schakelen om uw gegevensset in te schakelen voor Profile. Hierdoor kunt u een holistische weergave maken van de kenmerken en het gedrag van een entiteit. Gegevens van alle Profile- de toegelaten datasets zullen in worden omvat Profile en wijzigingen worden toegepast wanneer u de gegevensstroom opslaat.

Error diagnostics laat gedetailleerde foutenmelding generatie voor om het even welke onjuiste verslagen toe die in uw dataflow voorkomen, terwijl Partial ingestion kunt u gegevens met fouten opnemen tot een bepaalde drempel die u handmatig definieert. Zie de gedeeltelijke batch-opname, overzicht voor meer informatie .

profiel-en-fouten

Waarschuwingen inschakelen

U kunt waarschuwingen inschakelen om meldingen te ontvangen over de status van uw gegevensstroom. Selecteer een waarschuwing in de lijst om u te abonneren op meldingen over de status van uw gegevensstroom. Zie de handleiding voor meer informatie over waarschuwingen abonneren op berichten voor bronnen met behulp van de gebruikersinterface.

Wanneer u klaar bent met het opgeven van details voor uw gegevensstroom, selecteert u Next.

waarschuwingen

Gegevensvelden toewijzen aan een XDM-schema

De Mapping de stap verschijnt, die u van een interface voorziet om de brongebieden van uw bronschema aan hun aangewezen doelXDM gebieden in het doelschema in kaart te brengen.

Platform biedt intelligente aanbevelingen voor automatisch toegewezen velden op basis van het doelschema of de gegevensset die u hebt geselecteerd. U kunt toewijzingsregels handmatig aanpassen aan uw gebruiksgevallen. Op basis van uw behoeften kunt u ervoor kiezen om velden rechtstreeks toe te wijzen of gegevens prep-functies te gebruiken om brongegevens om berekende of berekende waarden af te leiden. Voor uitvoerige stappen bij het gebruiken van de kaartperinterface en berekende gebieden, zie UI-hulplijn voor gegevensvoorinstelling.

Als de brongegevens zijn toegewezen, selecteert u Next.

toewijzing

Planninguitvoering

De Scheduling de stap verschijnt, toestaand u om een innameprogramma te vormen om de geselecteerde brongegevens automatisch in te nemen gebruikend de gevormde afbeeldingen. Standaard is de planning ingesteld op Once. Selecteer Frequency en selecteert u vervolgens een optie in het vervolgkeuzemenu.

TIP
Interval en backfill zijn niet zichtbaar tijdens een eenmalige opname.

plannen

Als u de innamefrequentie instelt op Minute, Hour, Day, of Weekdan moet u een interval instellen om een bepaald tijdkader tussen elke opname te bepalen. Bijvoorbeeld een innamefrequentie ingesteld op Day en een interval instellen op 15 betekent dat uw gegevensstroom gepland is om gegevens in te voeren om de 15 dagen.

Tijdens deze stap kunt u ook backfill en definieert u een kolom voor de incrementele opname van gegevens. Backfill wordt gebruikt om historische gegevens in te voeren, terwijl in de kolom die u voor incrementele inname definieert, nieuwe gegevens kunnen worden onderscheiden van bestaande gegevens.

Zie de lijst hieronder voor meer informatie over het plannen van configuraties.

Veld
Beschrijving
Frequentie
De frequentie waarin inname plaatsvindt. Selecteerbare frequenties omvatten Once, Minute, Hour, Day, en Week.
Interval
Een geheel getal dat het interval voor de geselecteerde frequentie instelt. De waarde van het interval moet een geheel getal anders dan nul zijn en moet worden ingesteld op groter dan of gelijk aan 15.
Begintijd
Een UTC-tijdstempel die aangeeft wanneer de eerste opname wordt uitgevoerd. De begintijd moet groter zijn dan of gelijk zijn aan de huidige UTC-tijd.
Achtergrond
Een booleaanse waarde die bepaalt welke gegevens eerst worden ingevoerd. Als backfill is ingeschakeld, worden alle huidige bestanden in het opgegeven pad tijdens de eerste geplande inname opgenomen. Als terugvullen is uitgeschakeld, worden alleen de bestanden opgenomen die tussen de eerste opname en de begintijd worden geladen. Bestanden die vóór de begintijd zijn geladen, worden niet opgenomen.
Incrementele gegevens laden met
Een optie met een gefilterde reeks gebieden van het bronschema van type, datum, of tijd. Het veld waarvoor u selecteert Load incremental data by moet de datum-tijdwaarden in UTC-tijdzone hebben om de incrementele gegevens correct te laden. Alle op lijst-gebaseerde partijbronnen kiezen stijgende gegevens door een waarde van de de tijdstempeltijd van de deltakolom met de overeenkomstige tijd van het venster UTC van de stroomlooppas te vergelijken, en dan het kopiëren van de gegevens van de bron, als om het even welke nieuwe gegevens binnen het tijdvenster UTC wordt gevonden.

backfill

Controleer uw gegevensstroom

De Review wordt weergegeven, zodat u de nieuwe gegevensstroom kunt controleren voordat deze wordt gemaakt. De details worden gegroepeerd in de volgende categorieën:

  • Connection: Hiermee geeft u het brontype, het relevante pad van het gekozen bronbestand en de hoeveelheid kolommen in dat bronbestand weer.
  • Assign dataset & map fields: Toont welke dataset de brongegevens worden opgenomen in, met inbegrip van het schema dat de dataset volgt.
  • Scheduling: Hiermee geeft u de actieve periode, frequentie en interval van het innameschema weer.

Nadat u de gegevensstroom hebt gecontroleerd, selecteert u Finish en laat enige tijd voor de gegevensstroom worden gecreeerd.

revisie

Uw gegevensstroom controleren

Zodra uw gegevensstroom is gecreeerd, kunt u de gegevens controleren die door het worden opgenomen om informatie over innamepercentages, succes, en fouten te zien. Voor meer informatie over hoe te om dataflow te controleren, zie de zelfstudie op het controleren van rekeningen en gegevensstromen in UI.

Uw gegevensstroom verwijderen

U kunt gegevensstromen schrappen die niet meer noodzakelijk of verkeerd gecreeerd gebruikend zijn Delete functie beschikbaar in de Dataflows werkruimte. Raadpleeg de zelfstudie voor meer informatie over het verwijderen van gegevensstromen gegevens verwijderen in de gebruikersinterface.

Volgende stappen

Door dit leerprogramma te volgen, hebt u met succes een dataflow gecreeerd om gegevens van uw protocolbron aan Platform te brengen. Binnenkomende gegevens kunnen nu door downstreamgebruikers worden gebruikt Platform diensten zoals Real-Time Customer Profile en Data Science Workspace. Raadpleeg de volgende documenten voor meer informatie:

WARNING
De interface van het Platform die in de volgende video wordt getoond is verouderd. Raadpleeg de bovenstaande documentatie voor de meest recente schermafbeeldingen en functionaliteit van de gebruikersinterface.
recommendation-more-help
337b99bb-92fb-42ae-b6b7-c7042161d089