Een gegevensstroom maken met een analysebron in de gebruikersinterface
Een dataflow is een geplande taak die gegevens van een bron aan een dataset in Adobe Experience Platform terugwint en opneemt. Deze zelfstudie bevat stappen voor het maken van een gegevensstroom voor een analysebron met behulp van de interface van het platform.
Aan de slag
Deze zelfstudie vereist een goed begrip van de volgende componenten van Platform:
-
Bronnen: Het platform staat gegevens toe om van diverse bronnen worden opgenomen terwijl het voorzien van u van de capaciteit om, inkomende gegevens te structureren te etiketteren en te verbeteren gebruikend Platform diensten.
-
Experience Data Model (XDM) Systeem: Het gestandaardiseerde kader waardoor het Experience Platform gegevens van de klantenervaring organiseert.
- Grondbeginselen van schemacompositie: Leer over de basisbouwstenen van schema's XDM, met inbegrip van zeer belangrijke principes en beste praktijken in schemacompositie.
- het leerprogramma van de Redacteur van het Schema: Leer hoe te om douaneschema's tot stand te brengen gebruikend de Redacteur UI van het Schema.
-
Real-Time Customer Profile: biedt een uniform, real-time consumentenprofiel dat is gebaseerd op geaggregeerde gegevens van meerdere bronnen.
-
Data Prep: staat gegevensengineers toe om gegevens in kaart te brengen, om te zetten en te bevestigen aan en van het Model van de Gegevens van de Ervaring (XDM).
Gegevens over gegevensstroom opgeven
Met de pagina Dataflow detail kunt u selecteren of u een bestaande gegevensset of een nieuwe gegevensset wilt gebruiken. Tijdens dit proces kunt u ook instellingen configureren voor Profile dataset , Error diagnostics , Partial ingestion en Alerts .
Een bestaande gegevensset gebruiken
Selecteer Existing dataset als u gegevens in een bestaande gegevensset wilt opnemen. U kunt of een bestaande dataset terugwinnen gebruikend de Advanced search optie of door door de lijst van bestaande datasets in het dropdown menu te scrollen. Zodra u een dataset hebt geselecteerd, verstrek een naam en een beschrijving voor uw gegevensstroom.
Een nieuwe gegevensset gebruiken
Om in een nieuwe dataset in te gaan, selecteer New dataset en verstrek dan een naam van de outputdataset en een facultatieve beschrijving. Selecteer vervolgens het schema dat u wilt toewijzen met de optie Advanced search of door door de lijst met bestaande schema's in het vervolgkeuzemenu te bladeren. Nadat u een schema hebt geselecteerd, geeft u een naam en een beschrijving voor de gegevensstroom op.
Profile en foutdiagnostiek inschakelen
Selecteer vervolgens de schakeloptie Profile dataset om de gegevensset in te schakelen voor Profile . Hierdoor kunt u een holistische weergave maken van de kenmerken en het gedrag van een entiteit. Gegevens van alle gegevenssets waarvoor Profile is ingeschakeld, worden opgenomen in Profile en wijzigingen worden toegepast wanneer u de gegevensstroom opslaat.
In Error diagnostics kunnen gedetailleerde foutberichten worden gegenereerd voor onjuiste records in de gegevensstroom, terwijl u in Partial ingestion gegevens met fouten kunt invoeren tot een bepaalde drempel die u handmatig definieert. Zie het gedeeltelijke overzicht van partijingestievoor meer informatie.
Waarschuwingen inschakelen
U kunt waarschuwingen inschakelen om meldingen te ontvangen over de status van uw gegevensstroom. Selecteer een waarschuwing in de lijst om u te abonneren op meldingen over de status van uw gegevensstroom. Voor meer informatie over alarm, zie de gids bij het intekenen aan bronalarm gebruikend UI.
Wanneer u klaar bent met het opgeven van details voor de gegevensstroom, selecteert u Next .
Gegevensvelden toewijzen aan een XDM-schema
De stap Mapping verschijnt, die u van een interface voorziet om de brongebieden van uw bronschema aan hun aangewezen doelXDM gebieden in het doelschema in kaart te brengen.
Platform biedt intelligente aanbevelingen voor automatisch toegewezen velden op basis van het doelschema of de gegevensset die u hebt geselecteerd. U kunt toewijzingsregels handmatig aanpassen aan uw gebruiksgevallen. Op basis van uw behoeften kunt u ervoor kiezen om velden rechtstreeks toe te wijzen of gegevens prep-functies te gebruiken om brongegevens om berekende of berekende waarden af te leiden. Voor uitvoerige stappen bij het gebruiken van de kaartperinterface en berekende gebieden, zie de gids UI van de Prep van Gegevens.
Selecteer Next wanneer de brongegevens correct zijn toegewezen.
Planninguitvoering
De stap Scheduling verschijnt, die u toestaat om een innameprogramma te vormen om de geselecteerde brongegevens automatisch in te nemen gebruikend de gevormde afbeeldingen. De planning wordt standaard ingesteld op Once
. Als u de innamefrequentie wilt aanpassen, selecteert u Frequency en vervolgens een optie in het vervolgkeuzemenu.
Als u de innamefrequentie instelt op Minute
, Hour
, Day
of Week
, moet u een interval instellen om een bepaald tijdkader tussen elke inname te maken. Als de innamefrequentie bijvoorbeeld is ingesteld op Day
en als het interval is ingesteld op 15
, worden gegevens elke 15 dagen opgenomen.
Tijdens deze stap, kunt u backfill ook toelaten en een kolom voor de stijgende opname van gegevens bepalen. Backfill wordt gebruikt om historische gegevens in te voeren, terwijl in de kolom die u voor incrementele inname definieert, nieuwe gegevens kunnen worden onderscheiden van bestaande gegevens.
Zie de lijst hieronder voor meer informatie over het plannen van configuraties.
Vorm frequentie om erop te wijzen hoe vaak dataflow zou moeten lopen. U kunt de frequentie instellen op:
- Eenmaal: Plaats uw frequentie aan
once
om eenmalig te creëren. Configuraties voor interval en backfill zijn niet beschikbaar wanneer u een eenmalige gegevensstroom maakt. Standaard wordt de planningsfrequentie ingesteld op één keer. - Minuut: Plaats uw frequentie aan
minute
om uw gegevensstroom te plannen om gegevens op een per-minieme basis in te voeren. - Uur: Plaats uw frequentie aan
hour
om uw gegevensstroom te plannen om gegevens op een per-uurbasis in te voeren. - Dag: Plaats uw frequentie aan
day
om uw gegevensstroom te plannen om gegevens op een per-dagbasis in te voeren. - Week: Plaats uw frequentie aan
week
om uw gegevensstroom te plannen om gegevens op een per-weekbasis in te voeren.
Zodra u een frequentie selecteert, kunt u het interval dat dan vormen om het tijdkader tussen elke opname te vestigen. Bijvoorbeeld, als u uw frequentie aan dag plaatst en het interval aan 15 vormt, dan zal uw dataflow om de 15 dagen lopen. U kunt het interval niet instellen op nul. De minimaal toegestane intervalwaarde voor elke frequentie is als volgt:
- Eenmaal: n/a
- Minuut: 15
- Uur: 1
- Dag: 1
- Week: 1
Controleer uw gegevensstroom
De stap Review wordt weergegeven, zodat u de nieuwe gegevensstroom kunt bekijken voordat deze wordt gemaakt. De details worden gegroepeerd in de volgende categorieën:
- Connection: geeft het brontype, het relevante pad van het gekozen bronbestand en de hoeveelheid kolommen in dat bronbestand weer.
- Assign dataset & map fields: Toont welke dataset de brongegevens worden opgenomen in, met inbegrip van het schema dat de dataset volgt aan.
- Scheduling: geeft de actieve periode, frequentie en interval van het innameschema weer.
Nadat u de gegevensstroom hebt gereviseerd, selecteert u Finish en laat u enige tijd over om de gegevensstroom te maken.
Uw gegevensstroom controleren
Zodra uw gegevensstroom is gecreeerd, kunt u de gegevens controleren die door het worden opgenomen om informatie over innamepercentages, succes, en fouten te zien. Voor meer informatie over hoe te om dataflow te controleren, zie het leerprogramma op controlerekeningen en dataflows in UI.
Uw gegevensstroom verwijderen
U kunt gegevensstromen verwijderen die niet meer nodig zijn of die onjuist zijn gemaakt met de functie Delete die beschikbaar is in de Dataflows -werkruimte. Voor meer informatie over hoe te om dataflows te schrappen, zie het leerprogramma bij het schrappen van dataflows in UI.
Volgende stappen
Door deze zelfstudie te volgen, hebt u een gegevensstroom gemaakt om gegevens van uw analysebron naar Platform te brengen. Binnenkomende gegevens kunnen nu worden gebruikt door Platform -services, zoals Real-Time Customer Profile en Data Science Workspace . Raadpleeg de volgende documenten voor meer informatie: