Konfigurieren eines Datenflusses für eine Cloud-Datenspeicherung-Batch-Verbindung in der Benutzeroberfläche

Ein Datennachweis ist eine geplante Aufgabe, mit der Daten aus einer Quelle abgerufen und in einen Platform-Datensatz eingefügt werden. In diesem Lernprogramm werden die Schritte zum Konfigurieren eines neuen Datenflusses mit Ihrem Cloud-Datenspeicherung-Konto beschrieben.

Erste Schritte

Dieses Tutorial setzt ein Grundverständnis der folgenden Komponenten von Adobe Experience Platform voraus:

  • Experience Data Model (XDM) System: Das standardisierte Framework, mit dem Kundenerlebnisdaten Experience Platform organisiert werden.
    • Grundlagen der Schemakomposition: Machen Sie sich mit den Grundbausteinen von XDM-Schemas sowie den zentralen Konzepten und Best Practices rund um die Erstellung von Schemas vertraut.
    • Schema-Editor-Lernprogramm: Erfahren Sie, wie Sie mit der Benutzeroberfläche des Schema-Editors benutzerdefinierte Schema erstellen.
  • Real-time Customer Profile: Bietet ein einheitliches, Echtzeit-Profil für Kunden, das auf aggregierten Daten aus mehreren Quellen basiert.

Darüber hinaus erfordert dieses Lernprogramm, dass Sie über ein Konto für die Cloud-Datenspeicherung verfügen. Eine Liste von Übungen zum Erstellen verschiedener Cloud-Datenspeicherung-Konten in der Benutzeroberfläche finden Sie unter Übersicht über die Quellschnittstellen.

Unterstützte Dateiformate

Experience Platform unterstützt die folgenden Dateiformate, die von externen Datenspeicherung erfasst werden:

  • Trennzeichen-getrennte Werte (DSV): Die Unterstützung für DSV-formatierte Datendateien ist derzeit auf kommagetrennte Werte beschränkt. Der Wert von Feldkopfzeilen in DSV-formatierten Dateien darf nur aus alphanumerischen Zeichen und Unterstrichen bestehen. Die Unterstützung für allgemeine DSV-Dateien wird in Zukunft bereitgestellt.
  • JavaScript Object Notation (JSON): JSON-formatierte Datendateien müssen XDM-konform sein.
  • Apache Parquet: Parquet-formatierte Datendateien müssen XDM-konform sein.

Daten auswählen

Nachdem Sie Ihr Cloud-Datenspeicherung-Konto erstellt haben, wird der Schritt Daten auswählen angezeigt und bietet eine Oberfläche, über die Sie die Dateihierarchie in Ihrer Cloud-Datenspeicherung untersuchen können.

  • Die linke Hälfte der Oberfläche ist ein Ordnerbrowser, der die Dateien und Ordner Ihres Servers anzeigt.
  • In der rechten Hälfte der Oberfläche können Sie bis zu 100 Datenzeilen aus einer kompatiblen Datei Vorschau werden.

Wenn Sie einen aufgelisteten Ordner auswählen, können Sie die Ordnerhierarchie in tiefere Ordner durchlaufen. Wenn Sie eine kompatible Datei oder einen kompatiblen Ordner ausgewählt haben, wird das Dropdown-Menü Datenformat auswählen angezeigt, in dem Sie ein Format auswählen können, in dem die Daten im Fenster "Vorschau"angezeigt werden sollen.

Wählen Sie das gewünschte Datenformat für die zu erfassende Datei aus und lassen Sie das Ausfüllen des Fensters "Vorschau"einige Sekunden lang zu.

Sie können beim Eingeben von getrennten Dateien ein benutzerdefiniertes Trennzeichen festlegen. Wählen Sie die Option Trennzeichen und dann ein Trennzeichen aus dem Dropdown-Menü. Im Menü werden die am häufigsten verwendeten Optionen für Trennzeichen angezeigt, darunter ein Komma (,), ein Tabulator (\t) und ein Rohr (|). Alternativ dazu können Sie Benutzerdefiniert auswählen und in der Popup-Eingabeleiste ein benutzerdefiniertes Trennzeichen Ihrer Wahl eingeben.

Nachdem Sie das Datenformat ausgewählt und das Trennzeichen festgelegt haben, wählen Sie Weiter.

Parquet- oder JSON-Dateien aufnehmen

Cloud-Datenspeicherung-Konten unterstützen auch JSON- und Parquet-Dateien. Parquet-Dateien müssen XDM-konform sein, während JSON-Dateien keine XDM-Beschwerde sein müssen. Um JSON- oder Parquet-Dateien zu erfassen, wählen Sie das entsprechende Dateiformat im Ordnerbrowser aus und wenden Sie auf der rechten Benutzeroberfläche das kompatible Datenformat an.

Wenn das Datenformat in JSON vorliegt, wird eine Vorschau mit Informationen zu den Daten in der Datei angezeigt. Im Bildschirm "Vorschau"können Sie mithilfe der Dropdownliste XDM-kompatibel auswählen, ob JSON XDM-konform ist.

Wählen Sie Weiter, um fortzufahren.

WICHTIG

Im Gegensatz zu getrennten und JSON-Dateitypen stehen parquet-formatierte Dateien nicht zur Vorschau zur Verfügung.

Zuordnen von Datenfeldern zu einem XDM-Schema

Der Schritt Zuordnung wird angezeigt und stellt eine interaktive Schnittstelle bereit, um die Quelldaten einem Platform-Datensatz zuzuordnen. Quelldateien, die in Parquet formatiert wurden, müssen XDM-konform sein und müssen nicht manuell konfiguriert werden, während für CSV-Dateien explizit die Zuordnung konfiguriert werden muss. Sie müssen jedoch festlegen, welche Quelldatenfelder zugeordnet werden sollen. JSON-Dateien, die als XDM-Beschwerde markiert sind, müssen nicht manuell konfiguriert werden. Wenn es jedoch nicht als XDM-kompatibel markiert ist, müssen Sie die Zuordnung explizit konfigurieren.

Wählen Sie einen Datensatz, in den eingehende Daten aufgenommen werden sollen. Sie können entweder einen vorhandenen Datensatz verwenden oder einen neuen erstellen.

Vorhandenen Datensatz verwenden

Um Daten in einen vorhandenen Datensatz zu erfassen, wählen Sie Vorhandener Datensatz und klicken Sie dann auf das Dataset-Symbol.

Das Dialogfeld Datensatz auswählen wird angezeigt. Suchen Sie den gewünschten Datensatz, wählen Sie ihn aus und klicken Sie dann auf Weiter.

Verwenden eines neuen Datensatzes

Um Daten in einen neuen Datensatz zu erfassen, wählen Sie Neuer Datensatz aus und geben Sie in die entsprechenden Felder einen Namen und eine Beschreibung für den Datensatz ein. Um ein Schema hinzuzufügen, können Sie im Dialogfeld Schema auswählen einen vorhandenen Schema eingeben. Alternativ können Sie die erweiterte Suche Schema auswählen, um nach einem geeigneten Schema zu suchen.

In diesem Schritt können Sie Ihren Datensatz für Real-time Customer Profile aktivieren und eine holistische Ansicht der Attribute und Verhaltensweisen einer Entität erstellen. Daten aus allen aktivierten Datensätzen werden in Profile eingeschlossen und beim Speichern des Datenflusses werden Änderungen angewendet.

Schalten Sie die Schaltfläche Profil-Datensatz um, um Ihren Zielgruppen-Datensatz für Profile zu aktivieren.

Das Dialogfeld Schema auswählen wird angezeigt. Wählen Sie das Schema, das Sie auf den neuen Datensatz anwenden möchten, und wählen Sie Fertig.

Je nach Bedarf können Sie Felder direkt zuordnen oder mithilfe der Zuordnungsfunktionen Quelldaten transformieren, um berechnete oder berechnete Werte abzuleiten. Weitere Informationen zu Datenzuordnungs- und -zuordnungsfunktionen finden Sie im Lernprogramm Zuordnen von CSV-Daten zu XDM-Schema-Feldern.

Bei JSON-Datenspeicherung können Sie nicht nur Felder direkt anderen Feldern zuordnen, sondern auch Objekten und Arrays anderen Arrays direkt zuordnen. Komplexe Datentypen wie Arrays in JSON-Dateien können auch über einen Cloud-Quellanschluss Vorschau und zugeordnet werden.

Bitte beachten Sie, dass Sie keine Karten für verschiedene Typen erstellen können. Sie können beispielsweise ein Objekt einem Array oder einem Feld einem Objekt nicht zuordnen.

TIPP

Platform bietet intelligente Empfehlungen für automatisch zugeordnete Zielgruppen, die auf dem von Ihnen ausgewählten Schema oder Datensatz basieren. Sie können Zuordnungsregeln manuell an Ihre Anwendungsfälle anpassen.

Wählen Sie Vorschau data aus, um die Zuordnungsergebnisse von bis zu 100 Zeilen mit Musterdaten aus dem ausgewählten Datensatz anzuzeigen.

Während der Vorschau wird die Identitätsspalte als erstes Feld priorisiert, da sie die wichtigen Informationen darstellt, die bei der Validierung der Zuordnungsergebnisse erforderlich sind.

Sobald die Quelldaten zugeordnet sind, wählen Sie Schließen.

Planen von Erfassungsabläufen

Der Schritt Einplanen wird angezeigt, mit dem Sie einen Zeitplan für die Erfassung konfigurieren können, um die ausgewählten Quelldaten automatisch mit den konfigurierten Zuordnungen zu erfassen. In der folgenden Tabelle sind die verschiedenen konfigurierbaren Felder für die Planung aufgeführt:

Feld Beschreibung
Häufigkeit Zu den auswählbaren Frequenzen gehören Once, Minute, Hour, Day und Week.
Intervall Eine Ganzzahl, die das Intervall für die ausgewählte Frequenz festlegt.
Beginn Ein UTC-Zeitstempel, der angibt, wann die erste Erfassung erfolgen soll.
Aufstockung Ein boolescher Wert, der bestimmt, welche Daten ursprünglich erfasst werden. Ist Aufstockung aktiviert, werden alle aktuellen Dateien im angegebenen Pfad während der ersten geplanten Erfassung erfasst. Wenn Aufstockung deaktiviert ist, werden nur die Dateien erfasst, die zwischen der ersten Ausführung der Erfassung und der Beginn geladen werden. Dateien, die vor dem Beginn geladen wurden, werden nicht erfasst.

Datenflüsse sind so konzipiert, dass Daten auf planmäßiger Basis automatisch erfasst werden. Beginn durch Auswahl der Aufnahmefrequenz. Legen Sie als Nächstes das Intervall fest, um den Zeitraum zwischen zwei Flussläufen festzulegen. Der Wert des Intervalls sollte eine Ganzzahl ungleich null sein und auf größer oder gleich 15 gesetzt werden.

Um die Erfassungszeit des Beginns festzulegen, passen Sie das Datum und die Uhrzeit an, die im Feld "Beginn"angezeigt werden. Alternativ können Sie das Kalendersymbol auswählen, um den Zeitwert des Beginns zu bearbeiten. Die Beginn-Zeit muss größer oder gleich der aktuellen Uhrzeit in UTC sein.

Geben Sie Werte für den Zeitplan ein und wählen Sie Weiter.

Einrichten eines einmaligen Erfassungsdataflow

Um eine einmalige Erfassung einzurichten, wählen Sie den Dropdown-Pfeil für die Häufigkeit aus und wählen Sie Once. Sie können die Bearbeitung eines Datensatzes für eine einmalige Erfassung der Häufigkeit fortsetzen, solange der Beginn in der Zukunft verbleibt. Nach Ablauf des Beginns kann der Wert für die einmalige Häufigkeit nicht mehr bearbeitet werden. Bei der Einrichtung eines einmaligen Datenflusses sind keine Intervaland- ​Backfillments sichtbar.

WICHTIG

Es wird dringend empfohlen, den Datendurchlauf für eine einmalige Erfassung zu planen, wenn der FTP Connector verwendet wird.

Nachdem Sie die entsprechenden Werte für den Zeitplan angegeben haben, wählen Sie Weiter.

Datenflussinformationen bereitstellen

Der Schritt Datentiefe wird angezeigt, mit dem Sie einen Namen eingeben und eine kurze Beschreibung zu Ihrem neuen Datenpfad geben können.

Während dieses Prozesses können Sie auch die Optionen Partielle Erfassung und Fehlerdiagnose aktivieren. Durch Aktivierung von Partielle Erfassung können Sie Daten mit Fehlern bis zu einem bestimmten Schwellenwert erfassen, den Sie festlegen können. Wenn Sie Fehlerdiagnose aktivieren, werden Details zu fehlerhaften Daten bereitgestellt, die separat gestapelt werden. Weitere Informationen finden Sie unter Übersicht über die teilweise Stapelverarbeitung.

Geben Sie Werte für den Datenfluss ein und wählen Sie Weiter.

Überprüfen Sie Ihren Datenfluss

Der Schritt Überprüfen wird angezeigt, mit dem Sie Ihren neuen Datenpfad überprüfen können, bevor er erstellt wird. Details werden in den folgenden Kategorien gruppiert:

  • Verbindung: Zeigt den Quelltyp, den relevanten Pfad der ausgewählten Quelldatei und die Anzahl der Spalten in dieser Quelldatei an.
  • Zuweisen von Dataset- und Zuordnungsfeldern: Zeigt, in welchen Datensatz die Quelldaten aufgenommen werden, einschließlich des Schemas, das der Datensatz einhält.
  • Planung: Zeigt den aktiven Zeitraum, die Häufigkeit und das Intervall des Aufnahmeplans an.

Klicken Sie nach Überprüfung Ihres Datenflusses auf Fertig stellen und lassen Sie etwas Zeit für die Erstellung des Datenflusses zu.

Überwachen des Datenflusses

Nachdem Sie Ihren Datenbogen erstellt haben, können Sie die Daten überwachen, die über ihn erfasst werden, um Informationen zu Erfassungsraten, Erfolgen und Fehlern anzuzeigen. Weitere Informationen zur Überwachung des Datenflusses finden Sie im Lernprogramm zu Überwachungskonten und Datenflüssen in der Benutzeroberfläche.

Datenflug löschen

Sie können Datenflüsse löschen, die nicht mehr benötigt werden oder mit der Funktion Delete, die im Arbeitsbereich Datenflüsse verfügbar ist, falsch erstellt wurden. Weitere Informationen zum Löschen von Datenflüssen finden Sie im Lernprogramm zum Löschen von Datenflüssen in der Benutzeroberfläche.

Nächste Schritte

In diesem Lernprogramm haben Sie erfolgreich einen Datenbogen erstellt, um Daten aus einer externen Cloud-Datenspeicherung einzubringen, und Einblicke in die Überwachung von Datensätzen erhalten. Um mehr über das Erstellen von Datenflüssen zu erfahren, können Sie Ihr Lernen durch das Video unten ergänzen. Darüber hinaus können eingehende Daten jetzt von nachgeschalteten Platform-Diensten wie Real-time Customer Profile und Data Science Workspace verwendet werden. Weitere Informationen finden Sie in den folgenden Dokumenten:

WARNUNG

Die im folgenden Video angezeigte Platform-Benutzeroberfläche ist veraltet. Die neuesten Screenshots und Funktionen der Benutzeroberfläche finden Sie in der obigen Dokumentation.

Anhang

Die folgenden Abschnitte enthalten zusätzliche Informationen zum Arbeiten mit Quellschnittstellen.

Datentaflow deaktivieren

Beim Erstellen eines Datenflusses wird dieser sofort aktiv und erfasst Daten gemäß dem festgelegten Zeitplan. Sie können einen aktiven Datenfeed jederzeit deaktivieren, indem Sie die unten stehenden Anweisungen befolgen.

Klicken Sie im Arbeitsbereich Quellen auf die Registerkarte Durchsuchen. Klicken Sie anschließend auf den Namen des Kontos, das dem aktiven Datenpfad zugeordnet ist, den Sie deaktivieren möchten.

Die Aktivität Quelle wird angezeigt. Wählen Sie den aktiven Datenfluss aus der Liste aus, um die zugehörige Spalte Properties auf der rechten Seite des Bildschirms zu öffnen, die die Umschalter Enabled enthält. Klicken Sie auf den Umschalter, um den Datenflug zu deaktivieren. Derselbe Umschalter kann verwendet werden, um einen Datenflug nach dessen Deaktivierung erneut zu aktivieren.

Aktivieren von Eingangsdaten für Profile Population

Eingehende Daten aus Ihrem Quellanschluss können zur Anreicherung und zum Ausfüllen Ihrer Real-time Customer Profile-Daten verwendet werden. Weitere Informationen zum Ausfüllen der Real-time Customer Profile-Daten finden Sie im Lernprogramm Profil population.

Auf dieser Seite