Konfigurieren eines Datenflusses zum Erfassen von Batch-Daten aus einer Cloud-Speicherquelle in der Benutzeroberfläche
In diesem Tutorial erfahren Sie, wie Sie einen Datenfluss konfigurieren, um Batch-Daten von Ihrer Cloud-Speicherquelle an Adobe Experience Platform zu übertragen.
Erste Schritte
Dieses Tutorial setzt ein Grundverständnis der folgenden Komponenten von Experience Platform voraus:
-
Experience Data Model (XDM) System: Das standardisierte Framework, mit dem Experience Platform Kundenerlebnisdaten organisiert.
- Grundlagen der Schemakomposition: Machen Sie sich mit den grundlegenden Bausteinen von XDM-Schemata vertraut, einschließlich der wichtigsten Prinzipien und Best Practices bei der Schemaerstellung.
- Tutorial zum Schema-Editor: Erfahren Sie, wie Sie benutzerdefinierte Schemata mithilfe der Benutzeroberfläche des Schema-Editors erstellen können.
-
Real-Time Customer Profile: Bietet ein einheitliches Echtzeit-Kundenprofil, das auf aggregierten Daten aus verschiedenen Quellen basiert.
Unterstützte Dateiformate
Cloud-Speicherquellen für Batch-Daten unterstützen die folgenden Dateiformate für die Erfassung:
- Trennzeichen-Werte (DSV): Jeder einzelne Wert kann als Trennzeichen für DSV-formatierte Datendateien verwendet werden.
- JavaScript Object Notation (JSON): JSON-formatierte Datendateien müssen XDM-konform sein.
- Apache Parquet: Parquet-formatierte Datendateien müssen XDM-konform sein.
- Komprimierte Dateien: JSON- und durch Trennzeichen getrennte Dateien können wie folgt komprimiert werden:
bzip2
,gzip
,deflate
,zipDeflate
,tarGzip
undtar
.
Daten hinzufügen
Nachdem Sie Ihr Cloud-Speicherkonto erstellt haben, wird der Schritt Daten hinzufügen angezeigt. Dort können Sie Ihre Cloud-Speicher-Dateihierarchie durchsuchen und den Ordner oder die spezifische Datei auswählen, den/die Sie in Platform laden möchten.
- Der linke Teil der Benutzeroberfläche ist ein Ordner-Browser, der Ihre Cloud-Speicher-Dateihierarchie anzeigt.
- Im rechten Bereich der Benutzeroberfläche können Sie eine Vorschau von bis zu 100 Zeilen mit Daten aus einem kompatiblen Ordner oder einer kompatiblen Datei anzeigen.
Wählen Sie den Stammordner aus, um auf Ihre Ordnerhierarchie zuzugreifen. Von hier aus können Sie einen einzelnen Ordner auswählen, um alle Dateien rekursiv in den Ordner aufzunehmen. Beim Erfassen eines ganzen Ordners müssen Sie sicherstellen, dass alle Dateien in diesem Ordner dasselbe Datenformat und Schema aufweisen.
Nachdem Sie einen Ordner ausgewählt haben, wird die richtige Oberfläche aktualisiert, um eine Vorschau des Inhalts und der Struktur der ersten Datei im ausgewählten Ordner anzuzeigen.
Während dieses Schritts können Sie mehrere Konfigurationen an Ihren Daten vornehmen, bevor Sie fortfahren. Wählen Sie zunächst Datenformat und dann im angezeigten Dropdown-Bedienfeld das entsprechende Datenformat für Ihre Datei aus.
In der folgenden Tabelle werden die entsprechenden Datenformate für die unterstützten Dateitypen angezeigt:
Spaltentrennzeichen auswählen
Nach der Konfiguration Ihres Datenformats können Sie beim Erfassen von durch Trennzeichen getrennten Dateien ein Spaltentrennzeichen festlegen. Wählen Sie die Option Trennzeichen und dann ein Trennzeichen aus dem Dropdown-Menü aus. Im Menü werden die am häufigsten verwendeten Optionen für Trennzeichen angezeigt, darunter ein Komma (,
), eine Registerkarte (\t
) und ein senkrechter Strich (|
).
Wenn Sie lieber ein benutzerdefiniertes Trennzeichen verwenden möchten, wählen Sie "Benutzerdefiniert"und geben Sie in die Popup-Eingabeleiste ein Trennzeichen mit einem einzelnen Zeichen Ihrer Wahl ein.
Komprimierte Dateien erfassen
Sie können auch komprimierte JSON- oder durch Trennzeichen getrennte Dateien erfassen, indem Sie deren Komprimierungstyp angeben.
Wählen Sie im Schritt Daten auswählen eine komprimierte Datei für die Aufnahme aus und wählen Sie dann den entsprechenden Dateityp aus und ob er XDM-kompatibel ist oder nicht. Wählen Sie als Nächstes Komprimierungstyp und dann den entsprechenden komprimierten Dateityp für die Quelldaten aus.
Um eine bestimmte Datei in Platform zu laden, wählen Sie einen Ordner aus und wählen Sie dann die Datei aus, die Sie aufnehmen möchten. Während dieses Schritts können Sie auch eine Vorschau des Dateiinhalts anderer Dateien in einem bestimmten Ordner anzeigen, indem Sie das Vorschausymbol neben einem Dateinamen verwenden.
Wenn Sie fertig sind, klicken Sie auf die Schaltfläche Weiter.
Angeben von Datenflussdetails
Auf der Seite Datenflussdetails können Sie auswählen, ob Sie einen vorhandenen Datensatz oder einen neuen Datensatz verwenden möchten. Während dieses Vorgangs können Sie Ihre Daten auch so konfigurieren, dass sie in das Profil aufgenommen werden, und Einstellungen wie Fehlerdiagnose, Partielle Erfassung und Warnhinweise aktivieren.
Verwenden eines vorhandenen Datensatzes
Um Daten in einen vorhandenen Datensatz aufzunehmen, wählen Sie Vorhandener Datensatz. Sie können einen vorhandenen Datensatz entweder über die Option Erweiterte Suche oder durch Scrollen durch die Liste der vorhandenen Datensätze im Dropdown-Menü abrufen. Nachdem Sie einen Datensatz ausgewählt haben, geben Sie einen Namen und eine Beschreibung für Ihren Datenfluss ein.
Verwenden eines neuen Datensatzes
Für ein Aufnehmen in einen neuen Datensatz wählen Sie Neuer Datensatz aus und geben Sie einen Namen für den Ausgabedatensatz und eine optionale Beschreibung an. Wählen Sie als Nächstes mithilfe der Option Erweiterte Suche oder durch Scrollen durch die Liste der vorhandenen Schemata im Dropdown-Menü ein Schema zum Zuordnen aus. Nachdem Sie ein Schema ausgewählt haben, geben Sie einen Namen und eine Beschreibung für Ihren Datenfluss ein.
Profil- und Fehlerdiagnose aktivieren
Wählen Sie als Nächstes den Umschalter Profildatensatz aus, um Ihren Datensatz für Profil zu aktivieren. Auf diese Weise können Sie eine ganzheitliche Ansicht der Attribute und Verhaltensweisen einer Entität erstellen. Daten aus allen profilaktivierten Datensätzen werden in das Profil aufgenommen und Änderungen werden angewendet, wenn Sie Ihren Datenfluss speichern.
Fehlerdiagnose ermöglicht eine detaillierte Erstellung von Fehlermeldungen für alle fehlerhaften Datensätze, die in Ihrem Datenfluss auftreten, während Partielle Aufnahme die Aufnahme von fehlerhaften Daten bis zu einem gewissen Schwellenwert, den Sie manuell definieren, ermöglicht. Weitere Informationen finden Sie in der Übersicht zur partiellen Batch-Aufnahme.
Aktivieren von Warnhinweisen
Sie können Warnhinweise aktivieren, um Benachrichtigungen zum Status Ihres Datenflusses zu erhalten. Wählen Sie einen Warnhinweis aus der zu abonnierenden Liste aus, um Benachrichtigungen über den Status Ihres Datenflusses zu erhalten. Weitere Informationen zu Warnhinweisen finden Sie im Handbuch zum Abonnieren von Warnhinweisen zu Quellen über die Benutzeroberfläche.
Wenn Sie mit dem Eingeben der Details für Ihren Datenfluss fertig sind, klicken Sie auf Weiter.
Zuordnen von Datenfeldern zu einem XDM-Schema
Es erfolgt der Schritt der Zuordnung, in dem Ihnen eine Schnittstelle zum Zuordnen der Quellfelder aus Ihrem Quellschema zu den entsprechenden XDM-Zielfeldern im Zielschema bereitgestellt wird.
Platform bietet intelligente Empfehlungen für automatisch zugeordnete Felder, die auf dem ausgewählten Zielschema oder Datensatz basieren. Sie können die Zuordnungsregeln manuell an Ihre Anwendungsfälle anpassen. Je nach Bedarf können Sie wahlweise Felder direkt zuordnen oder mithilfe von Datenvorbereitungsfunktionen Quelldaten transformieren, um berechnete oder anderweitig ermittelte Werte abzuleiten. Umfassende Schritte zur Verwendung der Zuordnungsoberfläche und der berechneten Felder finden Sie im Handbuch Data Prep UI guide.
Nachdem die Quelldaten erfolgreich zugeordnet wurden, wählen Sie Weiter aus.
Erfassungsläufe planen
Der Schritt Planung wird angezeigt, in dem Sie einen Aufnahmeplan konfigurieren können, um die ausgewählten Quelldaten mithilfe der konfigurierten Zuordnungen automatisch zu erfassen. Standardmäßig ist die Planung auf Once
eingestellt. Um die Aufnahmefrequenz anzupassen, wählen Sie Häufigkeit und dann eine Option aus dem Dropdown-Menü aus.
Wenn Sie die Aufnahmefrequenz auf Minute
, Hour
, Day
oder Week
festlegen, müssen Sie ein Intervall festlegen, um einen bestimmten Zeitrahmen zwischen jeder Aufnahme festzulegen. Beispielsweise bedeutet eine Erfassungsfrequenz, die auf "Day
"und ein auf "15
"festgelegtes Intervall, dass Ihr Datenfluss alle 15 Tage Daten aufnehmen soll.
Während dieses Schritts können Sie auch Aufstockung aktivieren und eine Spalte für die inkrementelle Aufnahme von Daten definieren. Die Aufstockung wird verwendet, um historische Daten zu erfassen, während die Spalte, die Sie für die inkrementelle Erfassung definieren, es ermöglicht, neue Daten von vorhandenen Daten zu unterscheiden.
Weitere Informationen zu Planungskonfigurationen finden Sie in der Tabelle unten.
Konfigurieren Sie die Häufigkeit, mit der der Datenfluss ausgeführt werden soll. Sie können die Häufigkeit wie folgt einstellen:
- Einmal: Setzen Sie Ihre Häufigkeit auf
once
, um eine einmalige Erfassung zu erstellen. Konfigurationen für Intervall und Aufstockung sind beim Erstellen eines einmaligen Erfassungsdataflods nicht verfügbar. Standardmäßig ist die Planung auf einmal eingestellt. - Minute: Setzen Sie Ihre Häufigkeit auf
minute
, um Ihren Datenfluss so zu planen, dass Daten pro Minute erfasst werden. - Stunde: Setzen Sie Ihre Häufigkeit auf "
hour
", um Ihren Datenfluss so zu planen, dass er Daten pro Stunde erfasst. - Tag: Setzen Sie Ihre Häufigkeit auf "
day
", um Ihren Datenfluss so zu planen, dass er Daten pro Tag erfasst. - Woche: Setzen Sie Ihre Häufigkeit auf "
week
", um Ihren Datenfluss so zu planen, dass er Daten pro Woche erfasst.
Nachdem Sie eine Frequenz ausgewählt haben, können Sie die Intervalleinstellung konfigurieren, um den Zeitrahmen zwischen jeder Aufnahme festzulegen. Wenn Sie beispielsweise Ihre Häufigkeit auf "Tag"festlegen und das Intervall auf 15 konfigurieren, wird Ihr Datenfluss alle 15 Tage ausgeführt. Sie können das Intervall nicht auf null festlegen. Der akzeptierte Mindestintervallwert für jede Frequenz lautet wie folgt:
- Einmal: nicht zutreffend
- Minute: 15
- Hour: 1
- Tag: 1
- Woche: 1
Wählen Sie nach Abschluss der Konfiguration Ihres Aufnahmezeitplans Weiter aus.
Überprüfen des Datenflusses
Der Schritt Überprüfung wird angezeigt, sodass Sie Ihren neuen Datenfluss überprüfen können, bevor er hergestellt wird. Die Details lassen sich wie folgt kategorisieren:
- Verbindung: Zeigt den Quelltyp, den relevanten Pfad der ausgewählten Quelldatei und die Anzahl der Spalten innerhalb dieser Quelldatei an.
- Datensatz- und Zuordnungsfelder zuweisen: Zeigt an, in welchen Datensatz die Quelldaten aufgenommen werden, einschließlich des Schemas, dem der Datensatz entspricht.
- Planung: Zeigt den aktiven Zeitraum, die Häufigkeit und das Intervall des Aufnahmezeitplans an.
Nachdem Sie Ihren Datenfluss überprüft haben, klicken Sie auf Beenden und lassen Sie die Erstellung des Datenflusses etwas Zeit zu.
Nächste Schritte
In diesem Tutorial haben Sie erfolgreich einen Datenfluss erstellt, um Daten aus einem externen Cloud-Speicher einzubringen und Einblicke in die Überwachung von Datensätzen zu erhalten. Um mehr über die Erstellung von Datenflüssen zu erfahren, ergänzen Sie Ihr Lernen, indem Sie sich das folgende Video ansehen. Darüber hinaus können eingehende Daten jetzt von nachgelagerten Platform-Diensten wie Real-Time Customer Profile und Data Science Workspace verwendet werden. Weiterführende Informationen finden Sie in folgenden Dokumenten:
Anhang
Die folgenden Abschnitte enthalten zusätzliche Informationen zum Arbeiten mit Quell-Connectoren.
Überwachen Ihres Datenflusses
Nachdem Ihr Datenfluss erstellt wurde, können Sie die erfassten Daten überwachen, um Informationen zu Erfassungsraten, Erfolg und Fehlern anzuzeigen. Weitere Informationen zum Überwachen des Datenflusses finden Sie im Tutorial zum Überwachen von Konten und Datenflüssen in der Benutzeroberfläche.
Aktualisieren des Datenflusses
Um Konfigurationen für die Planung, Zuordnung und allgemeine Informationen Ihrer Datenflüsse zu aktualisieren, besuchen Sie das Tutorial zum Aktualisieren der Datenflüsse für Quellen in der Benutzeroberfläche 🔗 .
Löschen des Datenflusses
Datenflüsse, die nicht mehr erforderlich sind oder nicht korrekt erstellt wurden, können Sie löschen, indem Sie dazu die Funktion Löschen im Arbeitsbereich Datenflüsse verwenden. Weitere Informationen zum Löschen von Datenflüssen finden Sie im Tutorial zum Löschen von Datenflüssen in der Benutzeroberfläche 🔗.