Konfigurieren eines Datenflusses für eine Cloud-Speicher-Batch-Verbindung in der Benutzeroberfläche

Ein Datenfluss ist eine geplante Aufgabe, die Daten aus einer Quelle abruft und in einen Platform -Datensatz erfasst. In diesem Tutorial werden Schritte zum Konfigurieren eines neuen Datenflusses mithilfe Ihres Cloud-Speicherkontos beschrieben.

Erste Schritte

Dieses Tutorial setzt ein Grundverständnis der folgenden Komponenten von Adobe Experience Platform voraus:

  • Experience Data Model (XDM) System: Das standardisierte Framework, mit dem Kundenerlebnisdaten Experience Platform organisiert werden.
    • Grundlagen der Schemakomposition: Machen Sie sich mit den Grundbausteinen von XDM-Schemas sowie den zentralen Konzepten und Best Practices rund um die Erstellung von Schemas vertraut.
    • Tutorial zum Schema Editor: Erfahren Sie, wie Sie benutzerdefinierte Schemas mithilfe der Benutzeroberfläche des Schema-Editors erstellen.
  • Real-time Customer Profile: Bietet ein einheitliches Echtzeit-Kundenprofil, das auf aggregierten Daten aus verschiedenen Quellen basiert.

Darüber hinaus erfordert dieses Tutorial, dass Sie über ein eingerichtetes Cloud-Speicher-Konto verfügen. Eine Liste der Tutorials zum Erstellen verschiedener Cloud-Speicher-Konten in der Benutzeroberfläche finden Sie in der Übersicht über Quell-Connectoren.

Unterstützte Dateiformate

Experience Platform unterstützt die folgenden Dateiformate, die aus externen Speichern erfasst werden:

  • Trennzeichen (DSV): Jeder einzelne Wert kann als Trennzeichen für Datendateien im DSV-Format verwendet werden.
  • JavaScript Object Notation (JSON): JSON-formatierte Datendateien müssen XDM-konform sein.
  • Apache Parquet: Parquet-formatierte Datendateien müssen XDM-konform sein.
  • Komprimierte Dateien: JSON- und durch Trennzeichen getrennte Dateien können wie folgt komprimiert werden: bzip2, gzip, deflate, zipDeflate, tarGzip und tar.

Daten auswählen

Nachdem Sie Ihr Cloud-Speicherkonto erstellt haben, wird der Schritt Daten auswählen angezeigt und bietet eine Oberfläche, über die Sie Ihre Cloud-Speicher-Dateihierarchie untersuchen können.

  • Der linke Teil der Benutzeroberfläche ist ein Verzeichnisbrowser, in dem Ihre Cloud-Speicherdateien und -Verzeichnisse angezeigt werden.
  • Im rechten Bereich der Benutzeroberfläche können Sie eine Vorschau von bis zu 100 Datenzeilen aus einer kompatiblen Datei anzeigen.

Benutzeroberfläche

Wenn Sie einen aufgelisteten Ordner auswählen, können Sie die Ordnerhierarchie in tiefere Ordner durchlaufen. Sie können einen einzelnen Ordner auswählen, um alle Dateien rekursiv im Ordner aufzunehmen. Beim Erfassen eines ganzen Ordners müssen Sie sicherstellen, dass alle Dateien im Ordner dasselbe Schema nutzen.

Nachdem Sie eine kompatible Datei oder einen kompatiblen Ordner ausgewählt haben, wählen Sie im Dropdown-Menü Datenformat auswählen das entsprechende Datenformat aus.

Die folgende Tabelle zeigt das geeignete Datenformat für die unterstützten Dateitypen:

Dateityp Datenformat
CSV Getrennt
JSON JSON
Parquet XDM Parquet

Wählen Sie JSON aus und warten Sie einige Sekunden, bis die Vorschaufunktion gefüllt wird.

select-data

HINWEIS

Im Gegensatz zu getrennten und JSON-Dateitypen sind formatierte Parquet-Dateien nicht für die Vorschau verfügbar.

Über die Vorschau-Oberfläche können Sie den Inhalt und die Struktur einer Datei überprüfen. Standardmäßig zeigt die Vorschaufunktion die erste Datei im ausgewählten Ordner an.

Um eine andere Datei in der Vorschau anzuzeigen, wählen Sie das Vorschausymbol neben dem Namen der Datei aus, die Sie überprüfen möchten.

default-preview

Nachdem Sie den Inhalt und die Struktur der Dateien in Ihrem Ordner überprüft haben, wählen Sie Next aus, um alle Dateien rekursiv in den Ordner aufzunehmen.

select-folder

Wenn Sie lieber eine bestimmte Datei auswählen möchten, wählen Sie die gewünschte Datei aus und klicken Sie dann auf Weiter.

select-file

Festlegen eines benutzerdefinierten Trennzeichens für durch Trennzeichen getrennte Dateien

Sie können beim Erfassen von durch Trennzeichen getrennten Dateien ein benutzerdefiniertes Trennzeichen festlegen. Wählen Sie die Option Trennzeichen und dann aus dem Dropdown-Menü ein Trennzeichen aus. Im Menü werden die am häufigsten verwendeten Optionen für Trennzeichen angezeigt, darunter ein Komma (,), eine Registerkarte (\t) und ein senkrechter Strich (|). Wenn Sie lieber ein benutzerdefiniertes Trennzeichen verwenden möchten, wählen Sie Benutzerdefiniert aus und geben Sie in der Popup-Eingabeleiste ein einzelnes Trennzeichen Ihrer Wahl ein.

Nachdem Sie Ihr Datenformat ausgewählt und Ihr Trennzeichen festgelegt haben, wählen Sie Weiter aus.

Komprimierte Dateien erfassen

Sie können komprimierte JSON- oder durch Trennzeichen getrennte Dateien erfassen, indem Sie deren Komprimierungstyp angeben.

Wählen Sie im Schritt Daten auswählen eine komprimierte Datei für die Aufnahme aus und wählen Sie dann den entsprechenden Dateityp aus und ob die Datei XDM-kompatibel ist oder nicht. Wählen Sie als Nächstes Komprimierungstyp und dann den entsprechenden komprimierten Dateityp für die Quelldaten aus.

Wenn ein komprimierter Dateityp identifiziert ist, wählen Sie Weiter aus, um fortzufahren.

Zuordnen von Datenfeldern zu einem XDM-Schema

Der Schritt Mapping wird angezeigt und stellt eine interaktive Schnittstelle bereit, über die die Quelldaten einem Platform-Datensatz zugeordnet werden. Quelldateien, die in Parquet formatiert wurden, müssen XDM-konform sein und müssen die Zuordnung nicht manuell konfigurieren. Bei CSV-Dateien ist es erforderlich, die Zuordnung explizit zu konfigurieren. Sie können jedoch festlegen, welche Quelldatenfelder zugeordnet werden sollen. JSON-Dateien, die als XDM-Beschwerde gekennzeichnet sind, müssen nicht manuell konfiguriert werden. Wenn es jedoch nicht als XDM-kompatibel markiert ist, müssen Sie die Zuordnung explizit konfigurieren.

Wählen Sie einen Datensatz für eingehende Daten aus, die in aufgenommen werden sollen. Sie können entweder einen vorhandenen Datensatz verwenden oder einen neuen erstellen.

Vorhandenen Datensatz verwenden

Um Daten in einen vorhandenen Datensatz zu erfassen, wählen Sie Vorhandenen Datensatz und dann das Datensatzsymbol aus.

Das Dialogfeld Datensatz auswählen wird angezeigt. Suchen Sie den Datensatz, den Sie verwenden möchten, wählen Sie ihn aus und klicken Sie dann auf Weiter.

Verwenden eines neuen Datensatzes

Um Daten in einen neuen Datensatz zu erfassen, wählen Sie Neuer Datensatz aus und geben Sie einen Namen und eine Beschreibung für den Datensatz in die bereitgestellten Felder ein. Um ein Schema hinzuzufügen, können Sie einen vorhandenen Schemanamen im Dialogfeld Schema auswählen eingeben. Alternativ können Sie Erweiterte Schemasuche auswählen, um nach einem geeigneten Schema zu suchen.

In diesem Schritt können Sie Ihren Datensatz für Real-time Customer Profile aktivieren und eine ganzheitliche Ansicht der Attribute und Verhaltensweisen einer Entität erstellen. Daten aus allen aktivierten Datensätzen werden in Profile eingeschlossen und Änderungen werden angewendet, wenn Sie Ihren Datenfluss speichern.

Schalten Sie die Schaltfläche Profildatensatz ein, um Ihren Zieldatensatz für Profile zu aktivieren.

Das Dialogfeld Schema auswählen wird angezeigt. Wählen Sie das Schema aus, das Sie auf den neuen Datensatz anwenden möchten, und wählen Sie dann Fertig aus.

Je nach Bedarf können Sie Felder direkt zuordnen oder Zuordnungsfunktionen verwenden, um Quelldaten umzuwandeln und berechnete oder berechnete Werte abzuleiten. Weiterführende Informationen zu Datenzuordnungs- und Zuordnungsfunktionen finden Sie im Tutorial zum Zuordnen von CSV-Daten zu XDM-Schemafeldern.

Bei JSON-Dateien können Sie neben der direkten Zuordnung von Feldern zu anderen Feldern Objekte und Arrays anderen Objekten und Arrays direkt zuordnen. Außerdem können Sie komplexe Datentypen wie Arrays in JSON-Dateien mit einem Cloud-Speicher-Quell-Connector in der Vorschau anzeigen und zuordnen.

Beachten Sie, dass Sie keine Zuordnung für verschiedene Typen erstellen können. Sie können beispielsweise kein Objekt einem Array oder einem Feld einem Objekt zuordnen.

TIPP

Platform bietet intelligente Empfehlungen für automatisch zugeordnete Felder, die auf dem von Ihnen ausgewählten Zielschema oder Datensatz basieren. Sie können die Zuordnungsregeln manuell an Ihre Anwendungsfälle anpassen.

Wählen Sie Vorschau der Daten aus, um die Zuordnungsergebnisse von bis zu 100 Zeilen mit Beispieldaten aus dem ausgewählten Datensatz anzuzeigen.

Während der Vorschau wird die Identitätsspalte als erstes Feld priorisiert, da dies die wichtigsten Informationen ist, die bei der Validierung der Zuordnungsergebnisse erforderlich sind.

Nachdem die Quelldaten zugeordnet wurden, wählen Sie Close aus.

Erfassungsläufe planen

Der Schritt Planung wird angezeigt. Hier können Sie einen Aufnahmeplan konfigurieren, um die ausgewählten Quelldaten automatisch mit den konfigurierten Zuordnungen zu erfassen. In der folgenden Tabelle sind die verschiedenen konfigurierbaren Felder für die Planung aufgeführt:

Feld Beschreibung
Häufigkeit Zu den auswählbaren Häufigkeiten gehören Once, Minute, Hour, Day und Week.
Intervall Eine Ganzzahl, die das Intervall für die ausgewählte Häufigkeit festlegt.
Startzeit Ein UTC-Zeitstempel, der angibt, wann die erste Aufnahme erfolgen soll.
Aufstockung Ein boolean -Wert, der bestimmt, welche Daten ursprünglich erfasst werden. Wenn Aufstockung aktiviert ist, werden alle aktuellen Dateien im angegebenen Pfad während der ersten geplanten Erfassung erfasst. Wenn Aufstockung deaktiviert ist, werden nur die Dateien erfasst, die zwischen der ersten Ausführung der Aufnahme und der Startzeit geladen werden. Dateien, die vor der Startzeit geladen wurden, werden nicht erfasst.

Datenflüsse dienen dazu, Daten automatisch auf geplanter Basis zu erfassen. Wählen Sie zunächst die Aufnahmefrequenz aus. Legen Sie anschließend das Intervall fest, um den Zeitraum zwischen zwei Durchsatzausführungen festzulegen. Der Wert des Intervalls sollte eine Ganzzahl ungleich null sein und auf größer oder gleich 15 gesetzt werden.

Passen Sie zum Festlegen der Startzeit für die Aufnahme das im Feld Startzeit angezeigte Datum und die Uhrzeit an. Alternativ können Sie das Kalendersymbol auswählen, um den Startzeitwert zu bearbeiten. Die Startzeit muss größer oder gleich der aktuellen Uhrzeit in UTC sein.

Geben Sie Werte für den Zeitplan ein und wählen Sie Weiter aus.

Einrichten eines Datenflusses zur einmaligen Erfassung

Um die einmalige Erfassung einzurichten, wählen Sie den Dropdown-Pfeil für die Häufigkeit aus und klicken Sie auf Einmal. Sie können einen Datensatz weiterhin für eine einmalige Frequenzaufnahme bearbeiten, solange die Startzeit in der Zukunft bleibt. Nach Ablauf der Startzeit kann der Wert für die einmalige Häufigkeit nicht mehr bearbeitet werden. ​Intervalle und ​Aufstockungen sind beim Einrichten eines einmaligen Aufnahme-Datenflusses nicht sichtbar.

WICHTIG

Es wird dringend empfohlen, Ihren Datenfluss für die einmalige Erfassung bei Verwendung des FTP-Connectors zu planen.

Nachdem Sie die entsprechenden Werte für den Zeitplan angegeben haben, wählen Sie Weiter aus.

Datenflussdetails angeben

Der Schritt Datenfluss-Detail wird angezeigt, mit dem Sie einen Namen eingeben und eine kurze Beschreibung zu Ihrem neuen Datenfluss angeben können.

Während dieses Prozesses können Sie auch Partielle Erfassung und Fehlerdiagnose aktivieren. Durch die Aktivierung von Partielle Erfassung können Daten mit Fehlern bis zu einem bestimmten Schwellenwert erfasst werden, den Sie festlegen können. Durch Aktivierung von Fehlerdiagnose werden Details zu allen falschen Daten bereitgestellt, die separat stapelt werden. Weitere Informationen finden Sie unter Übersicht über die partielle Batch-Erfassung.

Geben Sie Werte für den Datenfluss ein und wählen Sie Weiter aus.

Überprüfen Sie Ihren Datenfluss.

Der Schritt Überprüfen wird angezeigt, mit dem Sie Ihren neuen Datenfluss überprüfen können, bevor er erstellt wird. Details werden in die folgenden Kategorien eingeteilt:

  • Verbindung: Zeigt den Quelltyp, den relevanten Pfad der ausgewählten Quelldatei und die Anzahl der Spalten in dieser Quelldatei an.
  • Zuweisen von Datensatz- und Zuordnungsfeldern: Zeigt, in welchen Datensatz die Quelldaten aufgenommen werden, einschließlich des Schemas, dem der Datensatz entspricht.
  • Planung: Zeigt den aktiven Zeitraum, die Häufigkeit und das Intervall des Aufnahmezeitplans an.

Nachdem Sie Ihren Datenfluss überprüft haben, klicken Sie auf Beenden und lassen Sie die Erstellung des Datenflusses etwas Zeit zu.

Überwachen Ihres Datenflusses

Nachdem Ihr Datenfluss erstellt wurde, können Sie die erfassten Daten überwachen, um Informationen zu Erfassungsraten, Erfolg und Fehlern zu erhalten. Weitere Informationen zum Überwachen des Datenflusses finden Sie im Tutorial zum Überwachen von Konten und Datenflüssen in der Benutzeroberfläche.

Datenfluss löschen

Sie können Datenflüsse löschen, die nicht mehr erforderlich sind oder falsch erstellt wurden, indem Sie die Funktion Delete verwenden, die im Arbeitsbereich Datenflüsse verfügbar ist. Weitere Informationen zum Löschen von Datenflüssen finden Sie im Tutorial zum Löschen von Datenflüssen in der Benutzeroberfläche🔗.

Nächste Schritte

In diesem Tutorial haben Sie erfolgreich einen Datenfluss erstellt, um Daten aus einem externen Cloud-Speicher einzubringen und Einblicke in die Überwachung von Datensätzen zu erhalten. Um mehr über die Erstellung von Datenflüssen zu erfahren, ergänzen Sie Ihr Lernen, indem Sie sich das folgende Video ansehen. Darüber hinaus können eingehende Daten jetzt von nachgelagerten Platform-Diensten wie Real-time Customer Profile und Data Science Workspace verwendet werden. Weitere Informationen finden Sie in den folgenden Dokumenten:

WARNUNG

Die im folgenden Video angezeigte Platform-Benutzeroberfläche ist veraltet. In der obigen Dokumentation finden Sie die neuesten Screenshots und Funktionen der Benutzeroberfläche.

Anhang

Die folgenden Abschnitte enthalten zusätzliche Informationen zum Arbeiten mit Quell-Connectoren.

Datenfluss deaktivieren

Wenn ein Datenfluss erstellt wird, wird er sofort aktiv und erfasst Daten gemäß dem festgelegten Zeitplan. Sie können einen aktiven Datenfluss jederzeit deaktivieren, indem Sie die unten stehenden Anweisungen befolgen.

Klicken Sie im Arbeitsbereich Quellen auf die Registerkarte Durchsuchen . Klicken Sie anschließend auf den Namen des Kontos, das dem aktiven Datenfluss zugeordnet ist, den Sie deaktivieren möchten.

Die Seite Quellaktivität wird angezeigt. Wählen Sie den aktiven Datenfluss aus der Liste aus, um die zugehörige Spalte Eigenschaften auf der rechten Seite des Bildschirms zu öffnen, die die Schaltfläche Aktiviert enthält. Klicken Sie auf den Umschalter, um den Datenfluss zu deaktivieren. Derselbe Umschalter kann verwendet werden, um einen Datenfluss erneut zu aktivieren, nachdem er deaktiviert wurde.

Eingehende Daten für Profile Population aktivieren

Eingehende Daten aus Ihrem Quell-Connector können zur Anreicherung und zum Ausfüllen Ihrer Real-time Customer Profile -Daten verwendet werden. Weitere Informationen zum Ausfüllen Ihrer Real-time Customer Profile-Daten finden Sie im Tutorial zu Profilpopulation.

Auf dieser Seite