Packen von Quelldateien in ein Rezept

In diesem Tutorial erfahren Sie, wie Sie die bereitgestellten Beispielquelldateien für Einzelhandelsumsätze in eine Archivdatei verpacken können, die zum Erstellen eines Rezepts in Adobe Experience Platform Data Science Workspace verwendet werden kann, indem Sie dem Workflow für den Rezeptimport entweder in der Benutzeroberfläche oder mithilfe der API folgen.

Konzepte zum Verständnis:

  • Rezepte: Ein Rezept ist der Begriff der Adobe für eine Modellspezifikation und ist ein Container auf oberster Ebene, der einen bestimmten maschinellen Lernprozess, einen künstlichen Intelligenzalgorithmus oder eine Gruppe von Algorithmen, Verarbeitungslogik und Konfiguration darstellt, die zum Erstellen und Ausführen eines trainierten Modells erforderlich sind und somit zur Lösung spezifischer Geschäftsprobleme beitragen.
  • Quelldateien: Einzelne Dateien in Ihrem Projekt, die die Logik für ein Rezept enthalten.

Voraussetzungen

Rezepterstellung

Die Erstellung von Rezepten beginnt mit dem Verpacken von Quelldateien zum Erstellen einer Archivdatei. Quelldateien definieren die Logik des maschinellen Lernens und Algorithmen, die zur Lösung eines bestimmten Problems verwendet werden, und werden entweder in Python, R, PySpark oder Scala geschrieben. Die erstellten Archivdateien haben die Form eines Docker-Bildes. Nach der Erstellung wird die gepackte Archivdatei in Data Science Workspace importiert, um ein Rezept in der Benutzeroberfläche oder mit der API zu erstellen.

Docker-basiertes Modell-Authoring

Ein Docker-Bild ermöglicht es einem Entwickler, eine Anwendung mit allen benötigten Teilen wie Bibliotheken und anderen Abhängigkeiten zu verpacken und als ein Paket auszugeben.

Das erstellte Docker-Bild wird mithilfe der Anmeldeinformationen, die Ihnen während des Workflows zur Rezepterstellung zur Verfügung gestellt werden, an die Azure Container Registry gesendet.

Um Ihre Anmeldedaten für die Azure Container Registry zu erhalten, melden Sie sich bei Adobe Experience Platform an. Navigieren Sie in der linken Navigationsspalte zu Workflows. Wählen Sie Rezept importieren und danach Launch aus. Weitere Informationen finden Sie im Screenshot unten.

Die Seite Configure wird geöffnet. Geben Sie einen geeigneten Rezeptnamen ein, z. B. "Rezept für Einzelhandelsumsätze"und geben Sie optional eine Beschreibung oder Dokumentations-URL ein. Klicken Sie nach Abschluss auf Weiter.

Wählen Sie den entsprechenden Runtime und dann Classification für Typ. Ihre Anmeldedaten für die Azure Container Registry werden nach Abschluss generiert.

HINWEIS

** Typisierung nach der Klasse des maschinellen Lernproblems, für das das Rezept entwickelt wurde und nach dem Training verwendet wird, um die Auswertung des Trainings zu erleichtern.

TIPP
  • Wählen Sie für Python -Rezepte die Laufzeit Python aus.
  • Wählen Sie für R-Rezepte die Laufzeitumgebung R aus.
  • Wählen Sie für PySpark-Rezepte die Laufzeit PySpark aus. Ein Artefakttyp wird automatisch ausgefüllt.
  • Wählen Sie für Scala-Rezepte die Laufzeitumgebung Spark aus. Ein Artefakttyp wird automatisch ausgefüllt.

Notieren Sie die Werte für Docker-Host, Benutzername und Kennwort. Diese werden verwendet, um Ihr Docker-Bild in den unten beschriebenen Workflows zu erstellen und zu pushen.

HINWEIS

Die Quell-URL wird bereitgestellt, nachdem Sie die unten beschriebenen Schritte ausgeführt haben. Die Konfigurationsdatei wird in nachfolgenden Tutorials erklärt, die in den nächsten Schritten zu finden sind.

Quelldateien verpacken

Rufen Sie zunächst die Beispielcodebasis ab, die im Repository Experience Platform Data Science Workspace Reference gefunden wird.

Build Python Docker-Bild

Wenn Sie dies noch nicht getan haben, klonen Sie das GitHub-Repository mit dem folgenden Befehl auf Ihrem lokalen System:

git clone https://github.com/adobe/experience-platform-dsw-reference.git

Navigieren Sie zum Verzeichnis experience-platform-dsw-reference/recipes/python/retail. Hier finden Sie die Skripte login.sh und build.sh, die zur Anmeldung bei Docker und zur Erstellung des Bildes Python Docker verwendet werden. Wenn Sie Ihre Docker-Anmeldeinformationen bereit haben, geben Sie die folgenden Befehle in der richtigen Reihenfolge ein:

# for logging in to Docker
./login.sh
 
# for building Docker image
./build.sh

Beachten Sie, dass Sie beim Ausführen des Anmeldeskripts den Docker-Host, Benutzernamen und das Kennwort angeben müssen. Beim Erstellen müssen Sie den Docker-Host und ein Version-Tag für den Build angeben.

Sobald das Build-Skript abgeschlossen ist, erhalten Sie eine Docker-Quelldatei-URL in Ihrer Konsolenausgabe. Für dieses spezifische Beispiel sieht es ungefähr so aus:

# URL format: 
{DOCKER_HOST}/ml-retailsales-python:{VERSION_TAG}

Kopieren Sie diese URL und fahren Sie mit den nächsten Schritten fort.

Build R Docker-Bild

Wenn Sie dies noch nicht getan haben, klonen Sie das GitHub-Repository mit dem folgenden Befehl auf Ihrem lokalen System:

git clone https://github.com/adobe/experience-platform-dsw-reference.git

Navigieren Sie zum Verzeichnis experience-platform-dsw-reference/recipes/R/Retail - GradientBoosting in Ihrem geklonten Repository. Hier finden Sie die Dateien login.sh und build.sh, mit denen Sie sich bei Docker anmelden und das R Docker-Bild erstellen. Wenn Sie Ihre Docker-Anmeldeinformationen bereit haben, geben Sie die folgenden Befehle in der richtigen Reihenfolge ein:

# for logging in to Docker
./login.sh
 
# for build Docker image
./build.sh

Beachten Sie, dass Sie beim Ausführen des Anmeldeskripts den Docker-Host, Benutzernamen und das Kennwort angeben müssen. Beim Erstellen müssen Sie den Docker-Host und ein Version-Tag für den Build angeben.

Sobald das Build-Skript abgeschlossen ist, erhalten Sie eine Docker-Quelldatei-URL in Ihrer Konsolenausgabe. Für dieses spezifische Beispiel sieht es ungefähr so aus:

# URL format: 
{DOCKER_HOST}/ml-retail-r:{VERSION_TAG}

Kopieren Sie diese URL und fahren Sie mit den nächsten Schritten fort.

PySpark-Docker-Bild erstellen

Klonen Sie zunächst das GitHub-Repository auf Ihrem lokalen System mit dem folgenden Befehl:

git clone https://github.com/adobe/experience-platform-dsw-reference.git

Navigieren Sie zum Verzeichnis experience-platform-dsw-reference/recipes/pyspark/retail. Die Skripte login.sh und build.sh befinden sich hier und werden verwendet, um sich bei Docker anzumelden und das Docker-Bild zu erstellen. Wenn Sie Ihre Docker-Anmeldeinformationen bereit haben, geben Sie die folgenden Befehle in der richtigen Reihenfolge ein:

# for logging in to Docker
./login.sh
 
# for building Docker image
./build.sh

Beachten Sie, dass Sie beim Ausführen des Anmeldeskripts den Docker-Host, Benutzernamen und das Kennwort angeben müssen. Beim Erstellen müssen Sie den Docker-Host und ein Version-Tag für den Build angeben.

Sobald das Build-Skript abgeschlossen ist, erhalten Sie eine Docker-Quelldatei-URL in Ihrer Konsolenausgabe. Für dieses spezifische Beispiel sieht es ungefähr so aus:

# URL format: 
{DOCKER_HOST}/ml-retailsales-pyspark:{VERSION_TAG}

Kopieren Sie diese URL und fahren Sie mit den nächsten Schritten fort.

Scala Docker-Bild erstellen

Klonen Sie zunächst das GitHub-Repository auf Ihrem lokalen System mit dem folgenden Befehl im Terminal:

git clone https://github.com/adobe/experience-platform-dsw-reference.git

Navigieren Sie anschließend zum Verzeichnis experience-platform-dsw-reference/recipes/scala , in dem Sie die Skripte login.sh und build.sh finden. Diese Skripte werden verwendet, um sich bei Docker anzumelden und das Docker-Bild zu erstellen. Wenn Sie Ihre Docker-Anmeldeinformationen bereit haben, geben Sie die folgenden Befehle in der richtigen Reihenfolge zum Terminal ein:

# for logging in to Docker
./login.sh
 
# for building Docker image
./build.sh
TIPP

Wenn Sie beim Versuch, sich mit dem Skript login.sh bei Docker anzumelden, einen Berechtigungsfehler erhalten, versuchen Sie, den Befehl bash login.sh zu verwenden.

Beim Ausführen des Anmeldeskripts müssen Sie den Docker-Host, den Benutzernamen und das Kennwort angeben. Beim Erstellen müssen Sie den Docker-Host und ein Version-Tag für den Build angeben.

Sobald das Build-Skript abgeschlossen ist, erhalten Sie eine Docker-Quelldatei-URL in Ihrer Konsolenausgabe. Für dieses spezifische Beispiel sieht es ungefähr so aus:

# URL format: 
{DOCKER_HOST}/ml-retailsales-spark:{VERSION_TAG}

Kopieren Sie diese URL und fahren Sie mit den nächsten Schritten fort.

Nächste Schritte

In diesem Tutorial wurde das Verpacken von Quelldateien in ein Rezept beschrieben, was die Voraussetzung für den Import eines Rezepts in Data Science Workspace ist. Sie sollten jetzt ein Docker-Bild in Azure Container Registry zusammen mit der entsprechenden Bild-URL haben. Sie können jetzt mit dem Tutorial zum Importieren eines gepackten Rezepts in Data Science Workspace beginnen. Wählen Sie einen der folgenden Tutorial-Links aus, um zu beginnen:

Auf dieser Seite