Packen von Quelldateien in ein Rezept

NOTE
Data Science Workspace ist nicht mehr erhältlich.
Diese Dokumentation richtet sich an Bestandskunden mit vorherigen Berechtigungen für Data Science Workspace.

In diesem Tutorial erfahren Sie, wie Sie die bereitgestellten Beispielquelldateien für den Einzelhandel in eine Archivdatei packen können, mit der Sie in Adobe Experience Platform Data Science Workspace ein Rezept erstellen können, indem Sie dem Import-Workflow für Rezepte entweder in der Benutzeroberfläche oder mithilfe der API folgen.

Zu verstehende Konzepte:

  • Rezepte: Ein Rezept ist ein Adobe-Begriff für eine Modellspezifikation und ein Container auf oberster Ebene, der einen bestimmten Algorithmus für maschinelles Lernen, einen Algorithmus für künstliche Intelligenz oder eine Gruppe von Algorithmen, eine Verarbeitungslogik und eine Konfiguration darstellt, die zum Erstellen und Ausführen eines trainierten Modells und somit zur Lösung spezifischer Geschäftsprobleme erforderlich sind.
  • Source-: Einzelne Dateien in Ihrem Projekt, die die Logik für ein Rezept enthalten.

Voraussetzungen

Rezepterstellung

Die Rezepterstellung beginnt mit dem Verpacken von Quelldateien, um eine Archivdatei zu erstellen. Source-Dateien definieren die Logik und die Algorithmen des maschinellen Lernens, die zum Lösen eines bestimmten vorliegenden Problems verwendet werden, und werden entweder in Python, R, PySpark oder Scala geschrieben. Die erstellten Archivdateien haben die Form eines Docker-Images. Nach der Erstellung wird die gepackte Archivdatei in Data Science Workspace importiert, um ein Rezept (🔗 der Benutzeroberfläche oder ( der API zu erstellen.

Docker-basierte Modellerstellung docker-based-model-authoring

Mit einem Docker-Image kann ein Entwickler eine Anwendung mit allen benötigten Teilen wie Bibliotheken und anderen Abhängigkeiten als Paket verpacken und als ein Paket versenden.

Das erstellte Docker-Image wird mithilfe der Anmeldeinformationen, die Sie während des Workflows zur Rezepterstellung erhalten haben, an die Azure-Container-Registrierung gepusht.

Um Ihre Azure Container Registry-Anmeldedaten zu erhalten, melden Sie sich bei Adobe Experience Platform an. Navigieren Sie in der linken Navigationsspalte zu Workflows. Wählen Sie Rezept importieren und dann Starten aus. Siehe Screenshot unten als Referenz.

Die „Konfigurieren wird geöffnet. Geben Sie einen geeigneten Rezeptnamen z. B. „Einzelhandelsverkaufsrezept“ an und geben Sie optional eine Beschreibung oder eine Dokumentations-URL an. Klicken Sie anschließend auf Weiter.

Wählen Sie die entsprechende Laufzeit und wählen Sie dann Klassifizierung für Typ. Ihre Azure Container-Registrierungsanmeldeinformationen werden nach Abschluss generiert.

NOTE
Type ist die Klasse des Problems des maschinellen Lernens, für das das Rezept entwickelt wurde, und wird nach dem Training verwendet, um die Bewertung des Trainings-Durchgangs anzupassen.
TIP
  • Wählen Sie für Python Rezepte die Python-Laufzeit aus.
  • Wählen Sie für Rezepte des Typs R die R-Laufzeit aus.
  • Wählen Sie für PySpark-Rezepte die PySpark-Laufzeit aus. Ein Artefakttyp wird automatisch ausgefüllt.
  • Wählen Sie für Scala-Rezepte die Spark-Laufzeit aus. Ein Artefakttyp wird automatisch ausgefüllt.

Notieren Sie die Werte für Docker-Host, Benutzernamen und Kennwort. Diese werden in den unten beschriebenen Workflows zum Erstellen und Übertragen Ihres Docker-Images verwendet.

NOTE
Die Source-URL wird bereitgestellt, nachdem Sie die unten beschriebenen Schritte ausgeführt haben. Die Konfigurationsdatei wird in nachfolgenden Tutorials unter " Schritte“.

Packen der Quelldateien

Rufen Sie zunächst die Beispiel-Code-Basis aus dem Experience Platform Data Science Workspace Reference-Repository ab.

Erstellen Python Docker-Images python-docker

Wenn Sie dies nicht getan haben, klonen Sie das GitHub-Repository mit dem folgenden Befehl auf Ihr lokales System:

git clone https://github.com/adobe/experience-platform-dsw-reference.git

Navigieren Sie zum Verzeichnis experience-platform-dsw-reference/recipes/python/retail. Hier finden Sie die Skripte login.sh und build.sh, mit denen Sie sich bei Docker anmelden und das Python Docker-Image erstellen. Wenn Sie Ihre Docker-Anmeldeinformationen bereit haben, geben Sie die folgenden Befehle in der richtigen Reihenfolge ein:

# for logging in to Docker
./login.sh

# for building Docker image
./build.sh

Beachten Sie, dass Sie beim Ausführen des Anmeldeskripts den Docker-Host, den Benutzernamen und das Kennwort angeben müssen. Beim Erstellen müssen Sie den Docker-Host und ein Versionstags für den Build angeben.

Sobald das Build-Skript abgeschlossen ist, erhalten Sie eine Docker-Quelldatei-URL in Ihrer Konsolenausgabe. Für dieses spezifische Beispiel sieht es in etwa so aus:

# URL format:
{DOCKER_HOST}/ml-retailsales-python:{VERSION_TAG}

Kopieren Sie diese URL und fahren Sie mit den nächsten Schritten fort.

R Docker-Image erstellen r-docker

Wenn Sie dies nicht getan haben, klonen Sie das GitHub-Repository mit dem folgenden Befehl auf Ihr lokales System:

git clone https://github.com/adobe/experience-platform-dsw-reference.git

Navigieren Sie zum Verzeichnis experience-platform-dsw-reference/recipes/R/Retail - GradientBoosting im geklonten Repository. Hier finden Sie die Dateien login.sh und build.sh, mit denen Sie sich bei Docker anmelden und das R Docker-Image erstellen. Wenn Sie Ihre Docker-Anmeldeinformationen bereit haben, geben Sie die folgenden Befehle in der richtigen Reihenfolge ein:

# for logging in to Docker
./login.sh

# for build Docker image
./build.sh

Beachten Sie, dass Sie beim Ausführen des Anmeldeskripts den Docker-Host, den Benutzernamen und das Kennwort angeben müssen. Beim Erstellen müssen Sie den Docker-Host und ein Versionstags für den Build angeben.

Sobald das Build-Skript abgeschlossen ist, erhalten Sie eine Docker-Quelldatei-URL in Ihrer Konsolenausgabe. Für dieses spezifische Beispiel sieht es in etwa so aus:

# URL format:
{DOCKER_HOST}/ml-retail-r:{VERSION_TAG}

Kopieren Sie diese URL und fahren Sie mit den nächsten Schritten fort.

PySpark Docker-Image erstellen pyspark-docker

Klonen Sie zunächst das GitHub-Repository mit dem folgenden Befehl auf Ihr lokales System:

git clone https://github.com/adobe/experience-platform-dsw-reference.git

Navigieren Sie zum Verzeichnis experience-platform-dsw-reference/recipes/pyspark/retail. Die Skripte login.sh und build.sh befinden sich hier und werden verwendet, um sich bei Docker anzumelden und das Docker-Image zu erstellen. Wenn Sie Ihre Docker-Anmeldeinformationen bereit haben, geben Sie die folgenden Befehle in der richtigen Reihenfolge ein:

# for logging in to Docker
./login.sh

# for building Docker image
./build.sh

Beachten Sie, dass Sie beim Ausführen des Anmeldeskripts den Docker-Host, den Benutzernamen und das Kennwort angeben müssen. Beim Erstellen müssen Sie den Docker-Host und ein Versionstags für den Build angeben.

Sobald das Build-Skript abgeschlossen ist, erhalten Sie eine Docker-Quelldatei-URL in Ihrer Konsolenausgabe. Für dieses spezifische Beispiel sieht es in etwa so aus:

# URL format:
{DOCKER_HOST}/ml-retailsales-pyspark:{VERSION_TAG}

Kopieren Sie diese URL und fahren Sie mit den nächsten Schritten fort.

Erstellen eines Scala Docker-Images scala-docker

Klonen Sie zunächst das GitHub-Repository auf Ihrem lokalen System mit dem folgenden Befehl im Terminal:

git clone https://github.com/adobe/experience-platform-dsw-reference.git

Navigieren Sie anschließend zum Verzeichnis experience-platform-dsw-reference/recipes/scala , in dem Sie die Skripte login.sh und build.sh finden. Diese Skripte werden verwendet, um sich bei Docker anzumelden und das Docker-Image zu erstellen. Wenn Sie Ihre Docker-Anmeldeinformationen bereit haben, geben Sie die folgenden Befehle in die Terminal-Reihenfolge ein:

# for logging in to Docker
./login.sh

# for building Docker image
./build.sh
TIP
Wenn Sie beim Versuch, sich mit dem login.sh-Skript bei Docker anzumelden, einen Berechtigungsfehler erhalten, versuchen Sie es mit dem bash login.sh .

Beim Ausführen des Anmeldeskripts müssen Sie den Docker-Host, den Benutzernamen und das Kennwort angeben. Beim Erstellen müssen Sie den Docker-Host und ein Versionstags für den Build angeben.

Sobald das Build-Skript abgeschlossen ist, erhalten Sie eine Docker-Quelldatei-URL in Ihrer Konsolenausgabe. Für dieses spezifische Beispiel sieht es in etwa so aus:

# URL format:
{DOCKER_HOST}/ml-retailsales-spark:{VERSION_TAG}

Kopieren Sie diese URL und fahren Sie mit den nächsten Schritten fort.

Nächste Schritte next-steps

In diesem Tutorial wurde das Verpacken von Quelldateien in ein Rezept erläutert. Dies ist der erforderliche Schritt zum Importieren eines Rezepts in Data Science Workspace. Sie sollten jetzt über ein Docker-Image in der Azure Container-Registrierung zusammen mit der entsprechenden Bild-URL verfügen. Sie können jetzt mit dem Tutorial zum Importieren eines gepackten Rezepts in Data Science Workspace beginnen. Wählen Sie einen der folgenden Tutorial-Links, um zu beginnen:

recommendation-more-help
cc79fe26-64da-411e-a6b9-5b650f53e4e9