Packen von Quelldateien in ein Rezept

In diesem Tutorial erfahren Sie, wie Sie die bereitgestellten Beispielquelldateien für Einzelhandelsumsätze in eine Archivdatei verpacken können, die zum Erstellen eines Rezepts in Adobe Experience Platform Data Science Workspace verwendet werden kann, indem Sie dem Workflow für den Rezeptimport entweder in der Benutzeroberfläche oder mithilfe der API folgen.

Konzepte zum Verständnis:

  • Rezepte Ein Rezept ist ein Adobe für eine Modellspezifikation und ein Container auf oberster Ebene, der einen bestimmten maschinellen Lernprozess, einen künstlichen Intelligenzalgorithmus oder eine Gruppe von Algorithmen, Verarbeitungslogik und Konfiguration darstellt, die zum Erstellen und Ausführen eines trainierten Modells erforderlich sind und somit zur Lösung spezifischer Geschäftsprobleme beitragen.
  • Source-Dateien: Einzelne Dateien in Ihrem Projekt, die die Logik für ein Rezept enthalten.

Voraussetzungen

Rezepterstellung

Die Erstellung von Rezepten beginnt mit dem Verpacken von Quelldateien, um eine Archivdatei zu erstellen. Source-Dateien definieren die Logik des maschinellen Lernens und Algorithmen, die zur Lösung eines bestimmten Problems verwendet werden, und werden entweder in Python, R, PySpark oder Scala geschrieben. Die erstellten Archivdateien haben die Form eines Docker-Bildes. Nach der Erstellung wird die gepackte Archivdatei in Data Science Workspace importiert, um ein Rezept in der Benutzeroberfläche oder mit der API zu erstellen.

Docker-basiertes Modell-Authoring docker-based-model-authoring

Ein Docker-Bild ermöglicht es einem Entwickler, eine Anwendung mit allen benötigten Teilen wie Bibliotheken und anderen Abhängigkeiten zu verpacken und als ein Paket auszugeben.

Das erstellte Docker-Bild wird mithilfe der Anmeldeinformationen, die Ihnen während des Workflows zur Rezepterstellung zur Verfügung gestellt werden, an die Azure Container Registry gesendet.

Melden Sie sich zum Abrufen Ihrer Azure Container Registry-Anmeldeinformationen bei Adobe Experience Platform an. Navigieren Sie in der linken Navigationsspalte zu Workflows. Wählen Sie Rezept importieren und danach Launch aus. Weitere Informationen finden Sie im Screenshot unten.

Die Seite Konfigurieren wird geöffnet. Geben Sie einen entsprechenden Rezeptnamen ein, z. B. "Rezept für Einzelhandelsumsätze"und geben Sie optional eine Beschreibung oder Dokumentations-URL ein. Klicken Sie nach Abschluss des Vorgangs auf Weiter.

Wählen Sie die entsprechende Laufzeitumgebung aus und wählen Sie dann eine Klassifizierung für Typ. Ihre Anmeldedaten für die Azure Container Registry werden nach Abschluss generiert.

NOTE
Typ ist die Klasse des maschinellen Lernproblems, für das das Rezept entwickelt wurde und nach dem Training verwendet wird, um die Auswertung des Trainings zu erleichtern.
TIP
  • Wählen Sie für Python -Rezepte die Laufzeit Python aus.
  • Wählen Sie für R-Rezepte die Laufzeit R aus.
  • Wählen Sie für PySpark-Rezepte die Laufzeit PySpark aus. Ein Artefakttyp wird automatisch ausgefüllt.
  • Wählen Sie für Scala-Rezepte die Laufzeit Spark aus. Ein Artefakttyp wird automatisch ausgefüllt.

Notieren Sie die Werte für Docker-Host, Benutzername und Kennwort. Diese werden verwendet, um Ihr Docker -Bild in den unten beschriebenen Workflows zu erstellen und zu pushen.

NOTE
Die Source-URL wird bereitgestellt, nachdem Sie die unten beschriebenen Schritte ausgeführt haben. Die Konfigurationsdatei wird in nachfolgenden Tutorials erläutert, die in nächsten Schritten zu finden sind.

Quelldateien verpacken

Rufen Sie zunächst die Codebase-Beispieldatei ab, die im Repository Experience Platform Data Science Workspace Reference gefunden wurde.

Build Python Docker-Bild python-docker

Wenn Sie dies noch nicht getan haben, klonen Sie das GitHub -Repository mit dem folgenden Befehl auf Ihr lokales System:

git clone https://github.com/adobe/experience-platform-dsw-reference.git

Navigieren Sie zum Verzeichnis "experience-platform-dsw-reference/recipes/python/retail". Hier finden Sie die Skripte login.sh und build.sh, die zur Anmeldung bei Docker und zum Erstellen des Python Docker-Bildes verwendet werden. Wenn Sie Ihre Docker-Anmeldeinformationen bereit haben, geben Sie die folgenden Befehle in der richtigen Reihenfolge ein:

# for logging in to Docker
./login.sh

# for building Docker image
./build.sh

Beachten Sie, dass Sie beim Ausführen des Anmeldeskripts den Docker-Host, Benutzernamen und das Kennwort angeben müssen. Beim Erstellen müssen Sie den Docker-Host und ein Version-Tag für den Build angeben.

Sobald das Build-Skript abgeschlossen ist, erhalten Sie eine Docker-Quelldatei-URL in Ihrer Konsolenausgabe. Für dieses spezifische Beispiel sieht es ungefähr so aus:

# URL format:
{DOCKER_HOST}/ml-retailsales-python:{VERSION_TAG}

Kopieren Sie diese URL und fahren Sie mit den nächsten Schritten fort.

Bild für R Docker erstellen r-docker

Wenn Sie dies noch nicht getan haben, klonen Sie das GitHub -Repository mit dem folgenden Befehl auf Ihr lokales System:

git clone https://github.com/adobe/experience-platform-dsw-reference.git

Navigieren Sie zum Verzeichnis experience-platform-dsw-reference/recipes/R/Retail - GradientBoosting in Ihrem geklonten Repository. Hier finden Sie die Dateien login.sh und build.sh, mit denen Sie sich bei Docker anmelden und das R Docker-Bild erstellen. Wenn Sie Ihre Docker-Anmeldeinformationen bereit haben, geben Sie die folgenden Befehle in der richtigen Reihenfolge ein:

# for logging in to Docker
./login.sh

# for build Docker image
./build.sh

Beachten Sie, dass Sie beim Ausführen des Anmeldeskripts den Docker-Host, Benutzernamen und das Kennwort angeben müssen. Beim Erstellen müssen Sie den Docker-Host und ein Version-Tag für den Build angeben.

Sobald das Build-Skript abgeschlossen ist, erhalten Sie eine Docker-Quelldatei-URL in Ihrer Konsolenausgabe. Für dieses spezifische Beispiel sieht es ungefähr so aus:

# URL format:
{DOCKER_HOST}/ml-retail-r:{VERSION_TAG}

Kopieren Sie diese URL und fahren Sie mit den nächsten Schritten fort.

PySpark-Docker-Bild erstellen pyspark-docker

Klonen Sie zunächst das Repository GitHub mit dem folgenden Befehl auf Ihrem lokalen System:

git clone https://github.com/adobe/experience-platform-dsw-reference.git

Navigieren Sie zum Verzeichnis "experience-platform-dsw-reference/recipes/pyspark/retail". Die Skripte login.sh und build.sh befinden sich hier und werden verwendet, um sich bei Docker anzumelden und das Docker-Bild zu erstellen. Wenn Sie Ihre Docker-Anmeldeinformationen bereit haben, geben Sie die folgenden Befehle in der richtigen Reihenfolge ein:

# for logging in to Docker
./login.sh

# for building Docker image
./build.sh

Beachten Sie, dass Sie beim Ausführen des Anmeldeskripts den Docker-Host, Benutzernamen und das Kennwort angeben müssen. Beim Erstellen müssen Sie den Docker-Host und ein Version-Tag für den Build angeben.

Sobald das Build-Skript abgeschlossen ist, erhalten Sie eine Docker-Quelldatei-URL in Ihrer Konsolenausgabe. Für dieses spezifische Beispiel sieht es ungefähr so aus:

# URL format:
{DOCKER_HOST}/ml-retailsales-pyspark:{VERSION_TAG}

Kopieren Sie diese URL und fahren Sie mit den nächsten Schritten fort.

Scala Docker-Bild erstellen scala-docker

Klonen Sie zunächst das GitHub -Repository auf Ihrem lokalen System mit dem folgenden Befehl im Terminal:

git clone https://github.com/adobe/experience-platform-dsw-reference.git

Navigieren Sie dann zum Verzeichnis experience-platform-dsw-reference/recipes/scala , in dem Sie die Skripte login.sh und build.sh finden. Diese Skripte werden verwendet, um sich bei Docker anzumelden und das Docker-Bild zu erstellen. Wenn Sie Ihre Docker-Anmeldeinformationen bereit haben, geben Sie die folgenden Befehle in der richtigen Reihenfolge zum Terminal ein:

# for logging in to Docker
./login.sh

# for building Docker image
./build.sh
TIP
Wenn Sie beim Versuch, sich mit dem Skript login.sh bei Docker anzumelden, einen Berechtigungsfehler erhalten, versuchen Sie, den Befehl bash login.sh zu verwenden.

Beim Ausführen des Anmeldeskripts müssen Sie den Docker-Host, den Benutzernamen und das Kennwort angeben. Beim Erstellen müssen Sie den Docker-Host und ein Version-Tag für den Build angeben.

Sobald das Build-Skript abgeschlossen ist, erhalten Sie eine Docker-Quelldatei-URL in Ihrer Konsolenausgabe. Für dieses spezifische Beispiel sieht es ungefähr so aus:

# URL format:
{DOCKER_HOST}/ml-retailsales-spark:{VERSION_TAG}

Kopieren Sie diese URL und fahren Sie mit den nächsten Schritten fort.

Nächste Schritte next-steps

In diesem Tutorial wurde das Verpacken von Quelldateien in ein Rezept beschrieben, was die Voraussetzung für den Import eines Rezepts in Data Science Workspace ist. Sie sollten jetzt ein Docker-Bild in Azure Container Registry zusammen mit der entsprechenden Bild-URL haben. Sie können jetzt mit dem Tutorial zum Importieren eines gepackten Rezepts in Data Science Workspace beginnen. Wählen Sie einen der folgenden Tutorial-Links aus, um zu beginnen:

recommendation-more-help
cc79fe26-64da-411e-a6b9-5b650f53e4e9