Paketera källfiler i ett recept
I den här självstudiekursen finns anvisningar om hur du kan paketera de angivna källfilerna för butiksförsäljning i en arkivfil, som kan användas för att skapa ett recept i Adobe Experience Platform Data Science Workspace genom att följa arbetsflödet för receptimport antingen i användargränssnittet eller med API:t.
Begrepp att förstå:
- Recept: Ett recept är Adobe term för en modellspecifikation och är en behållare på toppnivå som representerar en specifik maskininlärning, artificiell intelligens-algoritm eller en samling algoritmer, bearbetningslogik och konfiguration som krävs för att bygga och utföra en utbildad modell och därmed hjälpa till att lösa specifika affärsproblem.
- Källfiler: Enskilda filer i projektet som innehåller logiken för ett recept.
Förhandskrav
Recipe creation
Recipe-skapandet börjar med att paketera källfiler för att skapa en arkivfil. Source-filer definierar den maskininlärningslogik och de algoritmer som används för att lösa ett specifikt problem och skrivs antingen i Python, R, PySpark eller Scala. De inbyggda arkivfilerna har formen av en Docker-bild. När den packade arkivfilen har skapats importeras den till Data Science Workspace för att skapa ett recept i användargränssnitteteller med API:t.
Skapa modeller med Docker docker-based-model-authoring
Med en Docker-bild kan utvecklare paketera ett program med alla delar som behövs, till exempel bibliotek och andra beroenden, och skicka ut det som ett paket.
Den inbyggda Docker-avbildningen överförs till Azure Container Registry med hjälp av autentiseringsuppgifter som du får när du skapar recept.
Logga in på Adobe Experience Platform om du vill få dina autentiseringsuppgifter för Azure Container Registry. Navigera till Workflows i den vänstra navigeringskolumnen. Välj Import Recipe följt av att välja Launch. Se skärmbilden nedan för referens.
Sidan Configure öppnas. Ange en lämplig Recipe Name, t.ex."Retail Sales recept", och ange en beskrivning- eller dokumentations-URL om du vill. Klicka på Next när du är klar.
Välj lämplig körningsmiljö och välj sedan Classification som typ. Dina autentiseringsuppgifter för Azure Container-registret genereras när de är klara.
- För Python recept väljer du Python-miljön.
- För R-recept väljer du R-miljön.
- För PySpark-recept väljer du PySpark-miljön. En artefakttyp fylls i automatiskt.
- För Scala-recept väljer du Spark-miljön. En artefakttyp fylls i automatiskt.
Notera värdena för Docker-värd, användarnamn och lösenord. De används för att bygga och skicka din Docker-image i arbetsflödena som beskrivs nedan.
Paketera källfilerna
Börja med att hämta exempelkodbasen som finns i databasen Experience Platform Data Science Workspace Reference.
Skapa Python-dockningsbild python-docker
Om du inte har gjort det klonar du GitHub-databasen på din lokala dator med följande kommando:
git clone https://github.com/adobe/experience-platform-dsw-reference.git
Navigera till katalogen experience-platform-dsw-reference/recipes/python/retail
. Här hittar du skripten login.sh
och build.sh
som används för att logga in på Docker och för att skapa Python Docker-avbildningen. Om du har dina Docker-inloggningsuppgifter klara anger du följande kommandon i ordning:
# for logging in to Docker
./login.sh
# for building Docker image
./build.sh
Observera att när du kör inloggningsskriptet måste du ange Docker-värden, användarnamn och lösenord. När du bygger måste du ange Docker-värden och en versionstagg för bygget.
När byggskriptet är klart får du en URL för Docker-källfilen i konsolutdata. I det här specifika exemplet ser det ut ungefär så här:
# URL format:
{DOCKER_HOST}/ml-retailsales-python:{VERSION_TAG}
Kopiera URL:en och gå vidare till nästa steg.
Version R Docker-bild r-docker
Om du inte har gjort det klonar du GitHub-databasen till ditt lokala system med följande kommando:
git clone https://github.com/adobe/experience-platform-dsw-reference.git
Navigera till katalogen experience-platform-dsw-reference/recipes/R/Retail - GradientBoosting
i din klonade databas. Här hittar du filerna login.sh
och build.sh
som du använder för att logga in på Docker och för att skapa R Docker-avbildningen. Om du har dina Docker-inloggningsuppgifter klara anger du följande kommandon i ordning:
# for logging in to Docker
./login.sh
# for build Docker image
./build.sh
Observera att när du kör inloggningsskriptet måste du ange Docker-värden, användarnamn och lösenord. När du bygger måste du ange Docker-värden och en versionstagg för bygget.
När byggskriptet är klart får du en URL för Docker-källfilen i konsolutdata. I det här exemplet ser det ut ungefär så här:
# URL format:
{DOCKER_HOST}/ml-retail-r:{VERSION_TAG}
Kopiera den här URL:en och gå vidare till nästa steg.
Skapa PySpark Docker-bild pyspark-docker
Börja med att klona databasen GitHub på din lokala dator med följande kommando:
git clone https://github.com/adobe/experience-platform-dsw-reference.git
Navigera till katalogen experience-platform-dsw-reference/recipes/pyspark/retail
. Skripten login.sh
och build.sh
finns här och används för att logga in på Docker och för att skapa Docker-avbildningen. Om du har dina Docker-inloggningsuppgifter klara anger du följande kommandon i ordning:
# for logging in to Docker
./login.sh
# for building Docker image
./build.sh
Observera att när du kör inloggningsskriptet måste du ange Docker-värden, användarnamn och lösenord. När du bygger måste du ange Docker-värden och en versionstagg för bygget.
När byggskriptet är klart får du en URL för Docker-källfilen i konsolutdata. I det här exemplet ser det ut ungefär så här:
# URL format:
{DOCKER_HOST}/ml-retailsales-pyspark:{VERSION_TAG}
Kopiera den här URL:en och gå vidare till nästa steg.
Bygg Scala Docker-bild scala-docker
Börja med att klona GitHub-databasen på din lokala dator med följande kommando i terminalen:
git clone https://github.com/adobe/experience-platform-dsw-reference.git
Gå sedan till katalogen experience-platform-dsw-reference/recipes/scala
där du kan hitta skripten login.sh
och build.sh
. Dessa skript används för att logga in på Docker och skapa Docker-bilden. Om du har dina Docker-autentiseringsuppgifter klara anger du följande kommandon till Terminal i ordning:
# for logging in to Docker
./login.sh
# for building Docker image
./build.sh
login.sh
kan du prova att använda kommandot bash login.sh
.När du kör inloggningsskriptet måste du ange Docker-värden, användarnamn och lösenord. När du skapar måste du ange Docker-värden och en versionstagg för bygget.
När versionsskriptet är klart får du en URL till en Docker-källfil i konsolens utdata. I det här specifika exemplet ser det ut ungefär så här:
# URL format:
{DOCKER_HOST}/ml-retailsales-spark:{VERSION_TAG}
Kopiera den här URL:en och gå vidare till nästa steg.
Nästa steg next-steps
Den här självstudien gick över till att paketera källfiler i en recept, vilket är det nödvändiga steget för att importera en recept till Data Science Workspace. Du bör nu ha en Docker-avbildning i Azure Container Registry tillsammans med motsvarande bild-URL. Nu kan du börja med självstudiekursen om hur du importerar ett paketerat recept till Data Science Workspace. Välj en av självstudielänkarna nedan för att komma igång: