將來源檔案封裝到配方中
本教學課程提供如何將提供的零售銷售範例來源檔案封裝到封存檔案中的指示,透過在UI中或使用API中遵循配方匯入工作流程,可用來在Adobe Experience Platform Data Science Workspace中建立配方。
要瞭解的概念:
- 配方:配方是模型規格的Adobe術語,是代表特定機器學習、人工智慧演演算法或演演算法組合、處理邏輯,以及建置和執行已訓練的模型所需的組態(因此有助於解決特定業務問題)的頂層容器。
- Source檔案:專案中包含配方邏輯的個別檔案。
先決條件
方式建立
配方创建從打包源文件以版本編號存檔文件開始。 來源文件定義了用于解決手頭特定問題的機器學習邏輯和算法,並用R,PySpark或Scala編寫 Python。 構建的存檔檔採用 Docker 映像的形式。 建置後,封裝封存檔案會匯入至Data Science Workspace,以使用API🔗在UI🔗或中建立配方。
基於Docker的模型編寫 docker-based-model-authoring
Docker映像可讓開發人員將應用計畫與其所需的所有部分(例如程式庫和其他依賴項)一起封裝,然後作為一個封裝發出。
使用配方建立工作流程期間提供給您的認證,將建置的Docker映像推送到Azure容器登入。
若要取得您的Azure容器登入認證,請登入Adobe Experience Platform。 在左側導覽欄中,導覽至 工作流程。 選取 匯入配方,然後選取 啟動。 請參閱下面的螢幕截圖以供參考。
此時會開啟「 設定 頁面」。 提供適當的 配方名稱,例如「零售銷售方式」 並可選擇提供描述或文檔URL。 完成後,按兩下一個 。
選取適當的 執行階段,然後為 型別 選擇 分類。 您的Azure Container Registry認證會在完成後產生。
- 針對Python配方,請選取 Python 執行階段。
- 針對R配方,請選取 R 執行階段。
- 針對PySpark配方,請選取 PySpark 執行階段。 成品型別會自動填入。
- 對於Scala配方,請選取 Spark 執行階段。 成品型別會自動填入。
記下Docker主機、使用者名稱和密碼的值。 這些用於在下面概述的工作流程中建置和推播您的Docker影像。
封裝源檔
首先,取得Experience Platform資料科學Workspace參考存放庫中的範常式式碼基底。
構建 Python Docker 鏡像 python-docker
如果尚未執行此操作,請使用以下命令將存放庫克隆 GitHub 到本地系統上:
git clone https://github.com/adobe/experience-platform-dsw-reference.git
瀏覽到目錄 experience-platform-dsw-reference/recipes/python/retail
。 在這裡,您將找到用于登入 Docker 和版本編號Python Docker映射的腳本。login.sh
build.sh
如果您已 準備好 Docker 認證據 ,請按順序輸入以下命令:
# for logging in to Docker
./login.sh
# for building Docker image
./build.sh
請注意,執行登入指令碼時,您需要提供Docker主機、使用者名稱和密碼。 構建時,您需要提供構建的Docker主機和版本標籤。
構建指令碼完成後,控制檯輸出中會為您提供Docker來源檔案URL。 在此特定範例中,看起來會像這樣:
# URL format:
{DOCKER_HOST}/ml-retailsales-python:{VERSION_TAG}
複製此URL並移至後續步驟。
建置R Docker映像 r-docker
如果您尚未這樣做,請使用下列命令將GitHub存放庫複製到本機系統:
git clone https://github.com/adobe/experience-platform-dsw-reference.git
導航到克隆存放庫內的目錄 experience-platform-dsw-reference/recipes/R/Retail - GradientBoosting
。 在這裡,你將找到文件 login.sh
, build.sh
以及你將用于登入 Docker 和版本編號 R Docker 映射的文件。 如果您已 準備好 Docker 認證據 ,請按順序輸入以下命令:
# for logging in to Docker
./login.sh
# for build Docker image
./build.sh
請注意,執行 登入 腳本時,需要提供 Docker 主機、使用者名和密碼。 構建時,您需要提供構建的Docker主機和版本標籤。
構建指令碼完成後,控制檯輸出中會為您提供Docker來源檔案URL。 在此特定範例中,看起來會像這樣:
# URL format:
{DOCKER_HOST}/ml-retail-r:{VERSION_TAG}
複製此URL並移至後續步驟。
建置PySpark Docker影像 pyspark-docker
開始方法是使用以下命令將 GitHub 存放庫克隆到本地系統上:
git clone https://github.com/adobe/experience-platform-dsw-reference.git
瀏覽到目錄 experience-platform-dsw-reference/recipes/pyspark/retail
。 腳本 login.sh
和 build.sh
位於此處,用于登入 Docker 和版本編號 Docker 映像。 如果您已 準備好 Docker 認證據 ,請按順序輸入以下命令:
# for logging in to Docker
./login.sh
# for building Docker image
./build.sh
請注意,執行 登入 腳本時,需要提供 Docker 主機、使用者名和密碼。 構建時,您需要提供構建的Docker主機和版本標籤。
構建指令碼完成後,控制檯輸出中會為您提供Docker來源檔案URL。 在此特定範例中,看起來會像這樣:
# URL format:
{DOCKER_HOST}/ml-retailsales-pyspark:{VERSION_TAG}
複製此URL並移至後續步驟。
構建Scala Docker映像 scala-docker
首先,在終端機中使用下列命令將GitHub存放庫複製到您的本機系統:
git clone https://github.com/adobe/experience-platform-dsw-reference.git
接著,導覽至目錄experience-platform-dsw-reference/recipes/scala
,您可以在其中找到指令碼login.sh
和build.sh
。 這些指令碼用於登入Docker和構建Docker映像。 如果您已準備好Docker認證,請依序輸入下列命令到終端機:
# for logging in to Docker
./login.sh
# for building Docker image
./build.sh
login.sh
指令碼登入Docker時遇到許可權錯誤,請嘗試使用命令bash login.sh
。執行登入指令碼時,您需要提供Docker主機、使用者名稱和密碼。 構建時,您需要提供構建的Docker主機和版本標籤。
構建指令碼完成後,控制檯輸出中會為您提供Docker來源檔案URL。 在此特定範例中,看起來會像這樣:
# URL format:
{DOCKER_HOST}/ml-retailsales-spark:{VERSION_TAG}
複製此URL並繼續執行 後續步驟。
後續步驟 next-steps
此教學課程介紹了將源文件打包到配方中,這是將配方 Data Science Workspace導入到的先決條件步驟。 您現在應該在Azure容器登入中擁有Docker影像以及對應的影像URL。 您現在已準備好開始有關將封裝配方匯入Data Science Workspace的教學課程。 選取下列其中一個教學課程連結以開始: