在資料科學工作區UI中訓練和評估模型

在Adobe Experience Platform Data Science Workspace中,機器學習模型是透過整合符合模型意圖的現有配方來建立的。 然後,對模型進行訓練和評估,通過微調其相關的超參數來優化其操作效率和效能。 方式可重複使用,這表示您可以使用單一方式,針對特定目的建立並量身打造多個模型。

本教學課程將逐步介紹建立、訓練和評估模型的步驟。

快速入門

要完成本教學課程,您必須具有Experience Platform的存取權。 如果您沒有Experience Platform中IMS組織的存取權,請在繼續之前先與系統管理員聯絡。

本教學課程需要現有的配方。 如果您沒有配方,請依照UI](./import-packaged-recipe-ui.md)教學課程中的[匯入封裝配方,然後再繼續。

建立模型

  1. 在Adobe Experience Platform中,按一下左側導覽欄中的​Models​連結,以列出所有現有的模型。 按一下頁面右上角的​建立模型​以開始建立模型。

  2. 瀏覽現有配方的清單,查找並選擇用於建立模型的配方,然後按一下​Next

  3. 選擇適當的輸入資料集,然後按一下​Next。 這將設定模型的預設輸入訓練資料集。

  4. 為「模型」(Model)提供名稱並查看預設「模型」(Model)配置。 在「配方」建立過程中,通過按兩下配置值來應用預設配置,複查和修改配置值。 若要提供新的組態,請按一下「上傳新設定」,並將包含「模型」組態的JSON檔案拖曳至瀏覽器視窗。 ​按一下​完成​以建立模型。

    注意

    配置是獨特且特定於其預定配方的,這意味著零售銷售配方的配置將不適用於產品建議配方。 有關零售銷售方式配置的清單,請參閱reference部分。

建立訓練執行

  1. 在Adobe Experience Platform中,按一下左側導覽欄中的​Models​連結,以列出所有現有的模型。 查找並按一下要培訓的模型的名稱。

  2. 所有現有培訓執行都會列出其目前的培訓狀態。 對於使用Data Science Workspace使用者介面建立的模型,會自動產生訓練執行,並使用預設組態和輸入訓練資料集來執行。

  3. 按一下「模型概述」頁面右上角的​Train,建立新的訓練執行。

  4. 為培訓運行選擇培訓輸入資料集,然後按一下​Next

  5. 如圖所示,建立模型期間提供的預設配置,請按兩下這些值,以相應地更改和修改這些配置。 按一下​完成​以建立並執行培訓運行。

    注意

    配置是獨特且特定於其預定配方的,這意味著零售銷售配方的配置將不適用於產品建議配方。 有關零售銷售方式配置的清單,請參閱reference部分。

評估模型

  1. 在Adobe Experience Platform中,按一下左側導覽欄中的​Models​連結,以列出所有現有的模型。 查找並按一下要評估的模型的名稱。

  2. 所有現有培訓執行都會列出其目前的培訓狀態。 在完成多個培訓執行後,可以在「模型評估」圖表中比較不同培訓執行的評估度量,並使用圖表上方的下拉式清單選取評估度量。

    「平均絕對百分比錯誤(MAPE)」量度將正確性表示為錯誤的百分比。 這用於識別效能最佳的實驗。 MAPE越低越好。

    「精確度」度量描述相關例項與擷取的​*例項總數之比例。*精確度可以看作是隨機選擇的結果正確的概率。

    按一下特定培訓執行,以檢視該執行的詳細資訊。 這可在執行完成之前完成。 在執行詳細資料頁面上,您可以看到其他評估度量、設定參數和訓練執行專屬的視覺化。 您也可以下載活動記錄檔,以檢視執行的詳細資訊。 對於失敗的執行,記錄檔特別有用,以檢視出錯之處。

  3. 超參數無法訓練,模型必須通過測試不同的超參陣列合來優化。 重複此模型訓練和評估流程,直到您到達最佳模型。

後續步驟

本教學課程將引導您在Data Science Workspace中建立、訓練和評估模型。 到達最佳化模型後,您就可以使用經過訓練的模型,依照UI](./score-model-ui.md)教學課程中的[對模型評分來產生見解。

參考

零售銷售方式配置

超參數決定模型的訓練行為,修改超參數將影響模型的準確性和精度:

超參數 說明 建議範圍
learning_rate 學習率會透過learning_rate縮減每棵樹的貢獻。 learning_rate和n_meativers之間存在取捨。 0.1
n_mediators 要執行的升級階段數。 漸層增強功能對過度調整相當穩健,因此,大量的漸層增強功能通常能產生較佳的效能。 100
max_depth 個別回歸估計的最大深度。 最大深度限制樹中的節點數。 調整此參數以獲得最佳效能;最佳值取決於輸入變數的互動。 3

其他參數確定模型的技術屬性:

參數鍵 類型 說明
ACP_DSW_INPUT_FEATURES 字串 逗號分隔的輸入模式屬性清單。
ACP_DSW_TARGET_FEATURES 字串 逗號分隔的輸出模式屬性清單。
ACP_DSW_FEATURE_UPDATE_SUPPORT 布林值 確定輸入和輸出特徵是否可修改
tenantId 字串 此ID可確保您建立的資源具有正確的命名空間,並且包含在IMS組織中。 請依照此處的 步驟尋找您的租用戶ID。
ACP_DSW_TRAINING_XDM_SCHEMA 字串 用於訓練模型的輸入模式。
evaluation.labelColumn 字串 評估視覺化的欄標籤。
evaluation.metrics 字串 用於評估模型的評估度量的逗號分隔清單。
ACP_DSW_SCORING_RESULTS_XDM_SCHEMA 字串 用於計分模型的輸出方案。

本頁內容