在資料科學Workspace UI中訓練及評估模型

在Adobe Experience Platform資料科學Workspace中,機器學習模型是透過結合適合模型意圖的現有方法建立的。 然後訓練並評估模型,藉由微調其相關的Hyperparameters來最佳化其作業效率和效能。 配方可重複使用,這表示您可以透過單一配方建立多個模型,並針對特定用途量身打造。

本教學課程將逐步說明建立、訓練及評估模型的步驟。

快速入門

若要完成本教學課程,您必須有Experience Platform的存取權。 如果您沒有Experience Platform中組織的存取權,請在繼續之前與您的系統管理員交談。

此教學課程需要現有的配方。 如果您沒有配方,請先遵循在UI教學課程中匯入封裝的配方,然後再繼續。

建立模型

在Experience Platform中,選取位於左側導覽的​ 模型 ​索引標籤,然後選取瀏覽索引標籤以檢視您現有的模型。 選取頁面右上角附近的​ 建立模型,開始建立模型的程式。

瀏覽現有配方清單,尋找並選取要用來建立模型的配方,然後選取​ 下一步

選取適當的輸入資料集,然後選取​ 下一步。 這會設定模型的預設輸入訓練資料集。

提供模型的名稱並檢閱預設模型組態。 在配方建立、檢閱及修改組態值期間,透過按兩下值來套用預設組態。

若要提供一組新的組態,請選取​ 上傳新的組態,並將包含模型組態的JSON檔案拖曳到瀏覽器視窗中。 選取​ 完成 ​以建立模型。

NOTE
設定是唯一的且特定於其預期方式,這表示零售銷售方式的設定不適用於產品Recommendations方式。 請參閱reference區段,以取得零售銷售配方設定清單。

建立訓練回合

在Experience Platform中,選取位於左側導覽的​ 模型 ​索引標籤,然後選取瀏覽索引標籤以檢視您現有的模型。 尋找並選取附加至您要訓練之模型名稱的超連結。

列出所有現有訓練回合及其目前的訓練狀態。 對於使用Data Science Workspace使用者介面建立的模型,會使用預設設定和輸入訓練資料集自動產生並執行訓練回合。

選取模型概觀頁面右上角附近的​ 訓練,以建立新的訓練回合。

選取訓練回合的訓練輸入資料集,然後選取​ 下一步

模型建立期間提供的預設組態會顯示,按兩下值可相應變更和修改這些組態。 選取​ 完成 ​以建立並執行訓練回合。

NOTE
設定是唯一的且特定於其預期方式,這表示零售銷售方式的設定不適用於產品Recommendations方式。 請參閱reference區段,以取得零售銷售配方設定清單。

評估模型

在Experience Platform中,選取位於左側導覽的​ 模型 ​索引標籤,然後選取瀏覽索引標籤以檢視您現有的模型。 尋找並選取附加至您要評估之模型名稱的超連結。

選取模型

列出所有現有訓練回合及其目前的訓練狀態。 如果有多個完成的訓練回合,可在模型評估圖表中比較不同訓練回合中的評估量度。 使用圖表上方的下拉式清單,選取評估量度。

平均絕對百分比誤差(MAPE)量度以誤差百分比來表示準確度。 這可用來識別表現最佳的實驗。 MAPE越低越好。

訓練回合總覽

「精確度」量度說明相關執行個體與擷取的​ ​執行個體總數的百分比。 精確度可視為隨機選取結果正確的可能性。

執行多個回合

選取特定訓練回合會開啟評估頁面,提供該回合的詳細資料。 這可以在執行完成之前完成。 在評估頁面上,您可以看到訓練回合專用的其他評估量度、設定引數和視覺效果。

預覽記錄

您也可以下載活動記錄檔以檢視執行的詳細資訊。 記錄對於失敗的執行特別有用,以檢視哪裡出了問題。

活動記錄

無法訓練Hyperparameters,且必須透過測試不同的Hyperparameters組合來最佳化Model。 重複此模型訓練和評估程式,直到到達最佳化模型為止。

後續步驟

本教學課程會逐步引導您建立、訓練及評估Data Science Workspace中的模型。 抵達最佳化模型後,您可以依照在UI🔗教學課程中對模型評分的,使用經過訓練的模型來產生深入分析。

參考 reference

零售銷售配方設定

超引數會決定模型的訓練行為,修改Hyperparameters將會影響模型的精確度和精確度:

超引數
說明
建議的範圍
learning_rate
學習率會藉由learning_rate縮減每個樹狀結構的貢獻。 learning_rate和n_estimators之間存在取捨。
0.1
n_estimators
要執行的提升階段數目。 漸層提升對於過調整相當穩健,因此大量數字通常會產生較佳的效能。
100
max_depth
個別回歸估計值的最大深度。 最大深度會限制樹狀結構中的節點數目。 調整此引數以獲得最佳效能;最佳值取決於輸入變數的互動。
3

其他引數會決定模型的技術屬性:

參數索引鍵
類型
說明
ACP_DSW_INPUT_FEATURES
字串
以逗號分隔的輸入結構描述屬性清單。
ACP_DSW_TARGET_FEATURES
字串
逗號分隔的輸出結構描述屬性清單。
ACP_DSW_FEATURE_UPDATE_SUPPORT
布林值
決定是否可修改輸入和輸出功能
tenantId
字串
此ID可確保您建立的資源能正確建立名稱空間,並包含在您的組織內。 請依照這裡的步驟尋找您的租使用者ID。
ACP_DSW_TRAINING_XDM_SCHEMA
字串
用於訓練模型的輸入結構描述。
evaluation.labelColumn
字串
評估視覺效果的欄標籤。
evaluation.metrics
字串
用於評估模型的評估量度清單(以逗號分隔)。
ACP_DSW_SCORING_RESULTS_XDM_SCHEMA
字串
用於評分模型的輸出結構描述。
recommendation-more-help
cc79fe26-64da-411e-a6b9-5b650f53e4e9