資料科學工作區總覽
Adobe Experience Platform Data Science Workspace使用機器學習和人工智慧來釋放您資料的深入分析。 Data Science Workspace已整合至Adobe Experience Platform中,可協助您在各個Adobe解決方案中使用您的內容和資料資產進行預測。
各種技能的資料科學家都會找到尖端且易於使用的工具,這些工具可支援快速開發、訓練和調整機器學習配方,提供AI技術的所有優點,而不會帶來複雜性。
透過Data Science Workspace,資料科學家可以輕鬆建立由機器學習支援的Intelligent Services API。 這些服務可搭配其他Adobe服務(包括Adobe Target和Adobe Analytics Cloud)使用,協助您在網頁、案頭和行動應用程式中自動提供個人化、針對性的數位體驗。
本指南提供與Data Science Workspace相關的重要概念概觀。
簡介
現今的企業高度重視發掘巨量資料以進行預測和深入分析,協助他們打造個人化客戶體驗,並為客戶和企業帶來更多價值。
從資料獲得深入見解固然重要,但成本卻很高。 這通常需要技術嫻熟的資料科學家來進行密集且耗時的資料研究,以開發可支援智慧型服務的機器學習模型或配方。 這個過程很漫長,技術也很複雜,很難找到技術嫻熟的資料科學家。
透過Data Science Workspace,Adobe Experience Platform可讓您將以體驗為中心的人工智慧帶入整個企業,透過以下功能簡化並加速資料轉換成分析結果的程式碼:
- 機器學習框架和運行時
- 集成訪問存儲在Adobe Experience Platform中的數據
- 建立在 (XDM) 上的 Experience Data Model 統一數據綱要
- 機器學習/AI及管理大型資料集所需的運算能力
- 預先建立的機器學習訣竅,可加速邁向AI驅動體驗的飛躍
- 為不同技能等級的資料科學家簡化配方,以供其製作、重複使用和修改
- 只要按幾下滑鼠(無需開發人員)即可發佈和共用智慧型服務,並進行監控和再培訓,以持續最佳化個人化客戶體驗
所有技能等級的資料科學家將更快獲得洞察力並更快獲得更有效的數位體驗。
快速入門
在深入探討Data Science Workspace的詳細資訊之前,以下是主要術語的簡短摘要:
下列圖表概述配方、模型、訓練回合和評分回合之間的階層式關係。
瞭解 Data Science Workspace
透過Data Science Workspace,您的資料科學家可以簡化在大型資料集中發掘深入見解的繁瑣程式。 Data Science Workspace建置在通用機器學習架構和執行階段上,可提供進階的工作流程管理、模型管理和擴充能力。 智慧型服務可支援重複使用機器學習配方,以支援使用Adobe產品和解決方案所建立的多種應用程式。
一站式資料存取
資料是AI和機器學習的基礎。
Data Science Workspace已與Adobe Experience Platform完全整合,包括資料湖、Real-Time Customer Profile和Unified Edge。 一次探索儲存在Adobe Experience Platform中的所有組織資料,以及常見的大型資料和深度學習資料庫,例如Spark ML和TensorFlow。 如果您找不到所需專案,請使用XDM標準化結構描述擷取您自己的資料集。
預先建立的機器學習配方
Data Science Workspace包含針對一般業務需求預先建立的機器學習配方,例如零售銷售預測和異常偵測,因此資料科學家和開發人員不必從頭開始。 目前提供三種配方: 產品購買預測、產品建議以及零售銷售。
如果您願意,可以根據需要調整預構建的方式、導入方式或從頭開始開始以版本編號自定義方式。 無論您何時開始,一旦訓練和超調諧方式,創建自定義智能服務就不需要開發人員 - 只需按兩下幾下,您就可以版本編號有針對性的個人化數字體驗。
專注於數據科學家的工作流程
無論您的數據科學專業知識水準如何, Data Science Workspace 都有助於簡化和加速在數據中查找見解並將其應用於數位體驗的過程。
數據探索
尋找正確的資料並加以準備,是建立有效配方中最耗費人力的部分。 Data Science Workspace和Adobe Experience Platform將協助您更快速地從資料獲得見解。
在Adobe Experience Platform上,您的跨管道資料會集中並儲存在XDM標準化結構描述中,讓資料更容易尋找、理解和清除。 根據通用結構描述來儲存單一資料,可讓您節省探索和準備資料的無數時間。
當您瀏覽時,使用R、Python或Scala搭配整合的代管Jupyter Notebook來瀏覽Platform上的資料目錄。 使用其中一種語言,您也可利用Spark ML和TensorFlow。 從頭開始,或使用針對特定業務問題所提供的其中一個筆記型電腦範本。
在資料探索工作流程中,您也可以內嵌新資料或使用現有功能來協助資料準備。
製作
透過Data Science Workspace,您可以決定如何編寫配方。
- 瀏覽預先建立的配方,滿足您的業務需求,以節省時間,您可以依原樣使用,或設定以符合您的特定需求。
- 使用Jupyter Notebook中的編寫執行階段,從頭開始建立配方,以開發和註冊配方。
- 使用Git與Data Science Workspace之間可用的驗證與整合,將在Adobe Experience Platform外部撰寫的配方上傳至Data Science Workspace,或從存放庫(例如Git)匯入配方代碼。
實驗
數據科學工作環境為實驗過程帶來了巨大的靈活性。 用方式開始。 然後創建一個單獨的執行個體,使用相同的核心演算法與獨特的特徵配對,例如超調優參數。 您可以根據需要創建任意數量的實例,並根據需要多次為每個執行個體進行培訓評分。 當您訓練它們時,Data Science Workspace會追蹤配方、配方執行個體和訓練的執行個體,以及評估量度,因此您不必這麼做。
可操作化
只要按幾下就能建立智慧型服務,只要對配方感到滿意即可。 無需編碼 — 您可以自行操作,無需徵募開發人員或工程師。 最後,將智慧型服務發佈至AdobeIO,您的數位體驗團隊即可開始使用。
持續改進
Data Science Workspace追蹤智慧型服務叫用的位置及其執行方式。 隨著資料匯入,您可以評估智慧型服務精確度以結束回圈,並根據需要重新訓練配方以提升效能。 其結果是客戶個人化的精確度將不斷細化。
存取新功能和資料集
只要新技術和資料集可透過Adobe服務取得,資料科學家就可以馬上加以利用。 透過經常更新,我們可以將資料集和技術整合到平台中,因此您不必非要這麼做。
安全無虞,完全安心
保護資料安全是Adobe的首要任務。 Adobe使用安全性程式與控制機制,協助您遵循業界接受的標準、法規與認證,以保護您的資料。
安全性內建於軟體和服務中,是Adobe安全產品生命週期的一部分。
若要瞭解Adobe資料與軟體安全性、合規性等資訊,請造訪安全性頁面:https://www.adobe.com/security.html。
Data Science Workspace正在執行
預測和深入解析可提供您所需的資訊,讓每個造訪您網站、聯絡客服中心或參與其他數位體驗的客戶都能獲得高度個人化的體驗。 以下是Data Science Workspace日常工作的運作方式。
定義問題
一切都是從業務問題開始的。 例如,線上客服中心需要上下文來協助他們將負面的客戶情緒變成正面。
有關客戶的資料很多。 他們瀏覽網站、將商品放入購物車,甚至下訂單。 他們可能已收到電子郵件、使用優惠券,或先前曾聯絡過客服中心。 因此,配方需要使用有關客戶及其活動的可用資料,來判斷購買傾向,並推薦客戶可能喜歡並使用的優惠方案。
聯絡客服中心時,客戶在購物車中仍有兩雙鞋,但已移除襯衫。 有了這些資訊,智慧型服務可能會建議客服中心代理在通話期間提供鞋子20%的優惠券。 如果客戶使用抵用券,該資訊會新增到資料集中,而預測功能在下次客戶來電時就會變得更棒。
探索並準備資料
根據定義的業務問題,您知道配方應檢視客戶的所有網路交易,包括網站造訪、搜尋、頁面檢視、連結點按、購物車動作、已收到優惠、已收到電子郵件、客服中心互動等。
資料科學家通常會將高達75%的時間花在建立探索和轉換資料的配方上。 資料通常來自多個存放庫,並儲存在不同的結構描述中 — 在用來建立配方之前,必須先將其合併和對應。
如果您從頭開始或設定現有的方式,您會在集中式且標準化的資料目錄中開始進行資料搜尋,這會大幅簡化搜尋作業。 您甚至可能會發現組織中的另一位資料科學家已識別出類似的資料集,並選擇微調該資料集而非從頭開始。
Adobe Experience Platform中的所有資料都符合標準化的XDM結構,不需要建立複雜模型來聯結資料或取得資料工程師的協助。
如果您沒有立即找到您需要的資料,但資料存在於Adobe Experience Platform外部,擷取其他資料集是一項相對簡單的工作,此外資料集也會轉換為標準化的XDM結構描述。
您可以使用Jupyter Notebook來簡化資料前置處理 — 可能從筆記型電腦範本或您先前為了購買傾向而使用的筆記型電腦開始。
撰寫配方
如果您已找到符合所有需求的配方,您可以繼續實驗。 或者,您可以修改配方一點或從頭開始建立 — 利用Jupyter Notebook中的Data Science Workspace編寫執行階段。 使用編寫執行階段可確保您能夠同時使用Data Science Workspace訓練和評分工作流程,並稍後轉換配方,以便組織中的其他人可以儲存及重複使用。
您也可以在中匯入配方至Data Science Workspace,並在建立智慧型服務時善用實驗工作流程。
實驗配方
有了內含您核心機器學習演演算法的配方,您就可以使用單一配方建立許多配方執行個體。 這些配方執行個體稱為模型。 模型需要訓練和評估,以最佳化運作效率和效能,這個過程通常包含試驗和錯誤。
當您訓練模型時,會產生訓練回合和評估。 Data Science Workspace會追蹤每個唯一模型的評估量度及其訓練執行。 透過實驗產生的評估量度可讓您決定表現最佳的訓練回合。
造訪API或UI教學課程,瞭解如何在Data Science Workspace中訓練及評估模型。
讓模型開始運轉
當您選擇經過最佳訓練的配方來滿足您的業務需求時,您無需開發人員協助,即可在Data Science Workspace中建立智慧型服務。 只需點擊幾下 - 無需編碼。 組織的其他成員可以訪問已發佈的智慧服務,而無需重新創建模型。
已發佈的智慧服務可配置為在可用新數據可用時不時使用新數據自動訓練自身。 這可確保您的服務隨著時間的推移保持其效率和功效。
後續步驟
Data Science Workspace 幫助簡化數據科學工作流程,從數據收集到演算法,再到面向所有技能水準的數據科學家的智慧服務。 透過Data Science Workspace提供的精密工具,您可以大幅縮短從資料到見解的時間。
更重要的是,Data Science Workspace將Adobe領先行銷平台的資料科學和演演算法最佳化功能交由企業資料科學家使用。 企業可以首次將專屬演演算法帶入平台,利用Adobe強大的機器學習和AI功能,大規模提供高度個人化的客戶體驗。
結合品牌專業知識和Adobe的機器學習和AI能力,企業能夠在客戶要求之前提供他們想要的東西,藉此提高商業價值和品牌忠誠度。
如需其他資訊,例如完整的日常工作流程,請先閱讀資料科學Workspace逐步說明檔案。
其他資源
下列影片是設計用來支援您對Data Science Workspace的理解。