数据科学工作区概述
Adobe Experience Platform Data Science Workspace使用机器学习和人工智能从您的数据中释放见解。 Data Science Workspace已集成到Adobe Experience Platform中,可帮助您跨Adobe解决方案使用您的内容和数据资源做出预测。
所有技能水平的数据科学家都将发现复杂、易用的工具,这些工具支持机器学习方法的快速开发、培训和调整 — 人工智能技术的所有好处,但又没有复杂性。
使用Data Science Workspace,数据科学家可以轻松创建由机器学习提供支持的智能服务API。 这些服务可与其他Adobe服务(包括Adobe Target和Adobe Analytics Cloud)配合使用,帮助您在Web、桌面和移动应用程序中自动提供个性化、有针对性的数字体验。
本指南概述了与 Data Science Workspace相关的关键概念。
简介
当今的企业高度重视挖掘大数据的预测和见解,这将有助于他们个性化客户体验,并为客户和业务提供更多价值。尽管它很重要,但从数据到见解的成本可能很高。 它通常需要熟练的数据科学家进行密集且耗时的数据研究,以开发机器学习模型或配方,为智能服务提供支持。 这个过程是漫长的,技术是复杂的,而且很难找到熟练的数据科学家。
借助 Data Science Workspace,Adobe Experience Platform 允许您在整个企业中引入以体验为中心的 AI,通过以下方式简化和加速从数据到见解到代码的过程:
- 机器学习框架和运行时
- 集成访问存储在Adobe Experience Platform中的数据
- 基于Experience Data Model (XDM)构建的统一数据架构
- 机器学习/人工智能和管理大型数据集所需的计算能力
- 预构建的机器学习配方,加速向 AI 驱动型体验的飞跃
- 为不同技能水平的数据科学家简化配方的创作、重用和修改
- 只需单击几下即可发布和共享智能服务(无需开发人员),并可进行监控和再培训,以持续优化个性化客户体验
所有技能水平的数据科学家将更快地获得洞察力并更高效地获得数字体验。
快速入门
在深入了解Data Science Workspace的详细信息之前,请看下面这些关键术语的简短摘要:
下图概述了处方、模型、培训运行和评分运行之间的层次结构关系。
了解 Data Science Workspace
利用Data Science Workspace,您的数据科学家可以简化在大数据集中发现洞察的繁琐过程。 Data Science Workspace基于通用的机器学习框架和运行时构建,可提供高级工作流管理、模型管理和可扩展性。 智能服务支持重复使用机器学习方法,以支持使用Adobe产品和解决方案创建的各种应用程序。
一站式数据访问
数据是人工智能和机器学习的基础。
Data Science Workspace已与Adobe Experience Platform完全集成,包括数据湖、Real-Time Customer Profile和Unified Edge。 一次浏览存储在Adobe Experience Platform中的所有组织数据,以及常见的大数据和深度学习库,例如Spark ML和TensorFlow。 如果您没有找到所需的内容,请使用XDM标准化架构摄取您自己的数据集。
预建的机器学习方法
Data Science Workspace包括针对常见业务需求(如零售预测和异常检测)的预建机器学习方法,因此数据科学家和开发人员不必从头开始。 目前提供三种配方:产品购买预测、产品推荐和零售额。
如果您愿意,您可以根据自己的需求调整预建的配方、导入配方,或从头开始构建自定义配方。 无论您何时开始,一旦您培训并超调方法,创建自定义智能服务便不需要开发人员 — 只需单击几下,即可构建有针对性的个性化数字体验。
重点介绍数据科学家的工作流程
无论您拥有何种级别的数据科学专业知识,Data Science Workspace都有助于简化和加速查找数据洞察并将洞察应用于数字体验的过程。
数据探索
找到正确的数据并加以准备是构建有效方案最耗费人力的部分。 Data Science Workspace和Adobe Experience Platform将帮助您更快地从数据获取见解。
在Adobe Experience Platform上,您的跨渠道数据集中存储在XDM标准化架构中,因此数据更易于查找、理解和清理。 基于通用架构的单个数据存储可以为您节省无数个小时的数据探索和准备时间。
在浏览时,将R、Python或Scala与集成的、托管的Jupyter Notebook一起使用,以浏览Platform上的数据目录。 使用这些语言之一,您还可以利用Spark ML和TensorFlow。 从头开始,或使用为特定业务问题提供的笔记本模板。
作为数据探索工作流的一部分,您还可以摄取新数据或使用现有功能来帮助准备数据。
创作
使用 Data Science Workspace,您可以决定如何创作食谱。
- 通过浏览可满足您业务需求的预构建配方来节省时间,您可以按原样使用或配置以满足您的特定要求。
- 从头开始创建配方,使用 Jupyter Notebook 中的创作运行时开发和注册配方。
- 将使用 和 Data Science Workspace之间Git提供的身份验证和集成,将在 Adobe Experience Platform Data Science Workspace 之外创作的配方上传到存储库中,或从存储库(例如 Git)导入配方代码。
试验
数据科学Workspace为实验过程带来了极大的灵活性。 从你的配方开始。 然后,使用相同的核心算法并搭配独特的特征(如超调整参数)创建单独的实例。 您可以根据需要创建任意数量的实例,并根据需要多次对每个实例进行训练和评分。 训练它们时, Data Science Workspace 会跟踪配方、配方实例和训练实例以及评估指标,因此您不必这样做。
操作化
当您对配方感到满意时,只需单击几下即可创建智能服务。 无需编码 — 您可以自行编码,无需征募开发人员或工程师。 最后,将智能服务发布到AdobeIO,供您的数字体验团队使用。
持续改进
Data Science Workspace跟踪智能服务的调用位置及其执行情况。 随着数据的滚入,您可以评估智能服务准确性以结束循环,并根据需要重新训练配方以提高性能。 结果是客户个性化的精度不断细化。
访问新功能和数据集
一旦通过Adobe服务获得新技术和数据集,数据科学家就可以立即利用这些技术和数据集。 我们通过频繁更新将数据集和技术集成到平台中,因此您不必这样做。
安全与安心
保护数据安全是Adobe的首要任务。 Adobe通过安全流程和控制机制保护您的数据,这些安全流程和控制机制旨在帮助遵守业界接受的标准、法规和认证。
安全内置在软件和服务中,是Adobe安全产品生命周期的一部分。
要了解Adobe数据和软件安全性、合规性及其他,请访问https://www.adobe.com/security.html上的安全页面。
Data Science Workspace正在操作
预测和洞察为您提供所需的信息,以便向访问您的网站、联系您的呼叫中心或参与其他数字体验的每个客户提供高度个性化的体验。 以下是Data Science Workspace的日常工作方式。
定义问题
这一切都始于一个商业问题。 例如,在线呼叫中心需要上下文来帮助他们将负面客户情绪转变为正面。
有关客户的数据很多。 他们浏览网站,将商品放入购物车,甚至下订单。 他们可能以前曾收到过电子邮件、使用过优惠券,或联系过呼叫中心。 因此,方法需要使用有关客户及其活动的可用数据来确定购买倾向,并推荐客户可能会喜欢和使用的选件。
与呼叫中心联系时,客户购物车中仍有两双鞋,但移除了衬衫。 有了这些信息,智能服务可能建议呼叫中心代理在呼叫期间提供鞋子20%的优惠券。 如果客户使用优惠券,该信息会添加到数据集中,并且下次客户致电时预测会变得更加准确。
探索并准备数据
根据定义的业务问题,您知道方法应查看客户的所有Web交易,包括网站访问、搜索、页面查看、点击链接、购物车操作、已接收优惠、已接收电子邮件、呼叫中心交互等。
数据科学家通常花费高达75%的时间来创建探索和转换数据的方法。 数据通常来自多个存储库,并保存在不同的架构中 — 必须先对其进行组合和映射,然后才能用于创建方法。
如果您从头开始或配置现有方法,则可以在一个集中且标准化的数据目录中开始您的数据搜索,这会大大简化寻找。 您甚至可能会发现贵组织中的另一位数据科学家已经识别了一个类似的数据集,然后选择优化该数据集,而不是从头开始。
Adobe Experience Platform中的所有数据都符合标准化的XDM架构,从而无需创建复杂模型以联接数据或获取数据工程师的帮助。
如果您没有立即找到所需的数据,但它存在于Adobe Experience Platform之外,则摄取其他数据集是一项相对简单的任务,该数据集还将转换为标准化的XDM架构。
您可以使用Jupyter Notebook简化数据预处理 — 可能从笔记本模板或以前用于购买倾向的笔记本开始。
编写配方
如果你已经找到了满足所有需求的配方,你可以继续试验。 或者,您可以修改配方或从头创建配方 — 利用Jupyter Notebook中的Data Science Workspace创作运行时。 使用创作运行时可确保您既可以使用Data Science Workspace培训和评分工作流程,稍后还可以转换处方,以便可以存储处方并由组织中的其他人重新使用。
您还可以将配方导入到Data Science Workspace中,并在创建智能服务时利用实验工作流。
尝试一下配方
使用包含核心机器学习算法的配方,可以使用单一配方创建多个配方实例。 这些方法实例称为模型。 模型需要训练和评估来优化其运行效率和功效,这个过程通常包括反复试验。
在训练模型时,将生成训练运行和评估。 Data Science Workspace跟踪每个唯一模型及其训练运行的评估指标。 通过试验生成的评估指标将允许您确定表现最佳的训练运行。
有关如何在Data Science Workspace中训练和评估模型,请访问API或UI教程。
将模型投入使用
当您选择了经过最佳培训的方法来满足您的业务需求时,您无需开发人员帮助即可在Data Science Workspace中创建智能服务。 只需点击几下即可 — 无需编码。 您组织的其他成员无需重新创建模型即可访问发布的智能服务。
发布的智能服务可配置为在新的数据可用时自动不时地对其进行训练。 这可以确保您的服务随着时间的流逝而保持其效率和功效。
后续步骤
Data Science Workspace有助于简化和简化数据科学工作流程,从数据收集到算法,再到面向所有技能级别的数据科学家的智能服务。 使用Data Science Workspace提供的复杂工具,您可以显着缩短从数据到见解的时间。
更重要的是,Data Science Workspace将Adobe领先营销平台的数据科学和算法优化功能交给了企业数据科学家。 企业可以首次将专有算法引入该平台,利用Adobe强大的机器学习和AI功能大规模提供高度个性化的客户体验。
结合品牌专业知识和Adobe的机器学习以及人工智能能力,企业能够在客户提出要求之前通过为他们提供他们想要的东西来提高商业价值和品牌忠诚度。
有关其他信息(如完整的日常工作流程),请先阅读数据科学Workspace演练文档。
其他资源
以下视频旨在支持您对 Data Science Workspace的理解。