数据科学工作区概述

Adobe Experience Platform Data Science Workspace 使用机器学习和人工智能从您的数据中释放见解。 集成到Adobe Experience Platform中, Data Science Workspace 帮助您在各种Adobe解决方案中使用内容和数据资源做出预测。

所有技能水平的数据科学家都将发现复杂、易用的工具,这些工具支持机器学习方法的快速开发、培训和调整 — 人工智能技术的所有好处,但又没有复杂性。

替换为 Data Science Workspace,数据科学家可以轻松创建由机器学习提供支持的智能服务API。 这些服务可与其他Adobe服务(包括Adobe Target和Adobe Analytics Cloud)配合使用,以帮助您在Web、桌面和移动应用程序中自动提供个性化、有针对性的数字体验。

本指南概述了与以下内容相关的主要概念 Data Science Workspace.

简介

当今的企业高度重视挖掘大数据以实现预测和洞察,这将帮助他们个性化客户体验,并为客户(和业务)带来更多价值。
从数据获取见解固然重要,但需要付出高昂的代价。 它通常需要熟练的数据科学家来进行密集且耗时的数据研究,以开发机器学习模型(或方法),从而提供智能服务。 过程漫长,技术复杂,很难找到熟练的数据科学家。

替换为 Data Science Workspace,Adobe Experience Platform允许您在整个企业内引入以体验为中心的人工智能,从而简化并加快从数据到洞见的代码转换:

  • 机器学习框架和运行时
  • 集成访问存储在Adobe Experience Platform中的数据
  • 构建于之上的统一数据架构 Experience Data Model (XDM)
  • 机器学习/人工智能和管理大型数据集所需的计算能力
  • 预先构建的机器学习方法,可加快向人工智能驱动的体验的飞跃
  • 简化不同技能级别的数据科学家的创作、重用和修改方法
  • 无需开发人员,只需单击几下即可完成智能服务发布和共享,并可进行监控和再培训,以持续优化个性化客户体验

所有技能级别的数据科学家将更快地获得洞察力并更有效地获得数字体验。

快速入门

在深入了解 Data Science Workspace,下面是关键术语的简短摘要:

搜索词 定义
Data Science Workspace Data Science Workspace 范围 Experience Platform 使客户能够利用数据创建机器学习模型 Experience Platform 和Adobe解决方案,生成智能见解和预测以汇集令人愉快的最终用户数字体验。
人工智能 人工智能是计算机系统的一项理论和发展,能够执行通常需要人类智能的任务,例如视觉感知、语音识别、决策和语言之间的翻译。
机器学习 机器学习是一个研究领域,它使计算机能够在不被明确编程的情况下学习。
Sensei ML框架 Sensei ML Framework是跨Adobe的统一机器学习框架,它利用以下对象的数据 Experience Platform 使数据科学家能够以更快、可扩展和可重复使用的方式开发机器学习驱动的智能服务。
Experience Data Model Experience Data Model (XDM)是Adobe为定义标准模式而领导的一项标准化工作,例如 Profile 和 ExperienceEvent,用于客户体验管理。
JupyterLab JupyterLab 是Project Jupyter的开源基于Web的界面,与紧密集成 Experience Platform.
配方 配方是模型规范的Adobe术语,是表示特定机器学习、AI算法或算法组合、处理逻辑和配置的顶级容器,构建和执行经过训练的模型从而帮助解决特定业务问题。
模型 模型是机器学习方法的一个实例,它使用历史数据和配置进行培训以针对业务用例进行解析。
培训 训练是从标记数据中学习模式和见解的过程。
训练好的模型 训练好的模型表示模型训练过程的可执行输出,其中一组训练数据应用于模型实例。 经过训练的模型将维护对从中创建的任何智能Web服务的引用。 训练好的模型适合对智能Web服务进行评分和创建。 对已训练模型的修改可作为新版本进行跟踪。
评分 评分是使用经过训练的模型从数据生成洞察的过程。
服务 部署的服务通过API公开人工智能、机器学习模型或高级算法的功能,以便其他服务或应用程序可以使用该功能创建智能应用程序。

下表概述了配方、模型、训练运行和评分运行之间的层次结构关系。

了解 Data Science Workspace

替换为 Data Science Workspace,您的数据科学家可以简化在大型数据集中发现洞察信息的繁琐过程。 基于通用机器学习框架和运行时, Data Science Workspace 提供高级工作流管理、模型管理和可扩展性。 智能服务支持重复使用机器学习方法,以支持使用Adobe产品和解决方案创建的各种应用程序。

一站式数据访问

数据是人工智能和机器学习的基础。

Data Science Workspace 与Adobe Experience Platform完全集成,包括数据湖, Real-Time Customer Profile、和 Unified Edge. 一次性探索存储在Adobe Experience Platform中的所有组织数据,以及常见的大数据和深度学习库,例如 Spark ML和 TensorFlow. 如果找不到所需内容,请使用XDM标准化架构摄取您自己的数据集。

预建的机器学习方法

Data Science Workspace 包括预建的机器学习方法,可满足零售预测和异常检测等常见业务需求,因此数据科学家和开发人员不必从头开始。 目前提供三种配方, 产品购买预测产品推荐、和 零售额.

如果您愿意,您可以根据自己的需要调整预建配方、导入配方,或从头开始构建自定义配方。 但是,一旦您培训并超调配方,创建自定义智能服务就不需要开发人员 — 只需点击几下,您就可以构建有针对性的个性化数字体验。

侧重于数据科学家的工作流

无论您拥有多深的数据科学专业知识, Data Science Workspace 有助于简化和加快在数据中查找见解并将其应用于数字体验的过程。

数据探索

找到正确的数据并加以准备是构建有效方案最耗费人力的部分。 Data Science Workspace 和Adobe Experience Platform将帮助您更快地从数据获得见解。

在Adobe Experience Platform上,您的跨渠道数据集中存储在XDM标准化架构中,因此数据更易于查找、理解和清理。 基于通用架构的单个数据存储可以节省无数个小时的数据探索和准备时间。

浏览时,使用R Python或集成了、托管的Scala Jupyter Notebook 浏览上的数据目录 Platform. 使用其中一种语言,您还可以利用 Spark ML和TensorFlow。 从头开始,或使用为特定业务问题提供的笔记本模板。

作为数据探索工作流的一部分,您还可以摄取新数据或使用现有功能来帮助准备数据。

创作

替换为 Data Science Workspace,由您决定如何创作配方。

  • 浏览预先构建的方法以节省时间,该方法可满足您的业务需求,您可以按原样使用或配置它以满足您的特定要求。
  • 使用Jupyter Notebook中的创作运行时从头开始创建方法,以开发和注册方法。
  • 将在Adobe Experience Platform外部创作的方法上传到 Data Science Workspace 或从存储库导入方法代码,例如 Git,使用之间可用的身份验证和集成 Git 和 Data Science Workspace.

试验

数据科学工作区为实验过程带来了巨大的灵活性。 从你的配方开始。 然后,使用相同的核心算法并结合独特特征(如超调参数)创建单独的实例。 您可以根据需要创建任意数量的实例,并根据需要多次对每个实例进行训练和评分。 当你训练他们时, Data Science Workspace 跟踪配方、方法实例和经过培训的实例,以及评估指标,因此您不必这样做。

可操作化

只要点击几下即可创建智能服务。 无需编码 — 您可以自行完成此操作,无需招募开发人员或工程师。 最后,将智能服务发布到AdobeIO,供您的数字体验团队使用。

持续改进

Data Science Workspace 跟踪在何处调用智能服务及其执行情况。 随着数据的滚入,您可以评估智能服务的准确性以结束循环,并根据需要重新训练配方以提高性能。 从而实现了客户个性化精度的不断细化。

访问新功能和数据集

数据科学家可以利用Adobe服务提供的新技术和数据集。 通过频繁更新,我们可以将数据集和技术集成到平台中,因此您无需这样做。

安全与安心

保护数据安全是Adobe的首要任务。 Adobe通过安全流程和控制机制保护您的数据,这些安全流程和控制机制旨在帮助遵守业界接受的标准、法规和认证。

安全内置在软件和服务中,是Adobe安全产品生命周期的一部分。
要了解Adobe数据和软件安全性、合规性及其他,请访问https://www.adobe.com/security.html上的安全页面。

Data Science Workspace 正在操作

预测和见解可为访问您网站、联系您的呼叫中心或参与其他数字体验的每个客户提供高度个性化的体验所需的信息。 以下是您日常工作的方式 Data Science Workspace.

定义问题

这一切都始于一个商业问题。 例如,在线呼叫中心需要上下文来帮助他们将负面客户情绪转变为积极。

有关客户的数据很多。 他们浏览网站,将商品放入购物车,甚至下订单。 他们可能以前曾收到过电子邮件、使用过优惠券,或联系过呼叫中心。 因此,方法需要使用有关客户及其活动的可用数据来确定购买倾向并建议客户可能会喜欢并使用的选件。

与呼叫中心联系时,客户购物车中仍有两双鞋,但脱了一件衬衫。 有了这些信息,智能服务可能建议呼叫中心工程师在通话期间提供鞋子20%的优惠券。 如果客户使用优惠券,则该信息会添加到数据集中,并且下次客户致电时,预测会变得更好。

探索并准备数据

根据定义的业务问题,您知道方法应查看客户的所有Web交易,包括网站访问、搜索、页面查看、点击的链接、购物车操作、收到的优惠、收到的电子邮件、呼叫中心交互等。

数据科学家通常花费高达75%的时间来制定探索和转换数据的配方。 数据通常来自多个存储库,并保存在不同的架构中 — 在用于创建方法之前,必须将其组合并映射。

如果您从头开始或配置现有方法,则可以在一个集中且标准化的数据目录中开始您的数据搜索,这会显着简化寻找。 您甚至可能会发现贵组织中的另一位数据科学家已识别出相似的数据集,并选择优化该数据集,而不是从头开始。
Adobe Experience Platform中的所有数据都符合标准化的XDM架构,无需创建复杂模型来连接数据或获取数据工程师的帮助。

如果您没有立即找到所需的数据,但是这些数据存在于Adobe Experience Platform之外,那么摄取其他数据集是一项相对简单的任务,这也将转换为标准化的XDM架构。
您可以使用 Jupyter Notebook 简化数据预处理 — 可能从笔记本电脑模板或您之前用于购买倾向的笔记本电脑开始。

创作方法

如果您已找到满足所有需求的配方,则可以继续试验。 或者,您可以对方法稍作修改,或从头开始创建方法 — 利用 Data Science Workspace 创作运行时 Jupyter Notebook. 使用创作运行时可确保您既可以使用 Data Science Workspace 培训和评分工作流程,并在以后转换方法,以便组织中的其他人可以存储并重用它。

您还可以将方法导入到 Data Science Workspace 并在创建智能服务时利用试验工作流。

试验配方

通过合并核心机器学习算法的配方,可以使用单一配方创建多个配方实例。 这些方法实例称为模型。 一个模型需要训练和评估来优化其运行效率和功效,这个过程通常包含反复试验。

在训练模型时,将生成训练运行和评估。 Data Science Workspace 跟踪每个独特模型的评估指标及其训练运行。 通过试验生成的评估指标将允许您确定表现最佳的训练运行。

访问 APIUI 有关如何在中训练和评估模型的教程 Data Science Workspace.

使模型可操作

当您选择最佳训练方法以满足您的业务需求时,可以在中创建智能服务 Data Science Workspace 没有开发人员帮助。 只需点击几下即可 — 无需编码。 您组织的其他成员无需重新创建模型即可访问已发布的智能服务。

发布的智能服务可配置为在新的数据可用时自动不定期地对其进行训练。 这可以确保您的服务随着时间的流逝而保持其效率和功效。

后续步骤

Data Science Workspace 帮助简化数据科学工作流程,从数据收集到算法,再到为各个技能级别的数据科学家提供的智能服务。 使用高级工具 Data Science Workspace 提供,您可以显着缩短从数据到见解的时间。

更重要的是, Data Science Workspace 将Adobe领先营销平台的数据科学和算法优化功能交由企业数据科学家处理。 企业可以首次将专有算法引入该平台,利用Adobe强大的机器学习和AI功能,大规模地提供高度个性化的客户体验。

通过将品牌专业知识与Adobe的机器学习和AI技术相结合,企业能够在客户提出要求之前为他们提供他们想要的东西,从而提升商业价值和品牌忠诚度。

有关其他信息(如完整的日常工作流程),请首先阅读 数据科学工作区演练 文档。

其他资源

以下视频旨在支持您了解 Data Science Workspace.

在此页面上