了解 Data Science Workspace

借助Data Science Workspace,您的数据科学家可以简化在大型数据集中发现洞察内容的繁琐过程。 Data Science Workspace基于通用机器学习框架和运行时构建,可提供高级工作流管理、模型管理和可扩展性。 智能服务支持重复使用机器学习方法,以支持使用Adobe产品和解决方案创建的各种应用程序。

一站式数据访问

数据是人工智能和机器学习的基础。

Data Science Workspace已与Adobe Experience Platform完全集成,包括数据湖、Real-Time Customer Profile和Unified Edge。 一次浏览存储在Adobe Experience Platform中的所有组织数据,以及常见的大数据和深度学习库,例如Spark ML和TensorFlow。 如果您没有找到所需的内容,请使用XDM标准化架构摄取您自己的数据集。

预建的机器学习方法

Data Science Workspace包括针对常见业务需求(如零售预测和异常检测)的预建机器学习方法,因此数据科学家和开发人员不必从头开始。 目前提供三种配方:产品购买预测产品推荐零售额

如果您愿意,您可以根据自己的需求调整预建的配方、导入配方,或从头开始构建自定义配方。 无论您何时开始,一旦您培训并超调方法,创建自定义智能服务便不需要开发人员 — 只需单击几下,即可构建有针对性的个性化数字体验。

重点介绍数据科学家的工作流程

无论您拥有何种级别的数据科学专业知识,Data Science Workspace都有助于简化和加速查找数据洞察并将洞察应用于数字体验的过程。

数据探索

找到正确的数据并加以准备是构建有效方案最耗费人力的部分。 Data Science Workspace和Adobe Experience Platform将帮助您更快地从数据获取见解。

在Adobe Experience Platform上,您的跨渠道数据集中存储在XDM标准化架构中,因此数据更易于查找、理解和清理。 基于通用架构的单个数据存储可以为您节省无数个小时的数据探索和准备时间。

在浏览时,将R、Python或Scala与集成的、托管的Jupyter Notebook一起使用,以浏览Experience Platform上的数据目录。 使用这些语言之一,您还可以利用Spark ML和TensorFlow。 从头开始,或使用为特定业务问题提供的笔记本模板。

作为数据探索工作流的一部分,您还可以摄取新数据或使用现有功能来帮助准备数据。

创作

通过Data Science Workspace,您可以决定如何创作配方。

  • 通过浏览预先构建的方法来满足您的业务需求,从而节省时间,您可以按原样使用,或对其进行配置以满足您的特定要求。
  • 使用Jupyter Notebook中的创作运行时从头开始创建方法以开发和注册方法。
  • 使用Git和Data Science Workspace之间可用的身份验证和集成,将在Adobe Experience Platform外部创作的方法上载到Data Science Workspace或从存储库(如Git)导入方法代码。

试验

数据科学Workspace为实验过程带来了极大的灵活性。 从你的配方开始。 然后,使用相同的核心算法并搭配独特的特征(如超调整参数)创建单独的实例。 您可以根据需要创建任意数量的实例,并根据需要多次对每个实例进行训练和评分。 在您培训这些人员时,Data Science Workspace将跟踪配方、方法实例和经过培训的实例以及评估指标,因此您不必这样做。

可操作

只要点击几下即可创建智能服务,只要您对自己的配方感到满意。 无需编码 — 您可以自行编码,无需征募开发人员或工程师。 最后,将智能服务发布到Adobe IO,为您的数字体验团队做好准备。

持续改进

Data Science Workspace跟踪智能服务的调用位置及其执行情况。 随着数据的滚入,您可以评估智能服务准确性以结束循环,并根据需要重新训练配方以提高性能。 结果是客户个性化的精度不断细化。

访问新功能和数据集

一旦通过Adobe服务获得新技术和数据集,数据科学家就可以立即利用这些技术和数据集。 我们通过频繁更新将数据集和技术集成到平台中,因此您不必这样做。

安全与安心

保护数据安全是Adobe的首要任务。 Adobe使用为帮助遵守行业公认的标准、法规和认证而开发的安全流程和控制功能来保护您的数据。

安全内置在软件和服务中,是Adobe安全产品生命周期的一部分。
要了解Adobe数据和软件安全性、合规性及其他,请访问安全页面,网址为https://www.adobe.com/security.html。

Data Science Workspace正在操作

预测和见解可为访问您网站、联系您的呼叫中心或参与其他数字体验的每个客户提供高度个性化的体验提供所需的信息。 以下是Data Science Workspace的日常工作方式。

定义问题

这一切都始于一个商业问题。 例如,在线呼叫中心需要上下文来帮助他们将负面客户情绪转变为积极。

有关客户的数据很多。 他们浏览网站,将商品放入购物车,甚至下订单。 他们可能以前曾收到过电子邮件、使用过优惠券,或联系过呼叫中心。 因此,方法需要使用有关客户及其活动的可用数据来确定购买倾向,并推荐客户可能会喜欢和使用的选件。

与呼叫中心联系时,客户购物车中仍有两双鞋,但移除了衬衫。 有了这些信息,智能服务可能建议呼叫中心代理在呼叫期间提供鞋子20%的优惠券。 如果客户使用优惠券,该信息会添加到数据集中,并且下次客户致电时预测会变得更加准确。

探索并准备数据

根据定义的业务问题,您知道方法应查看客户的所有Web交易,包括网站访问、搜索、页面查看、点击链接、购物车操作、已接收优惠、已接收电子邮件、呼叫中心交互等。

数据科学家通常花费高达75%的时间来创建探索和转换数据的方法。 数据通常来自多个存储库,并保存在不同的架构中 — 必须先对其进行组合和映射,然后才能用于创建方法。

如果您从头开始或配置现有方法,则可以在一个集中且标准化的数据目录中开始您的数据搜索,这会大大简化寻找。 您甚至可能会发现贵组织中的另一位数据科学家已经识别了一个类似的数据集,然后选择优化该数据集,而不是从头开始。
Adobe Experience Platform中的所有数据都符合标准化的XDM架构,从而无需创建复杂模型以联接数据或获取数据工程师的帮助。

如果您没有立即找到所需的数据,但它存在于Adobe Experience Platform之外,则摄取其他数据集是一项相对简单的任务,该数据集还将转换为标准化的XDM架构。
您可以使用Jupyter Notebook简化数据预处理 — 可能从笔记本模板或以前用于购买倾向的笔记本开始。

创作方法

如果您已找到满足所有需求的处方,则可以继续试验。 或者,您可以修改方法一点或从头开始创建方法 — 利用Jupyter Notebook中的Data Science Workspace创作运行时。 使用创作运行时可确保您既可以使用Data Science Workspace培训和评分工作流,又可以稍后转换方法,以便组织中的其他人可以存储并重用它。

您还可以将方法导入Data Science Workspace,并在创建智能服务时利用试验工作流。