资产迁移指南

将资产迁移到AEM时,需要考虑几个步骤。 从其当前主目录中提取资产和元数据不属于此文档的范围,因为实施之间的差异很大。 相反,此文档介绍如何将这些资产引入AEM、应用其元数据、生成演绎版以及激活或发布资产。

前提条件

在执行下述任何步骤之前,请查看并实施资产性能调 整提示中的指导。 许多步骤(如配置最大并发作业)都增强了服务器在负载下的稳定性和性能。 在系统加载了资源后,执行其他步骤(如文件数据存储配置)很困难。

注意

以下资产迁移工具不属于Adobe Experience Manager。 Adobe客户关怀部门不支持这些工具。

  • ACS AEM Tools Tag Maker
  • ACS AEM工具CSV资产导入程序
  • ACS Commons Bulk Workflow Manager
  • ACS Commons Fast Action Manager
  • 合成工作流

本软件是开放源软件,受 Apache v2 许可证的保护。要提出问题或报告问题,请访问针对 ACS AEM 工具的 GitHub 问题ACS AEM Commons

迁移到AEM

将资产迁移到AEM需要几个步骤,并应将其视为分阶段的过程。 迁移的阶段如下:

  1. 禁用工作流。
  2. 加载标记。
  3. 摄取资源。
  4. 处理再现。
  5. 激活资产。
  6. 启用工作流。

chlimage_1-223

禁用工作流

在开始迁移之前,请禁用工作流的启 DAM Update Asset 动器。 最好将所有资产引入系统,然后批量运行工作流。 如果迁移时您已经处于活动状态,则可以计划这些活动在非工作时间执行。

加载标记

您可能已经拥有要应用于图像的标记分类。 CSV资产导入程序和元数据用户档案功能等工具可以帮助您自动将标记应用到资产。 在此之前,在Experience Manager中添加标记。 ACS AEM Tools Tag Maker (ACS工具标记生成器)功能允许您通过使用加载到系统中的Microsoft Excel电子表格填充标记。

收录资源

在将资产引入系统时,性能和稳定性是重要考虑事项。 在Experience Manager中加载大量数据时,确保系统运行良好。 这将添加数据所需的时间降至最低,并有助于避免系统过载。 这有助于防止系统崩溃,特别是在已在生产的系统中。

将资产加载到系统中有两种方法: 使用HTTP的基于推送的方法,或使用JCR API的基于拖曳的方法。

通过HTTP推送

Adobe的Managed Services团队使用一种名为Glutton的工具将数据加载到客户环境中。 Glutton是一个小型Java应用程序,它将所有资源从一个目录加载到AEM实例上的另一个目录中。 您还可以使用Perl脚本等工具将资源发布到存储库中,而不是使用Glutton。

使用通过https的方式有两个主要的缺点:

  1. 通过HTTP将资源传输到服务器。 这需要相当多的开销,并且非常耗时,从而延长了执行迁移所需的时间。
  2. 如果您具有必须应用于资产的标记和自定义元数据,则此方法需要另外一个自定义流程,您需要运行该流程才能在导入资产后将此元数据应用到资产。

获取资源的另一种方法是从本地文件系统中提取资源。 但是,如果无法将外部驱动器或网络共享装入服务器以执行基于拉式的方法,则通过HTTP发布资产是最佳选择。

从本地文件系统中提取

ACS AEM工具CSV资产导入程序 ,从文件系统中提取资产,从CSV文件中提取资产元数据以进行资产导入。 AEM Asset Manager API用于将资产导入系统并应用配置的元数据属性。 理想情况下,资产通过网络文件装载或通过外部驱动器装载到服务器上。

当资产不通过网络传输时,整体性能会大大提高。 此方法通常是将资产加载到存储库中的最有效方法。 此外,由于该工具支持元数据摄取,因此您只需一个步骤即可导入所有资产和元数据。 无需执行任何其他步骤来应用元数据,例如使用单独的工具。

处理演绎版

在将资产加载到系统后,您需要通过DAM更新资产工作流来处理这些资产,以提取元数据并生成演绎版。 在执行此步骤之前,您需要重复和修改DAM更新资产工作流以满足您的需求。 您可能不需要默认工作流中的某些步骤,如Scene7PTIFF生成或InDesign服务器集成。

根据需要配置工作流后,您有两个选项可执行该工作流:

  1. 最简单的方法是 ACS Commons的Bulk Workflow Manager。 此工具允许您执行查询并通过工作流处理查询结果。 还有设置批大小的选项。
  2. 您可以将 ACS Commons Fast Action Manager与Synthetic Workflows一起使。 虽然此方法涉及的范围更广,但它允许您在优化服务器资源的使用时删除AEM工作流引擎的开销。 此外,Fast Action manager还通过动态监视服务器资源和限制系统上的负载来进一步提升性能。 ACS Commons功能页上提供了示例脚本。

激活资产

对于具有发布层的部署,您需要将资产激活到发布场。 虽然Adobe建议运行多个发布实例,但最有效的方法是将所有资源复制到单个发布实例,然后克隆该实例。 在激活大量资产时,在触发树状激活后,您可能需要进行干预。 原因如下: 触发激活时,项目会添加到Sling作业/事件序列。 当此队列的大小开始超过约40,000个项目时,处理速度会显着降低。 当此队列的大小超过100,000项后,系统稳定性开始会受到影响。

要解决此问题,您可以使用快速操 作管理器 来管理资产复制。 这样,无需使用Sling队列,即可降低开销,同时还可以限制工作负载以防止服务器过载。 该功能的文档页面上显示了使用FAM管理复制的示例。

将资产转至发布场的其他选项包括使用 vlt-rcpoak-run,这些选项作为 Jackrabbit 中的工具提供。另一个选项的目的是对 AEM 基础结构使用一个名为 Grabbit 的开放源工具,该工具声称比 vlt 的性能更快。

对于任何这些方法,需要注意的是,作者实例上的资产未显示为已激活。 要使用正确的激活状态标记这些资产,您还需要运行一个脚本来将资产标记为已激活。

注意

Adobe不维护或支持Grabbit。

克隆发布

激活资产后,您可以克隆发布实例以创建部署所需的任意数量的副本。 克隆服务器相当简单,但需要记住一些重要步骤。 要克隆发布:

  1. 备份源实例和数据存储。
  2. 将实例和数据存储的备份还原到目标位置。 以下步骤均涉及此新实例。
  3. 在“”下执行文件系统 crx-quickstart/launchpad/felix 搜索 sling.id。 删除此文件。
  4. 在数据存储的根路径下,找到并删除任何 repository-XXX 文件。
  5. crx-quickstart/install/org.apache.jackrabbit.oak.plugins.blob.datastore.FileDataStore.configcrx-quickstart/launchpad/config/org/apache/jackrabbit/oak/plugins/blob/datastore/FileDataStore.config 并指向新环境上数据存储的位置。
  6. 开始环境。
  7. 更新作者上任何复制代理的配置以指向新实例上的正确发布实例或调度程序刷新代理,以指向新环境的正确调度程序。

启用工作流

完成迁移后,应重新启用DAM更新资产工作流的启动程序,以支持再现生成和元数据提取,以便持续使用日常系统。

跨AEM部署迁移资产

虽然这种情况并不常见,但有时您需要将大量数据从一个AEM实例迁移到另一个实例; 例如,执行AEM升级、升级硬件或迁移到新数据中心(如AMS迁移)时。

在这种情况下,您的资产已填充元数据,并且已生成演绎版。 您只需将精力集中在将资产从一个实例移动到另一个实例上。 在AEM实例之间迁移时,您需要执行以下步骤:

  1. 禁用工作流: 由于您正在迁移演绎版以及我们的资产,因此您希望禁用DAM更新资产的工作流启动器。

  2. 迁移标记: 由于已在源AEM实例中加载了标记,因此可以在内容包中构建标记并将该包安装到目标实例。

  3. 迁移资产: 建议使用两种工具将资产从一个AEM实例移动到另一个实例:

    • Vault Remote Copy,或 vlt rcp者,允许您通过网络使用vlt。 您可以指定源目录和目标目录,vlt从一个实例下载所有存储库数据并将其加载到另一个实例。 Vlt rcp在https://jackrabbit.apache.org/filevault/rcp.html上有 文档
    • Grabbit 是Time Warner Cable为AEM实现而开发的一款开源内容同步工具。 由于它使用连续的数据流,与vlt rcp相比,它具有更低的延迟,并声称速度比vlt rcp快2到10倍。 Grabbit还支持仅同步增量内容,这允许它在完成初始迁移通过后同步更改。
  4. 激活资产: 按照说明激活 记录到 AEM的资产。

  5. 克隆发布: 与新迁移一样,加载单个发布实例并克隆它比激活两个节点上的内容更有效。 请参 阅克隆发布。

  6. 启用工作流: 完成迁移后,请重新启用DAM更新资产工作流的启动程序,以支持再现生成和元数据提取,以便持续使用日常系统。

在此页面上