如何批量迁移资产 assets-migration-guide

将资产迁移到Adobe Experience Manager时,需要考虑以下几个步骤。 从当前主目录中提取资源和元数据超出了此文档的范围,因为不同实施之间的资产和元数据差异很大,但本文档介绍了如何将这些资产引入Experience Manager、应用其元数据、生成演绎版并将它们激活以发布实例。

先决条件 prerequisites

在实际执行此方法中的任何步骤之前,请查看并实施Assets性能优化提示中的指导。 通过配置最大并发作业等许多步骤,可以大大提高服务器在负载下的稳定性和性能。 加载系统资产后,其他步骤(如配置文件数据存储)的执行难度会大得多。

NOTE
以下资源迁移工具不是Experience Manager的一部分,且Adobe不支持这些工具:
  • ACS AEM工具标记生成器
  • ACS AEM工具CSV资产导入程序
  • ACS Commons批量工作流管理器
  • ACS Commons快速操作管理器
  • 合成工作流
本软件是开放源软件,受 Apache v2 许可证的保护。要提出问题或报告问题,请访问针对 ACS AEM 工具的 GitHub 问题ACS AEM Commons

迁移到Experience Manager migrating-to-aem

将资产迁移到Experience Manager需要多个步骤,应按分阶段过程查看。 迁移的阶段如下:

  1. 禁用工作流。
  2. 加载标记。
  3. 引入资产。
  4. 处理演绎版。
  5. 激活资产。
  6. 启用工作流。

chlimage_1-223

禁用工作流 disabling-workflows

在开始迁移之前,请为DAM更新资产工作流禁用启动器。 最好将所有资产摄取到系统中,然后批量运行工作流。 如果您已在迁移过程中处于活动状态,则可以安排这些活动在休息时间运行。

加载标记 loading-tags

您可能已经有一个要应用于图像的标记分类。 虽然CSV资产导入器等工具和对元数据配置文件的Experience Manager支持可以自动执行将标记应用于资产的过程,但需要将标记加载到系统中。 ACS AEM Tools Tag Maker功能允许您使用加载到系统中的某个Microsoft Excel电子表格填充标记。

引入资产 ingesting-assets

在将资产引入系统时,性能和稳定性是重要考虑事项。 由于您要将大量数据加载到系统中,因此希望确保系统工作正常,以最大程度地减少所需的时间并避免系统过载,这可能会导致系统崩溃,特别是在已经处于生产状态的系统中。

有两种将资产加载到系统中的方法:使用HTTP的基于推送的方法或使用JCR API的基于拉取的方法。

通过HTTP发送 pushing-through-http

Adobe的Managed Services团队使用名为Glutton的工具将数据加载到客户环境中。 Glutton是一个小型Java应用程序,它将所有资产从一个目录加载到Experience Manager部署上的另一个目录中。 您还可以使用Perl脚本等工具将资产发布到存储库中,而不是Glutton。

使用https推送方法有两个主要缺点:

  1. 资产需要通过HTTP传输到服务器。 这需要相当多的开销并非常耗时,因此会延长执行迁移所需的时间。
  2. 如果您必须将标记和自定义元数据应用于资源,则此方法需要运行另一个自定义流程,在导入资源后,您需要运行该流程才能将此元数据应用于资源。

摄取资产的另一种方法是从本地文件系统提取资产。 但是,如果不能将外部驱动器或网络共享装载到服务器以执行基于拉取的方法,则通过HTTP发布资源是最佳选择。

从本地文件系统获取 pulling-from-the-local-filesystem

ACS AEM工具CSV资产导入器从文件系统中提取资产,并从CSV文件提取资产元数据用于资产导入。 Experience Manager资源管理器API用于将资源导入系统,并应用配置的元数据属性。 理想情况下,资产可通过网络文件装载或外部驱动器装载到服务器上。

由于资产不需要通过网络传输,因此整体性能会显着提升,通常认为此方法是将资产加载到存储库的最有效方法。 此外,由于该工具支持元数据摄取,因此您可以在单个步骤中导入所有资源和元数据,而不是同时创建第二个步骤来通过单独的工具应用元数据。

流程演绎版 processing-renditions

将资产加载到系统后,您需要通过DAM更新资产工作流处理这些资产,以提取元数据并生成演绎版。 在执行此步骤之前,您需要复制和修改DAM更新资产工作流以满足您的需求。 现成的工作流包含许多您可能不需要执行的步骤,例如Dynamic Media PTIFF生成或InDesign Server集成。

根据需要配置工作流后,有两个选项可用于执行工作流:

  1. 最简单的方法是ACS Commons的批量工作流管理器。 使用此工具,您可以执行查询,并通过工作流处理查询的结果。 也可以选择设置批次大小。
  2. 您可以将 ACS Commons Fast Action Manager与Synthetic Workflows一起使🔗。 虽然此方法涉及的范围更广,但它允许您在优化服务器资源的使用时删除Experience Manager工作流引擎的开销。 此外,Fast Action manager还通过动态监视服务器资源和限制系统上的负载来进一步提升性能。 ACS Commons功能页上提供了示例脚本。

激活资产 activating-assets

对于具有发布层的部署,您需要将资产激活到发布场。 虽然Adobe建议运行多个发布实例,但最有效的方法是将所有资源复制到单个发布实例,然后克隆该实例。 在激活大量资产时,触发树激活后,您可能需要介入。 原因如下:触发激活时,项目将添加到Sling作业/事件队列。 在此队列的大小开始超过约40,000个项目后,处理速度会显着减慢。 当此队列的大小超过100,000个项目后,系统稳定性开始受到影响。

要解决此问题,您可以使用快速操作管理器管理资源复制。 此操作无需使用Sling队列,从而降低了开销,同时抑制了工作负载以防止服务器过载。 该功能的文档页面上显示了使用FAM管理复制的示例。

将资产转至发布场的其他选项包括使用 vlt-rcpoak-run,这些选项作为 Jackrabbit 中的工具提供。另一个选项是为名为Grabbit的Experience Manager基础结构使用开源工具,该工具声称比vlt的性能更快。

对于这些方法中的任一方法,需要注意的是,创作实例上的资产不会显示为已激活。 若要以正确的激活状态处理标记这些资产的问题,您还需要运行脚本以将资产标记为已激活。

NOTE
Adobe不维护或支持Grabbit。

克隆Publish cloning-publish

激活资产后,您可以克隆发布实例以创建部署所需的任意数量的副本。 克隆服务器相当简单,但需要记住一些重要步骤。 要克隆发布,请执行以下操作:

  1. 备份源实例和数据存储。
  2. 将实例和数据存储的备份还原到目标位置。 以下步骤均引用此新实例。
  3. crx-quickstart/launchpad/felix下执行sling.id的文件系统搜索。 删除此文件。
  4. 在数据存储的根路径下,查找并删除任何repository-XXX文件。
  5. 编辑crx-quickstart/install/org.apache.jackrabbit.oak.plugins.blob.datastore.FileDataStore.configcrx-quickstart/launchpad/config/org/apache/jackrabbit/oak/plugins/blob/datastore/FileDataStore.config以指向新环境中数据存储的位置。
  6. 启动环境。
  7. 更新作者上任何复制代理的配置以指向正确的发布实例,或更新新实例上的Dispatcher刷新代理以指向新环境的正确Dispatcher。

启用工作流 enabling-workflows

完成迁移后,应重新启用DAM更新资产工作流的启动器,以支持生成演绎版和提取元数据以供日常系统使用。

跨Experience Manager部署迁移 migrating-between-aem-instances

虽然并非如此常见,但有时您需要将大量数据从一个Experience Manager部署迁移到另一个部署;例如,当您执行Experience Manager升级时,请升级您的硬件,或迁移到新数据中心,例如使用AMS迁移。

在这种情况下,您的资源已填充元数据,并且已生成演绎版。 您只需关注将资产从一个实例移动到另一个实例即可。 在Experience Manager部署之间迁移时,请执行以下步骤:

  1. 禁用工作流:由于您正在随我们的资产迁移演绎版,因此希望为DAM更新资产工作流禁用工作流启动器。

  2. 迁移标记:由于源Experience Manager部署中已加载标记,因此您可以在内容包中生成这些标记并在目标实例上安装该包。

  3. 迁移资产:建议使用两种工具将资产从一个Experience Manager部署移动到另一个部署:

    • Vault远程副本 ​或vlt rcp允许您通过网络使用vlt。 您可以指定源目录和目标目录,vlt将从一个实例下载所有资料档案库数据,然后将其加载到另一个实例中。 Vlt rcp记录在https://jackrabbit.apache.org/filevault/rcp.html
    • Grabbit ​是由Time Warner Cable为其Experience Manager实现开发的开源内容同步工具。 由于它使用连续的数据流,与vlt rcp相比,它的延迟更小,速度比vlt rcp快2到10倍。 Grabbit还仅支持增量内容的同步,这允许它在完成初始迁移阶段后同步更改。
  4. 激活资产:按照为初始迁移到Experience Manager而记录的激活资产的说明进行操作。

  5. 克隆发布:与新迁移一样,加载单个发布实例并进行克隆比在两个节点上激活内容更有效。 请参阅克隆Publish。

  6. 启用工作流:完成迁移后,为DAM更新资产工作流重新启用启动器,以支持生成演绎版和提取元数据以供日常系统使用。

recommendation-more-help
19ffd973-7af2-44d0-84b5-d547b0dffee2