Gestión de repositorios de contenido grandes handling-large-content-repositories

Información general overview

Copiar muchos blobs con la herramienta de transferencia de contenido (CTT) puede tardar varios días.
Para acelerar las fases de extracción e ingesta de la actividad de transferencia de contenido y mover contenido a AEM as a Cloud Service, CTT puede usar AzCopy como un paso previo a la copia opcional. AEM Este paso previo a la copia se puede utilizar cuando la instancia de origen se configura para que utilice un almacén de datos de Amazon S3, Azure Blob Storage o un almacén de datos de archivo. El paso previo a la copia es más eficaz para la primera extracción e ingesta completas. Sin embargo, no se recomienda utilizar la copia previa para recargas posteriores (si el tamaño de la recarga es inferior a 200 GB), ya que puede añadir tiempo a todo el proceso. Una vez configurado este paso previo, en la fase de extracción, AzCopy copia blobs de Amazon S3, Azure Blob Storage o el almacén de datos de archivo al almacén de blobs del conjunto de migración. En la fase de ingesta, AzCopy copia los blobs del almacén de blobs del conjunto de migración al almacén de blobs de destino de AEM as a Cloud Service.

Consideraciones importantes antes de comenzar important-considerations

En la sección siguiente se comprenden las consideraciones importantes antes de comenzar:

  • A partir de la versión 2.0.16 de CTT, la configuración de precopia se realiza automáticamente cuando se instala el paquete. Además, si el tamaño del conjunto de migración es mayor de 200 GB, el proceso de extracción utiliza automáticamente la función de precopia. El archivo azcopy.config se crea en el directorio crx-quickstart/cloud-migration/. No es necesario que realice manualmente la configuración de precopia si utiliza la versión 2.0.16 o posterior de CTT.

  • La versión de Source AEM debe ser de 6.3 a 6.5.

  • El almacén de datos de Source AEM está configurado para utilizar Amazon S3 o Azure Blob Storage. AEM Para obtener más información, consulte Configuración de almacenes de nodos y almacenes de datos en el 6.

  • Cada conjunto de migración copia todo el almacén de datos, por lo que solo se debe utilizar un conjunto de migración único.

  • AEM Necesita acceso para instalar AzCopy en la instancia (o máquina virtual) que ejecuta la instancia de origen de la.

  • La recolección de elementos no utilizados del almacén de datos se ha ejecutado en los siete días anteriores en el origen. Para obtener más información, consulte Recopilación de residuos del almacén de datos.

AEM Consideraciones adicionales si la instancia de la fuente de datos está configurada para usar un almacén de datos de almacenamiento de Amazon S3 o Azure Blob additional-considerations-amazons3-azure

  • La transferencia de datos desde Amazon S3 y Azure Blob Storage conlleva un coste. AEM El coste de la transferencia es relativo a la cantidad total de datos en el contenedor de almacenamiento existente (independientemente de si se hace referencia en la lista de datos o no). Consulte Amazon S3 y Azure Blob Storage para obtener más información.

  • Necesita un par de clave de acceso y clave secreta para el bloque de Amazon S3 de origen existente o un URI SAS para el contenedor de almacenamiento de Azure Blob de origen existente (el acceso de solo lectura está bien).

AEM Consideraciones adicionales si la instancia de origen está configurada para utilizar el almacén de datos de archivo additional-considerations-aem-instance-filedatastore

  • El sistema local debe tener un espacio libre estrictamente superior a 1/256 del almacén de datos de origen. Por ejemplo, si el tamaño del almacén de datos es de 3 terabytes, debe existir espacio libre superior a 11,72 GB en la carpeta crx-quickstart/cloud-migration del origen para que funcione AzCopy. Como mínimo, el sistema de origen debe tener 1 GB de espacio libre. Se puede obtener espacio libre utilizando el comando df -h en instancias de Linux® y el comando dir en instancias de Windows.

  • Cada vez que se ejecuta la extracción con AzCopy habilitado, todo el almacén de datos de archivos se aplana y se copia en el contenedor de migración de la nube. Si el conjunto de migración es menor que el tamaño del almacén de datos, la extracción de AzCopy no es el enfoque óptimo.

  • Una vez que AzCopy se haya utilizado para copiar sobre el almacén de datos existente, deshabilite para extracciones delta o de recarga.

Configuración para utilizar AzCopy como paso previo a la copia setting-up-pre-copy-step

NOTE
A partir de la versión 2.0.16 de CTT, la configuración de precopia se realiza automáticamente cuando se instala el paquete. Además, si el tamaño del conjunto de migración es mayor de 200 GB, el proceso de extracción utiliza automáticamente la función de precopia. El archivo azcopy.config se crea en el directorio crx-quickstart/cloud-migration/. Si desea actualizar la configuración del archivo manualmente, revise las secciones a continuación.

Siga esta sección para aprender a configurar para utilizar AzCopy como paso previo a la copia con la herramienta de transferencia de contenido para migrar el contenido a AEM as a Cloud Service:

0. Determinar el tamaño total de todo el contenido del almacén de datos determine-total-size

Es importante determinar el tamaño total del almacén de datos por dos motivos:

  • AEM Si la fuente de datos está configurada para utilizar el almacén de datos de archivo, el sistema local debe tener un espacio libre estrictamente superior al tamaño 1/256 del almacén de datos de origen.

Almacén de datos de almacenamiento de Azure Blob azure-blob-storage

Desde la página de propiedades de contenedor existente en el portal de Azure, utilice el botón Calcular tamaño para determinar el tamaño de todo el contenido del contenedor. Por ejemplo:

imagen

Almacén de datos de Amazon S3 amazon-data

Puede utilizar la pestaña Métricas del contenedor para determinar el tamaño de todo el contenido del contenedor. Por ejemplo:

imagen

Almacén de datos de archivo file-data-store-determine-size

  • En sistemas Mac y UNIX®, ejecute el comando du en el directorio del almacén de datos para obtener su tamaño:
    du -sh [path to datastore on the instance]. Por ejemplo, si el almacén de datos está en /mnt/author/crx-quickstart/repository/datastore, el siguiente comando le dará su tamaño: du -sh /mnt/author/crx-quickstart/repository/datastore.

  • Para Windows, utilice el comando dir del directorio del almacén de datos para obtener su tamaño:
    dir /a/s [location of datastore].

1. Instalar AzCopy install-azcopy

AzCopy es una herramienta de línea de comandos proporcionada por Microsoft® que debe estar disponible en la instancia de origen para habilitar esta característica.

En resumen, desea descargar el binario Linux® x86-64 desde la página de documentos de AzCopy y descomprimirlo en una ubicación como /usr/bin.

IMPORTANT
Anote dónde colocó el binario, ya que necesita la ruta completa para acceder a él en un paso posterior.

2. Instale la versión de la herramienta de transferencia de contenido (CTT) con compatibilidad con AzCopy install-ctt-azcopy-support

IMPORTANT
Debe usarse la versión más reciente de CTT.

La compatibilidad con AzCopy para Amazon S3, Azure Blob Storage y File Data Store se incluye en la última versión de CTT.
Puede descargar la última versión de CTT desde el portal Distribución de software.
Debe tenerse en cuenta que solo se admiten las versiones 2.0.0 y posteriores, y es aconsejable utilizar la versión más reciente.

3. Configurar un archivo azcopy.config configure-azcopy-config-file

AEM En la instancia de origen de la, en crx-quickstart/cloud-migration, cree un archivo denominado azcopy.config.

NOTE
AEM El contenido de este archivo de configuración es diferente en función de si la instancia de origen de la aplicación utiliza un almacén de datos de Azure o Amazon S3 o un almacén de datos de archivo.

Almacén de datos de almacenamiento de Azure Blob azure-blob-storage-data

El archivo azcopy.config debe incluir las siguientes propiedades (asegúrese de utilizar azCopyPath y azureSas correctos para su instancia).

NOTE
Si no desea conceder acceso de escritura al contenedor de almacenamiento del blob existente, puede generar un nuevo URI de SAS que solo tenga permisos de lectura y lista.
azCopyPath=/usr/bin/azcopy
azureSas=https://example-resource.blob.core.windows.net/example-container?sig=--REDACTED--

Almacén de datos de Amazon S3 amazon-sdata-store

El archivo azcopy.config debe incluir las siguientes propiedades (asegúrese de utilizar los valores correctos para su instancia).

NOTE
AEM Si la instancia utiliza los roles de IAM para permitir a los usuarios acceder a S3, debe crear una directiva y un usuario con las acciones ListBucket y GetObject habilitadas para el bloque S3. Una vez configurada, utilice la clave de acceso y la clave secreta de este usuario.
azCopyPath=/usr/bin/azcopy
s3Bucket=aem-63
s3Region=us-west-2
s3AccessKey=--REDACTED--
s3SecretKey=--REDACTED--

Almacén de datos de archivo file-data-store-azcopy-config

El archivo azcopy.config debe contener la propiedad azCopyPath y una propiedad repository.home opcional que señale a la ubicación del almacén de datos del archivo. Utilice los valores correctos para su instancia.
Almacén de datos de archivo

azCopyPath=/usr/bin/azcopy
repository.home=/mnt/crx/author/crx-quickstart/repository/datastore

AEM La propiedad azCopyPath debe contener la ruta de acceso completa de la ubicación en la que está instalada la herramienta de línea de comandos azCopy en la instancia de origen de la instancia de la. Si falta la propiedad azCopyPath, no se realiza el paso de precopia del blob.

Si falta la propiedad repository.home en azcopy.config, se usa la ubicación predeterminada del almacén de datos /mnt/crx/author/crx-quickstart/repository/datastore para realizar la precopia.

4. Extracción con AzCopy extracting-azcopy

Con el archivo de configuración anterior en su lugar, la fase de precopia de AzCopy se ejecuta como parte de cada extracción posterior. Para evitar que se ejecute, puede cambiar el nombre de este archivo o quitarlo.

NOTE
Si AzCopy no está configurado correctamente, verá el siguiente mensaje en los registros:
INFO c.a.g.s.m.c.a.AzCopyCloudBlobPreCopy - Blob pre-copy is not supported.
  1. Inicie una extracción desde la interfaz de usuario de CTT. Consulte Introducción a la herramienta de transferencia de contenido y el proceso de extracción para obtener más información.

  2. Confirme que la línea siguiente está impresa en el registro de extracción:

c.a.g.s.m.commons.ContentExtractor - *************** Beginning AzCopy Pre-Copy phase ***************

Enhorabuena. Esta entrada de registro significa que la configuración se consideró válida y que AzCopy está copiando todos los blobs del contenedor de origen al contenedor de migración.

Las entradas de registro de AzCopy aparecen en el registro de extracción y llevan el prefijo c.a.g.s.m.c.azcopy.AzCopyBlobPreCopy - [Copia previa de AzCopy]

CAUTION
Durante los primeros minutos de una extracción, observe atentamente los registros de extracción para detectar cualquier signo de problema. Por ejemplo, esto es lo que se registraría si no se encontrara el contenedor de origen de Azure:
[AzCopy pre-copy] failed to perform copy command due to error: cannot start job due to error: cannot list files due to reason > github.com/Azure/azure-storage-blob-go/azblob.newStorageError, github.com/Azure/azure-storage-blob-go@v0.10.1-0.20210407023846-16cf969ec1c3/azblob/zc_storage_error.go:42
[AzCopy pre-copy] ===== RESPONSE ERROR (ServiceCode=ContainerNotFound) =====
[AzCopy pre-copy] Description=The specified container does not exist.
[AzCopy pre-copy] RequestId:5fb674b9-201e-001b-2a5b-527400000000
[AzCopy pre-copy] Time:2021-05-26T18:18:07.5931967Z, Details:
[AzCopy pre-copy] Code: ContainerNotFound

Si hay un problema con AzCopy, la extracción falla inmediatamente y los registros de extracción contienen detalles sobre el error.

AzCopy omite automáticamente los blobs copiados antes del error en ejecuciones posteriores y no es necesario copiarlos de nuevo.

TIP
Ahora se puede programar una ingesta para que se inicie automáticamente inmediatamente después de que una extracción se realice correctamente. Consulte Ingesta de contenido en Target para obtener más información.

Para el almacén de datos de archivos file-data-store-extract

Cuando se ejecuta AzCopy para el almacén de datos del archivo de origen, debe ver mensajes como estos en los registros que indican que se están procesando las carpetas:
c.a.g.s.m.c.a.AzCopyFileSourceBlobPreCopy - [AzCopy pre-copy] Processing folder (1/24) crx-quickstart/repository/datastore/5d

5. Ingesta con AzCopy ingesting-azcopy

Consulte Ingesta de contenido en Target para obtener información general sobre la ingesta de contenido en el destino desde Cloud Acceleration Manager (CAM), incluidas instrucciones sobre cómo usar AzCopy (copia previa) o no en el cuadro de diálogo "Nueva ingesta".

Para aprovechar AzCopy durante la ingesta, el Adobe requiere que esté en una versión de AEM as a Cloud Service que sea al menos la 2021.6.5561.

Consulte la lista "Trabajos de ingesta" en Cloud Acceleration Manager y los registros de ingesta para poder ver el progreso. Las entradas de registro relacionadas con la variable
Las tareas de AzCopy correctas aparecen de la siguiente manera (lo que permite algunas diferencias). Comprobar los registros ocasionalmente podría alertarle sobre problemas
al principio, y le ayudará a encontrar una solución rápida a cualquier problema.

*************** Beginning AzCopy pre-copy phase ***************
INFO: Scanning...
INFO: Failed to create one or more destination container(s). Your transfers may still succeed if the container already exists.
INFO: Any empty folders will not be processed, because source and/or destination does not have full folder support
INFO: azcopy: A newer version 10.11.0 is available to download

Job 419d98da-fc05-2a45-70cc-797fee632031 has started
Log file is located at: /root/.azcopy/419d98da-fc05-2a45-70cc-797fee632031.log

0.0 %, 0 Done, 0 Failed, 886 Pending, 0 Skipped, 886 Total,

Job 419d98da-fc05-2a45-70cc-797fee632031 summary
Elapsed Time (Minutes): 0.0334
Number of File Transfers: 886
Number of Folder Property Transfers: 0
Total Number of Transfers: 886
Number of Transfers Completed: 17
Number of Transfers Failed: 0
Number of Transfers Skipped: 869
TotalBytesTransferred: 248350
Final Job Status: CompletedWithSkipped

*************** Completed AzCopy pre-copy phase ***************

Siguientes pasos whats-next

Ya ha aprendido a gestionar repositorios de contenido grandes para acelerar las fases de extracción e ingesta de la actividad de transferencia de contenido y mover contenido a AEM as a Cloud Service. Ya está listo para aprender el proceso de extracción con la herramienta de transferencia de contenido. Consulte Extracción de contenido de Source en la herramienta de transferencia de contenido para que pueda aprender a extraer el conjunto de migración de la herramienta de transferencia de contenido.

recommendation-more-help
fbcff2a9-b6fe-4574-b04a-21e75df764ab