La transcription est le processus de traduction de l’audio d’un fichier audio ou vidéo en texte (voix vers texte) à l’aide de la technologie de reconnaissance vocale.
Adobe Experience Manager Assets est configuré avec les Azure Media Services qui génèrent automatiquement une transcription textuelle de la langue parlée dans un fichier audio ou vidéo pris en charge au format WebVTT (.vtt). Lorsqu’une ressource audio ou vidéo est traitée dans Experience Manager Assets, le service de transcription génère automatiquement le rendu de transcription texte de la ressource audio ou vidéo et le stocke au même emplacement que la ressource d’origine dans votre référentiel de ressources. Le service de transcription d’Experience Manager Assets permet aux marketeurs de gérer efficacement leur contenu audio et vidéo en permettant de trouver plus facilement le contenu texte et en augmentant le retour sur investissement de ces ressources par la prise en charge de l’accessibilité et de la localisation.
Les transcriptions sont des versions textuelles du contenu parlé ; par exemple, un film que vous visionnez sur n’importe quelle plateforme OTT comprend souvent des sous-titres pour faciliter son accessibilité ou pour utiliser le contenu dans d’autres langues. Ou encore, tout fichier audio ou vidéo utilisé à des fins de marketing, d’apprentissage ou de divertissement. Ces expériences commencent par une transcription qui est ensuite formatée ou traduite selon les besoins. La transcription audio ou vidéo est un processus long et susceptibles de contenir des erreurs lorsqu’elle est exécutée manuellement. Il est également difficile d’adapter manuellement le processus à grande échelle, compte tenu de la demande croissante de contenu audio-vidéo. Experience Manager Assets utilise la transcription basée sur l’IA d’Azure qui permet un traitement à grande échelle des ressources audio et vidéo et génère les transcriptions textuelles (fichiers .vtt) avec les détails de l’horodatage. Tout comme dans Assets, la fonctionnalité de transcription est prise en charge avec Dynamic Media.
La fonction de transcription est disponible sans coût supplémentaire dans Experience Manager Assets. Toutefois, les administrateurs ont besoin des informations d’identification Azure de l’utilisateur pour configurer le service de transcription dans Experience Manager Assets. Vous pouvez également obtenir les informations d’identification d’évaluation directement depuis Microsoft® pour découvrir la fonctionnalité de transcription audio ou vidéo dans Assets.
Une instance Experience Manager Assets as a Cloud Service opérationnelle.
Les informations d’identification Azure suivantes sont nécessaires pour la configuration dans Experience Manager Assets :
Consultez la Documentation Azure pour obtenir des informations d’identification pour accéder à l’API Azure Media Services.
Assurez-vous que le compte Azure dispose d’un crédit suffisant pour traiter les nouvelles demandes.
Voici les configurations requises pour activer la fonction de transcription dans Experience Manager Assets :
Experience Manager Assets utilise les Azure Media Services qui génèrent automatiquement des transcriptions textuelles de la langue parlée dans une fichier audio ou vidéo pris en charge au format WebVTT (.vtt). Les administrateurs peuvent configurer les Azure Media Services dans Experience Manager Assets à l’aide des informations d’identification Azure. La liste des conditions préalables à la transcription répertorie les informations d’identification Azure requises pour la configuration. Si vous ne disposez pas d’un compte et d’informations d’identification Azure, consultez la Documentation d’Azure Media Services pour obtenir des informations d’identification d’évaluation.
Accédez à Outils > Cloud Services > Configuration d’Azure Media Services. Sélectionnez un dossier (emplacement) dans le rail de gauche, puis cliquez sur le bouton Créer pour configurer la connexion à votre compte Azure. Ce dossier correspond à l’emplacement où votre configuration cloud Azure est stockée dans Experience Manager Assets. Saisissez les informations d’identification Azure et cliquez sur Enregistrer et fermer.
Une fois que les Azure Media Services sont configurés dans Experience Manager Assets, l’étape suivante consiste à créer un profil de traitement des ressources pour générer une transcription basée sur l’IA des ressources audio et vidéo. Le profil de traitement basé sur l’IA génère des transcriptions de la ressource audio ou vidéo prise en charge comme rendu dans Experience Manager Assets et stocke la transcription (fichier .vtt) dans le même dossier que celui où réside la ressource d’origine. Il est donc plus facile pour les utilisateurs de rechercher et de localiser la ressource et son rendu de transcription.
Accédez à Outils > Ressources > Profils de traitement et cliquez sur le bouton Créer pour créer un profil de traitement basé sur l’IA afin de générer la transcription de vos fichiers audio et vidéo. Par défaut, la page du profil de traitement ne reflète que trois onglets (Image, Vidéo et Personnalisé). Cependant, un onglet IA dédiée au contenu est visible si vous avez configuré les Azure Media Services dans votre instance Experience Manager Assets. Vérifiez vos informations d’identification Azure si vous ne voyez pas l’onglet IA dédiée au contenu lors de la création d’un profil de traitement.
Dans l’onglet IA dédiée au contenu, cliquez sur le bouton Ajouter pour configurer la transcription. Ici, vous pouvez inclure et exclure les formats de fichiers (types MIME) pour la génération des transcriptions en sélectionnant les types de fichiers dans la liste déroulante. Dans l’illustration suivante, tous les fichiers audio et vidéo pris en charge sont inclus et les fichiers texte sont exclus.
Activez le bouton (bascule) Créer une transcription VTT dans le même répertoire pour créer et stocker le rendu de transcription (fichier .vtt) dans le même dossier que la ressource d’origine. Les autres rendus sont également générés par le workflow de traitement des ressources de la gestion des actifs numériques par défaut, quel que soit ce paramètre.
L’illustration suivante présente un profil vidéo personnalisé créé dans Experience Manager Assets.
Le profil vidéo contient également les configurations personnalisées suivantes. Consultez la documentation du profil de traitement pour plus d’informations sur la création d’un profil de traitement personnalisé.
Nous allons maintenant configurer la transcription dans ce profil vidéo. Accédez à l’onglet IA dédiée au contenu et cliquez sur le bouton Ajouter. Incluez tous les fichiers audio et vidéo et excluez les fichiers image et application. Activez le bouton (bascule) Créer une transcription VTT dans le même répertoire et enregistrez la configuration.
Une fois le profil de traitement configuré pour la transcription des fichiers audio et vidéo, vous pouvez appliquer ce profil de traitement aux dossiers à l’aide de l’une des méthodes suivantes :
Sélectionnez une définition de profil de traitement dans Outils > Ressources > Profils de traitement et utilisez l’action Appliquer le profil au(x) dossier(s). L’explorateur de contenu vous permet d’accéder à un dossier spécifique, de sélectionner un dossier et de confirmer l’application du profil.
Sélectionnez un dossier dans l’interface utilisateur d’Assets, puis cliquez sur Propriétés pour ouvrir les propriétés du dossier. Cliquez sur l’onglet Traitement des ressources et sélectionnez le profil de traitement approprié pour le dossier dans la liste Profil de traitement. Pour enregistrer les modifications, cliquez sur Enregistrer et fermer.
Les utilisateurs peuvent sélectionner des dossiers ou des ressources spécifiques dans l’interface utilisateur d’Assets pour appliquer un profil de traitement, puis sélectionner l’option Retraiter les ressources dans les options disponibles dans la partie supérieure.
Un seul profil de traitement peut être appliqué à un dossier.
Une fois qu’un profil de traitement a été appliqué à un dossier, toutes les nouvelles ressources chargées (ou mises à jour) dans ce dossier ou dans l’un de ses sous-dossiers sont traitées à l’aide du profil de traitement supplémentaire configuré. Ce dernier s’ajoute au profil par défaut standard.
Un profil de traitement appliqué à un dossier fonctionne pour l’ensemble de l’arborescence. Il peut cependant être remplacé par un autre qui est appliqué à un sous-dossier.
Lorsque des ressources sont chargées dans un dossier, Experience Manager communique avec les propriétés du dossier conteneur pour identifier le profil de traitement. Si aucun dossier parent n’est appliqué, un dossier parent dans la hiérarchie est vérifié pour appliquer un profil de traitement.
Lors du traitement d’une ressource vidéo, le Profil de traitement basé sur l’IA génère automatiquement la transcription (fichier .vtt) en tant que rendu avec la ressource d’origine dans le même dossier.
Vous pouvez également afficher le rendu de transcription en accédant aux Rendus de la ressource vidéo d’origine. Pour accéder au panneau Rendus, sélectionnez la ressource vidéo d’origine, puis ouvrez le rail de gauche. Vous pouvez constater que le rendu de transcription (fichier .vtt) est visible sous le titre TRANSCRIPTVTT.
Vous pouvez télécharger la transcription (fichier texte .vtt) directement à partir du dossier sous la forme d’un rendu de ressource distinct ou à partir du panneau Rendus de la ressource d’origine en téléchargeant tous les rendus de la ressource.
Actuellement, Experience Manager ne prend pas en charge l’aperçu de texte intégral ou la modification native des fichiers VTT. Vous pouvez toutefois télécharger le rendu de transcription et utiliser n’importe quel éditeur de texte pour modifier ou vérifier la transcription. La transcription reflète la langue parlée sous forme de texte selon l’horodatage donné dans la vidéo avec le degré de confiance (précision) de la transcription.
Si vous avez configuré Dynamic Media dans votre instance Experience Manager Assets, vous pouvez publier la ressource (fichier audio ou vidéo) et sa transcription (fichier .vtt) dans Dynamic Media. Ce faisant, la ressource d’origine (fichier audio ou vidéo) et son rendu transcrit (fichier .vtt) sont publiés sur Dynamic Media dans le même dossier. L’administrateur Dynamic Media peut activer l’expérience de sous-titrage codé CC pour le fichier audio ou vidéo utilisant le rendu de transcription (fichier .vtt).
Voir également :
Dans l’illustration suivante, l’URL reflète la partie des sous-titres qui fait référence à la transcription (fichier .vtt). La vidéo reflète la langue parlée (texte transcrit) en tant que Sous-titrage codé selon l’horodatage donné dans la vidéo. L’utilisateur peut activer ou désactiver les sous-titres à l’aide du bouton CC.
Les formats de fichiers audio et vidéo suivants sont pris en charge pour la transcription :
Formats audio/vidéo pris en charge | Extensions |
---|---|
FLV (avec les codecs H.264 et AAC) | (.flv) |
MXF | (.mxf) |
MPEG2-PS, MPEG2-TS, 3GP | (.ts, .ps, .3gp, .3gpp, .mpg) |
Windows Media Video (WMV)/ASF | (.wmv, .asf) |
AVI (8 bits/10 bits non compressés) | (.avi) |
MP4 | (.mp4, .m4a, .m4v) |
Microsoft® Digital Video Recording (DVR-MS) | (.dvr-ms) |
Matroska/WebM | (.mkv) |
WAVE/WAV | (.wav) |
QuickTime | (.mov) |
Les ressources (fichiers audio ou vidéo) de type application ne sont pas prises en charge pour la transcription.
Connectez-vous à votre compte Azure Media Services avec les mêmes informations d’identification (que vous avez utilisées pour la configuration) pour vérifier le statut de la requête. Contactez l’assistance Azure si votre demande n’est pas traitée correctement.
Voir également