Konfigurieren der Transkription in Experience Manager Assets configure-transcription-service
Transkription ist der Prozess der Übersetzung des Audioinhalts aus einer Audio- oder Videodatei in Text (Sprache in Text) mithilfe der Spracherkennungstechnologie.
Adobe Experience Manager Assets wurde mit Azure Media Services konfiguriert, wodurch automatisch ein Texttranskript der gesprochenen Sprache in einer unterstützten Audio- oder Videodatei im WebVTT-Format (.vtt) generiert wird. Wenn ein Audio- oder Video-Asset in Experience Manager Assets verarbeitet wird, generiert der Transkriptions-Service automatisch die Texttranskript-Ausgabedarstellung des Audio- oder Video-Assets und speichert sie an demselben Speicherort in Ihrem Assets-Repository, in dem sich das Original-Asset befindet. Der Transkriptions-Service von Experience Manager Assets ermöglicht Marketing-Fachleuten die effektive Verwaltung ihrer Audio- und Videoinhalte mit zusätzlicher Auffindbarkeit des Textinhalts und die Steigerung des ROI dieser Assets durch Unterstützung von Barrierefreiheit und Lokalisierung.
Transkripte sind Textversionen gesprochener Inhalte. Ein Beispiel ist ein Film, den Sie auf einer OTT-Plattform ansehen, der an vielen Stellen Untertitel enthält, um die Barrierefreiheit zu verbessern oder den Inhalt in anderen Sprachen zu zeigen. Oder eine Audio- oder Videodatei, die für Marketing-, Lern- oder Unterhaltungszwecke verwendet wird. Diese Erlebnisse beginnen mit einer Transkription, die dann entsprechend formatiert oder übersetzt wird. Das Transskribieren von Audio oder Video ist bei manueller Ausführung zeitintensiv und fehleranfällig. Angesichts des immer größeren Bedarfs an Audio-Video-Inhalten ist es auch eine Herausforderung, den manuellen Prozess zu skalieren. Experience Manager Assets verwendet die KI-basierte Transkription von Azure, die eine groß angelegte Verarbeitung der Audio- und Video-Assets ermöglicht und die Text-Transkripte (.vtt-Dateien) zusammen mit den Zeitstempeldetails erzeugt. Neben Assets wird die Transkriptionsfunktion auch in Dynamic Media unterstützt.
Die Transkriptionsfunktion ist in Experience Manager Assets kostenlos verfügbar. Die Admins benötigen jedoch die Azure-Anmeldeinformationen der Benutzenden, um den Transkriptions-Service in Experience Manager Assets zu konfigurieren. Sie können die Testanmeldedaten auch direkt von Microsoft® erhalten, um die Audio- oder Videotranskriptionsfunktion in Assets auszuprobieren.
Voraussetzungen für die Transkription prerequisites
-
Eine Experience Manager Assets as a Cloud Service-Instanz, die ausgeführt wird.
-
Die folgenden Azure-Anmeldedaten sind für die Konfiguration in Experience Manager Assets erforderlich:
- Client-ID (API-Schlüssel)
- Client-Geheimnis-Schlüssel
- Mandanten-Endpunkt (Domain)
- Medienkonto
- Ressourcengruppe
- Abonnement-ID
Siehe Azure-Dokumentation, um Anmeldedaten für den Zugriff auf die Azure Media Services-API zu erhalten.
-
Stellen Sie sicher, dass das Azure-Konto über ein ausreichendes Guthaben für die Verarbeitung neuer Anfragen verfügt.
Konfigurieren der Transkription in Experience Manager Assets configure-transcription
Die folgenden Konfigurationen sind erforderlich, um die Transkriptionsfunktion in Experience Manager Assets zu aktivieren:
Konfigurieren von Azure Media Services configure-azure-media-services
Experience Manager Assets verwendet die Azure Media Services, wodurch automatisch Texttranskripte der gesprochenen Sprache in einer unterstützten Audio- oder Videodatei im WebVTT-Format (.vtt) erzeugt werden. Administratoren können Azure Media Services in Experience Manager Assets mit den Azure-Anmeldedaten konfigurieren. In Voraussetzungen für die Transkription werden die Azure-Anmeldedaten, die für die Konfiguration erforderlich sind, aufgeführt. Wenn Sie kein Azure-Konto und -Anmeldedaten haben, siehe Dokumentation zu Azure Media Services, um Testanmeldedaten zu erhalten.
Gehen Sie zu Tools > Cloud Services > Azure Media Services-Konfiguration. Wählen Sie in der linken Leiste einen Ordner (Speicherort) aus und klicken Sie zum Konfigurieren der Verbindung mit dem Azure-Konto auf die Schaltfläche Erstellen. Dieser Ordner ist der Speicherort, an dem Ihre Azure Cloud-Konfiguration in Experience Manager Assets gespeichert wird. Geben Sie die Azure Anmeldedaten ein und klicken Sie auf Speichern und schließen.
Konfigurieren des Verarbeitungsprofils für die Transkription configure-processing-profile
Sobald die Azure Media Services in Experience Manager Assets konfiguriert sind, besteht der nächste Schritt darin, ein Asset-Verarbeitungsprofil zu erstellen, um eine KI-basierte Transkription der Audio- und Video-Assets zu erzeugen. Das KI-basierte Verarbeitungsprofil erzeugt Transkripte der unterstützten Audio- oder Video-Assets als Ausgabedarstellung in Experience Manager Assets und speichert das Transkript (.vtt-Datei) in demselben Ordner, in dem sich das Original-Asset befindet. Somit ist es für die Benutzerinnen und Benutzer einfacher, das Asset und seine Transkriptausgabedarstellung zu suchen und zu finden.
Gehen Sie zu Tools > Assets > Verarbeitungsprofile und klicken Sie auf die Schaltfläche Erstellen, um ein KI-basiertes Verarbeitungsprofil zur Generierung einer Transkription Ihrer Audio- und Videodateien zu erstellen. Standardmäßig zeigt die Seite mit dem Verarbeitungsprofil nur drei Registerkarten an (Bild, Video und Benutzerdefiniert). Eine Registerkarte Content-KI ist jedoch sichtbar, wenn Sie Azure Media Services in Ihrer Experience Manager Assets-Instanz konfiguriert haben. Überprüfen Sie Ihre Azure-Anmeldedaten, wenn Sie die Registerkarte Content-KI beim Erstellen eines Verarbeitungsprofils nicht angezeigt bekommen.
Klicken Sie auf der Registerkarte Content-KI zum Konfigurieren der Transkription auf die Schaltfläche Neue hinzufügen. Hier können Sie die Dateiformate (MIME-Typen) zum Generieren von Transkripten ein- und ausschließen, indem Sie Dateitypen aus der Dropdown-Liste auswählen. In der folgenden Abbildung werden alle unterstützten Audio- und Videodateien eingeschlossen und die Textdateien ausgeschlossen.
Aktivieren Sie den Umschalter VTT-Transkript im selben Verzeichnis erstellen, um die Transkript-Ausgabedarstellung (.vtt-Datei) in demselben Ordner zu erstellen und zu speichern, in dem sich das Original-Asset befindet. Die anderen Ausgabedarstellungen werden auch vom standardmäßigen DAM-Asset-Verarbeitungs-Workflow erzeugt, unabhängig von dieser Einstellung.
Die folgende Abbildung zeigt ein benutzerdefiniertes Videoprofil, das in Experience Manager Assets erstellt wird.
Das Videoprofil enthält außerdem die folgenden benutzerdefinierten Konfigurationen. Einzelheiten zur Erstellung eines benutzerdefinierten Verarbeitungsprofils finden Sie in der Dokumentation zum Verarbeitungsprofil.
Konfigurieren wir nun die Transkription in diesem Videoprofil. Gehen Sie zur Registerkarte Content-KI und klicken Sie auf die Schaltfläche Neue hinzufügen. Schließen Sie alle Audio- und Videodateien ein und schließen Sie die Bild- und Anwendungsdateien aus. Aktivieren Sie den Umschalter VTT-Transkript im selben Verzeichnis erstellen und speichern Sie die Konfiguration.
Nachdem das Verarbeitungsprofil für die Transkription von Audio- und Videodateien konfiguriert wurde, können Sie dieses Verarbeitungsprofil mit einer der folgenden Methoden auf Ordner anwenden:
-
Wählen Sie unter Tools > Assets > Verarbeitungsprofile eine Verarbeitungsprofildefinition aus und verwenden Sie die Aktion Profil auf Ordner anwenden. Mit dem Inhaltsbrowser können Sie zu einem bestimmten Ordner navigieren, den Ordner auswählen und die Anwendung des Profils bestätigen.
-
Wählen Sie einen Ordner in der Assets-Benutzeroberfläche aus und klicken Sie zum Öffnen der Ordnereigenschaften auf die Aktion Eigenschaften. Klicken Sie auf die Registerkarte Asset-Verarbeitung und wählen Sie das entsprechende Verarbeitungsprofil für den Ordner aus der Liste Verarbeitungsprofil aus. Klicken Sie auf Speichern und schließen, um die Änderungen zu speichern.
-
Benutzerinnen und Benutzer können in der Assets-Benutzeroberfläche Ordner oder bestimmte Assets auswählen, um ein Verarbeitungsprofil anzuwenden, und dann die Option Assets erneut verarbeiten aus den oben verfügbaren Optionen auswählen.
Generieren der Transkription Ihrer Audio- oder Video-Assets generate-transcription
Bei der Verarbeitung eines Video-Assets erzeugt das KI-basierte Verarbeitungsprofil automatisch das Transkript (.vtt-Datei) als Ausgabedarstellung zusammen mit dem Original-Asset im selben Ordner.
Sie können die Transkript-Ausgabedarstellung auch anzeigen, indem Sie auf die Ausgabedarstellungen des Original-Video-Assets zugreifen. Um auf das Bedienfeld Ausgabedarstellungen zuzugreifen, wählen Sie das ursprüngliche Video-Asset aus und öffnen Sie die linke Leiste. Sie können sehen, dass die Transkript-Ausgabedarstellung (.vtt-Datei) unter dem Kopf TRANSCRIPTVTT angezeigt wird.
Sie können das Transkript (.vtt-Textdatei) direkt aus dem Ordner als separate Ausgabedarstellung des Assets oder aus dem Bedienfeld Ausgabedarstellungen des ursprünglichen Assets herunterladen, indem Sie alle Ausgabedarstellungen des Assets herunterladen.
Derzeit unterstützt Experience Manager die Volltextvorschau oder die Bearbeitung von VTT-Dateien nicht nativ. Sie können jedoch die Transkriptausgabedarstellung herunterladen und einen beliebigen Texteditor verwenden, um das Transkript zu bearbeiten oder zu überprüfen. Das Transkript spiegelt die gesprochene Sprache als Text zum gegebenen Zeitstempel im Video mit dem Konfidenzwert (Genauigkeit) der Transkription wieder.
Verwenden von Transkripten in Dynamic Media using-transcription-in-dynamic-media
Wenn Sie Dynamic Media in Ihrer Experience Manager Assets-Instanz konfiguriert haben, können Sie das Asset (Audio- oder Videodatei) und das zugehörige Transkript (.vtt-Datei) in Dynamic Media veröffentlichen. Auf diese Weise werden das Original-Asset (Audio- oder Videodatei) und seine transkribierte Ausgabedarstellung (.vtt-Datei) im selben Ordner in Dynamic Media veröffentlicht. Der Dynamic Media-Administrator kann CC Closed Caption für die Audio- oder Videodatei mithilfe der Transkriptions-Ausgabedarstellung (.vtt-Datei) aktivieren.
Siehe auch:
In der folgenden Abbildung spiegelt die URL den Teil der Untertitelung wider, der sich auf das Transkript (.vtt-Datei) bezieht. Das Video spiegelt die gesprochene Sprache (transkribierter Text) als Closed Caption zum angegebenen Zeitstempel im Video wider. Benutzerinnen und Benutzer können die Untertitel mithilfe der Schaltfläche CC aktivieren oder deaktivieren.
Unterstützte Dateiformate für die Transkription supported-file-format
Die folgenden Audio- und Videodateiformate werden für die Transkription unterstützt:
Bekannte Einschränkungen known-limitations
- Die Transkriptionsfunktion wird für Videos mit einer Dauer von bis zu 10 Minuten unterstützt.
- Der Videotitel darf maximal 80 Zeichen lang sein.
- Die unterstützte Dateigröße beträgt bis zu 15 GB.
- Die maximal unterstützte Verarbeitungsdauer beträgt 60 Minuten.
- Mit einem kostenpflichtigen Azure-Konto können bis zu 50 Filme pro Minute hochgeladen werden. In einem Testkonto können Sie jedoch nur bis zu fünf Filme pro Minute hochladen.
Tipps zur Fehlerbehebung troubleshooting
Melden Sie sich bei Ihrem Azure Media Services-Konto mit denselben Anmeldedaten an (die Sie für die Konfiguration verwendet haben), um den Status der Anfrage zu überprüfen. Wenden Sie sich an den Azure-Support, wenn Ihre Anfrage nicht erfolgreich verarbeitet wurde.
Siehe auch
- Assets übersetzen
- Assets-HTTP-API
- Von AEM Assets unterstützte Dateiformate
- Suchen von Assets
- Connected Assets
- Asset-Berichte
- Metadatenschemata
- Herunterladen von Assets
- Verwalten von Metadaten
- Suchfacetten
- Verwalten von Sammlungen
- Massenimport von Metadaten
- Veröffentlichen von Assets in AEM und Dynamic Media