Configurare la trascrizione in Experience Manager Assets
- Argomenti:
- Gestione risorse
- Configurazione
Creato per:
- Amministratore
La trascrizione è il processo di traduzione dell’audio da un file audio o video in testo (da un discorso al testo) utilizzando la tecnologia di riconoscimento vocale.
Adobe Experience Manager Assets è configurato con Azure Media Services che genera automaticamente la trascrizione testuale della lingua parlata in un file audio o video supportato in formato WebVTT (.vtt). Quando una risorsa audio o video viene elaborata in Experience Manager Assets, il servizio di trascrizione genera automaticamente la rappresentazione trascritta della risorsa audio o video e la memorizza nella stessa posizione all’interno dell’archivio dell risorse in cui risiede la risorsa originale. Il servizio di trascrizione di Experience Manager Assets consente agli addetti al marketing di gestire in modo efficace i contenuti audio e video con in più la possibilità di individuare i contenuti testuali e di aumentare il ROI di queste risorse, sostenendo l'accessibilità e la localizzazione.
Le trascrizioni sono versioni testuali del contenuto parlato; un esempio è un filmato che stai guardando su qualsiasi piattaforma OTT e che spesso include didascalie per facilitarne l’accessibilità o per consumarne il contenuto in altre lingue. Oppure qualsiasi file audio o video utilizzato per scopi di marketing, apprendimento o intrattenimento. Queste esperienze iniziano con una trascrizione che viene poi formattata o tradotta come appropriato. La trascrizione di audio o video è un processo che richiede molto tempo ed è soggetto a errori quando viene eseguito manualmente. Il processo manuale rende difficile anche la scalabilità, necessaria data la crescente necessità di contenuti audio-video. Experience Manager Assets utilizza la trascrizione basata sull'intelligenza artificiale di Azure che consente l'elaborazione su larga scala delle risorse audio e video e genera le trascrizioni di testo (file .vtt) insieme ai dettagli della marca temporale. Oltre ad Assets, la funzione di trascrizione è supportata anche da Dynamic Media.
La funzione di trascrizione è disponibile senza alcun costo in Experience Manager Assets. Tuttavia, gli amministratori richiedono le credenziali di Azure dell'utente per configurare il servizio di trascrizione in Experience Manager Assets. È inoltre possibile ottenere le credenziali di prova direttamente da Microsoft® per scoprire la funzione di trascrizione audio o video in Assets.
Prerequisiti per la trascrizione
-
Istanza Experience Manager Assets as a Cloud Service subito operativa.
-
Le seguenti credenziali di Azure sono necessarie per la configurazione in Experience Manager Assets:
- ID client (chiave API)
- Chiave segreto client
- Endpoint tenant (dominio)
- Account multimediale
- Gruppo di risorse
- ID abbonamento
Vedi Documentazione di Azure per ottenere le credenziali di accesso all’API di Azure Media Services.
-
Assicurati che l’account Azure disponga di crediti sufficienti per elaborare le nuove richieste.
Configurare la trascrizione in Experience Manager Assets
Di seguito sono riportate le configurazioni necessarie per abilitare la funzione di trascrizione in Experience Manager Assets:
Configurare Azure Media Services
Experience Manager Assets utilizza Azure Media Services che genera automaticamente le trascrizioni testuali della lingua parlata in un file audio o video supportato nel formato WebVTT (.vtt). Gli amministratori possono configurare Azure Media Services in Experience Manager Assets utilizzando le credenziali di Azure. I prerequisiti per la trascrizione elencano le credenziali Azure necessarie per la configurazione. Se non hai account e credenziali Azure, consulta la Documentazione di Azure Media Services per ottenere le credenziali di prova.
Vai a Strumenti > Cloud Services > Configurazione di Azure Media Services. Seleziona una cartella (posizione) dalla barra a sinistra e fai clic sul pulsante Crea per configurare la connessione con l'account Azure. Questa cartella è il percorso in cui è memorizzata la configurazione cloud Azure in Experience Manager Assets. Inserisci le credenziali Azure e fai clic su Salva e chiudi.
Configurare il profilo di elaborazione per la trascrizione
Una volta che Azure Media Services è configurato in Experience Manager Assets, il passaggio successivo consiste nel creare un profilo di elaborazione delle risorse per generare la trascrizione delle risorse audio e video basate sull’intelligenza artificiale. Il profilo di elaborazione basato sull’intelligenza artificiale genera le trascrizioni della risorsa audio o video supportata come rappresentazione in Experience Manager Assets e memorizza la trascrizione (file .vtt) nella stessa cartella in cui si trova la risorsa originale. In questo modo, è più facile per gli utenti cercare e individuare la risorsa e la relativa rappresentazione trascritta.
Vai a Strumenti > Assets > Profili di elaborazione e fai clic sul pulsante Crea per creare un profilo di elaborazione basato sull'intelligenza artificiale per generare la trascrizione dei file audio e video. Per impostazione predefinita, la pagina del profilo di elaborazione presenta solo tre schede (Immagine, Video e Personalizzato). Tuttavia, se hai configurato Azure Media Services nella tua istanza Experience Manager Assets, è visibile una scheda IA per la gestione dei contenuti. Verifica le credenziali Azure se non visualizzi la scheda IA per la gestione dei contenuti durante la creazione di un profilo di elaborazione.
Nella scheda IA per la gestione dei contenuti, fai clic sul pulsante Aggiungi nuovo per configurare la trascrizione. In questo caso, puoi includere ed escludere i formati di file (tipi MIME) per la generazione delle trascrizioni selezionando i tipi di file dall’elenco a discesa. Nell’illustrazione seguente, tutti i file audio e video supportati sono inclusi e i file di testo sono esclusi.
Abilita Creare una trascrizione VTT nella stessa directory per creare e memorizzare la rappresentazione della trascrizione (file .vtt) nella stessa cartella in cui si trova la risorsa originale. Le altre rappresentazioni vengono generate anche dal flusso di lavoro di elaborazione delle risorse DAM predefinito, indipendentemente da questa impostazione.
La figura seguente descrive un profilo video personalizzato creato in Experience Manager Assets.
Il profilo video contiene anche le seguenti configurazioni personalizzate. Consulta la documentazione del profilo di elaborazione per informazioni dettagliate su come creare un profilo di elaborazione personalizzato.
Ora configuriamo la trascrizione in questo profilo video. Passa alla scheda IA per la gestione dei contenuti e fai clic sul pulsante Aggiungi nuovo. Includi tutti i file audio e video ed escludi i file di immagine e di applicazione. Abilita Creare una trascrizione VTT nella stessa directory e salva la configurazione.
Una volta configurato il profilo di elaborazione per la trascrizione di file audio e video, puoi applicarlo alle cartelle utilizzando uno dei seguenti metodi:
-
Selezionare una definizione di profilo di elaborazione in Strumenti > Assets > Profili di elaborazione e utilizzare l'azione Applica profilo alle cartelle. Il browser del contenuto ti consente di passare a una cartella specifica, selezionarla e confermare l’applicazione del profilo.
-
Seleziona una cartella nell’interfaccia utente di Assets e fai clic su Proprietà per aprire le proprietà della cartella. Fai clic sulla scheda Elaborazione delle risorse e seleziona il profilo di elaborazione appropriato per la cartella dall’elenco Profilo di elaborazione. Per salvare le modifiche, fai clic su Salva e chiudi.
-
Per applicare un profilo di elaborazione, gli utenti possono selezionare cartelle o risorse specifiche nell’interfaccia utente di Assets, quindi selezionare Rielabora risorse tra le opzioni disponibili nella parte superiore.
Generare la trascrizione delle risorse audio o video
Quando si elabora una risorsa video, il Profilo di elaborazione basato sull’intelligenza artificiale genera automaticamente la trascrizione (file .vtt) come rappresentazione insieme alla risorsa originale nella stessa cartella.
Puoi anche vedere la rappresentazione della trascrizione accedendo alle rappresentazioni della risorsa video originale. Per accedere al pannello Rappresentazioni seleziona la risorsa video originale e apri la barra a sinistra. È possibile vedere che la rappresentazione della trascrizione (file .vtt) è visibile sotto l’intestazione TRANSCRIPTVTT.
Puoi scaricare la trascrizione (file di testo .vtt) direttamente dalla cartella come una rappresentazione separata della risorsa o dall’interno del pannello Rappresentazioni della risorsa originale scaricando tutte le rappresentazioni della risorsa.
Attualmente, Experience Manager non supporta l’anteprima full-text o la modifica nativa di file VTT. Tuttavia, puoi scaricare la rappresentazione della trascrizione e utilizzare qualsiasi editor di testo per modificarla o verificarla. La trascrizione riflette la lingua parlata come un testo in una marca temporale determinata nel video con il punteggio di affidabilità (precisione) della trascrizione.
Utilizzo della trascrizione in Dynamic Media
Se hai configurato Dynamic Media nell’istanza di Experience Manager Assets, puoi pubblicare la risorsa (file audio o video) e la relativa trascrizione (file .vtt) in Dynamic Media. In questo modo, la risorsa originale (file audio o video) e la relativa rappresentazione trascritta (file .vtt) vengono pubblicati in Dynamic Media nella stessa cartella. L’amministratore di Dynamic Media può abilitare l’esperienza con CC Closed Caption per il file audio o video che utilizza la rappresentazione della trascrizione (file .vtt).
Consulta anche:
Nell’illustrazione seguente, la parte “caption” nell’URL fa riferimento alla trascrizione (file .vtt). Nel video, il testo parlato (testo trascritto) compare come sottotitolo codificato in corrispondenza del tempo appropriato nel video. L’utente può abilitare o disabilitare i sottotitoli mediante il pulsante CC.
Formati di file supportati per la trascrizione
La trascrizione supporta i seguenti formati di file audio e video:
Limitazioni note
- La funzione di trascrizione è supportata per video di durata fino a 10 minuti.
- Il titolo del video non può contenere più di 80 caratteri.
- Sono supportati file di dimensione fino a 15 GB.
- La durata massima di elaborazione supportata è di 60 minuti.
- In un account Azure a pagamento, puoi caricare fino a 50 filmati al minuto. Tuttavia, in un account di prova puoi caricare fino a cinque filmati al minuto.
Suggerimenti per la risoluzione dei problemi
Accedi al tuo account Azure Media Services con le stesse credenziali (quelle utilizzate per la configurazione) per verificare lo stato della richiesta. Contatta il supporto Azure se la richiesta non viene elaborata correttamente.
Consulta anche
- Traduci risorse
- API HTTP di Assets
- Formati di file supportati dalle risorse
- Cerca risorse
- Risorse collegate
- Rapporti sulle risorse
- Schemi metadati
- Scaricare le risorse
- Gestire i metadati
- Facet di ricerca
- Gestire le raccolte
- Importazione in blocco dei metadati
- Pubblicare risorse in AEM e Dynamic Media