Documentazione AEM as a Cloud Service Guida utente

Configurare la trascrizione in Experience Manager Assets

Last update: Fri Mar 21 2025 00:00:00 GMT+0000 (Coordinated Universal Time)

Creato per:

Amministratore

^Nuovo Dynamic Media Prime e Ultimate

^Nuovo AEM Assets Ultimate

^Nuova Integrazione di AEM Assets con Edge Delivery Services

^Nuovo Estensibilità interfaccia utente

^Nuovo Abilita Dynamic Media Prime e Ultimate

Best practice per la ricerca

Best practice per i metadati

Content Hub

Dynamic Media con funzionalità OpenAPI

Documentazione di AEM Assets per sviluppatori

La trascrizione è il processo di traduzione dell’audio da un file audio o video in testo (da un discorso al testo) utilizzando la tecnologia di riconoscimento vocale.
Adobe Experience Manager Assets è configurato con Azure Media Services che genera automaticamente la trascrizione testuale della lingua parlata in un file audio o video supportato in formato WebVTT (.vtt). Quando una risorsa audio o video viene elaborata in Experience Manager Assets, il servizio di trascrizione genera automaticamente la rappresentazione trascritta della risorsa audio o video e la memorizza nella stessa posizione all’interno dell’archivio dell risorse in cui risiede la risorsa originale. Il servizio di trascrizione di Experience Manager Assets consente agli addetti al marketing di gestire in modo efficace i contenuti audio e video con in più la possibilità di individuare i contenuti testuali e di aumentare il ROI di queste risorse, sostenendo l'accessibilità e la localizzazione.

Le trascrizioni sono versioni testuali del contenuto parlato; un esempio è un filmato che stai guardando su qualsiasi piattaforma OTT e che spesso include didascalie per facilitarne l’accessibilità o per consumarne il contenuto in altre lingue. Oppure qualsiasi file audio o video utilizzato per scopi di marketing, apprendimento o intrattenimento. Queste esperienze iniziano con una trascrizione che viene poi formattata o tradotta come appropriato. La trascrizione di audio o video è un processo che richiede molto tempo ed è soggetto a errori quando viene eseguito manualmente. Il processo manuale rende difficile anche la scalabilità, necessaria data la crescente necessità di contenuti audio-video. Experience Manager Assets utilizza la trascrizione basata sull'intelligenza artificiale di Azure che consente l'elaborazione su larga scala delle risorse audio e video e genera le trascrizioni di testo (file .vtt) insieme ai dettagli della marca temporale. Oltre ad Assets, la funzione di trascrizione è supportata anche da Dynamic Media.

La funzione di trascrizione è disponibile senza alcun costo in Experience Manager Assets. Tuttavia, gli amministratori richiedono le credenziali di Azure dell'utente per configurare il servizio di trascrizione in Experience Manager Assets. È inoltre possibile ottenere le credenziali di prova direttamente da Microsoft® per scoprire la funzione di trascrizione audio o video in Assets.

Prerequisiti per la trascrizione

Istanza Experience Manager Assets as a Cloud Service subito operativa.
Le seguenti credenziali di Azure sono necessarie per la configurazione in Experience Manager Assets:
- ID client (chiave API)
- Chiave segreto client
- Endpoint tenant (dominio)
- Account multimediale
- Gruppo di risorse
- ID abbonamento
Vedi Documentazione di Azure per ottenere le credenziali di accesso all’API di Azure Media Services.
Assicurati che l’account Azure disponga di crediti sufficienti per elaborare le nuove richieste.

Configurare la trascrizione in Experience Manager Assets

Di seguito sono riportate le configurazioni necessarie per abilitare la funzione di trascrizione in Experience Manager Assets:

Configurare Azure Media Services
Configurare il profilo di elaborazione per la trascrizione audio/video

Configurare Azure Media Services

Experience Manager Assets utilizza Azure Media Services che genera automaticamente le trascrizioni testuali della lingua parlata in un file audio o video supportato nel formato WebVTT (.vtt). Gli amministratori possono configurare Azure Media Services in Experience Manager Assets utilizzando le credenziali di Azure. I prerequisiti per la trascrizione elencano le credenziali Azure necessarie per la configurazione. Se non hai account e credenziali Azure, consulta la Documentazione di Azure Media Services per ottenere le credenziali di prova.

configure-transcription-service

Vai a Strumenti > Cloud Services > Configurazione di Azure Media Services. Seleziona una cartella (posizione) dalla barra a sinistra e fai clic sul pulsante Crea per configurare la connessione con l'account Azure. Questa cartella è il percorso in cui è memorizzata la configurazione cloud Azure in Experience Manager Assets. Inserisci le credenziali Azure e fai clic su Salva e chiudi.

Configurare il profilo di elaborazione per la trascrizione

Una volta che Azure Media Services è configurato in Experience Manager Assets, il passaggio successivo consiste nel creare un profilo di elaborazione delle risorse per generare la trascrizione delle risorse audio e video basate sull’intelligenza artificiale. Il profilo di elaborazione basato sull’intelligenza artificiale genera le trascrizioni della risorsa audio o video supportata come rappresentazione in Experience Manager Assets e memorizza la trascrizione (file .vtt) nella stessa cartella in cui si trova la risorsa originale. In questo modo, è più facile per gli utenti cercare e individuare la risorsa e la relativa rappresentazione trascritta.

Vai a Strumenti > Assets > Profili di elaborazione e fai clic sul pulsante Crea per creare un profilo di elaborazione basato sull'intelligenza artificiale per generare la trascrizione dei file audio e video. Per impostazione predefinita, la pagina del profilo di elaborazione presenta solo tre schede (Immagine, Video e Personalizzato). Tuttavia, se hai configurato Azure Media Services nella tua istanza Experience Manager Assets, è visibile una scheda IA per la gestione dei contenuti. Verifica le credenziali Azure se non visualizzi la scheda IA per la gestione dei contenuti durante la creazione di un profilo di elaborazione.

Nella scheda IA per la gestione dei contenuti, fai clic sul pulsante Aggiungi nuovo per configurare la trascrizione. In questo caso, puoi includere ed escludere i formati di file (tipi MIME) per la generazione delle trascrizioni selezionando i tipi di file dall’elenco a discesa. Nell’illustrazione seguente, tutti i file audio e video supportati sono inclusi e i file di testo sono esclusi.

Abilita Creare una trascrizione VTT nella stessa directory per creare e memorizzare la rappresentazione della trascrizione (file .vtt) nella stessa cartella in cui si trova la risorsa originale. Le altre rappresentazioni vengono generate anche dal flusso di lavoro di elaborazione delle risorse DAM predefinito, indipendentemente da questa impostazione.

configure-transcription-service

La figura seguente descrive un profilo video personalizzato creato in Experience Manager Assets.

configure-transcription-service

Il profilo video contiene anche le seguenti configurazioni personalizzate. Consulta la documentazione del profilo di elaborazione per informazioni dettagliate su come creare un profilo di elaborazione personalizzato.

configure-transcription-service

Ora configuriamo la trascrizione in questo profilo video. Passa alla scheda IA per la gestione dei contenuti e fai clic sul pulsante Aggiungi nuovo. Includi tutti i file audio e video ed escludi i file di immagine e di applicazione. Abilita Creare una trascrizione VTT nella stessa directory e salva la configurazione.

configure-transcription-service

Una volta configurato il profilo di elaborazione per la trascrizione di file audio e video, puoi applicarlo alle cartelle utilizzando uno dei seguenti metodi:

Selezionare una definizione di profilo di elaborazione in Strumenti > Assets > Profili di elaborazione e utilizzare l'azione Applica profilo alle cartelle. Il browser del contenuto ti consente di passare a una cartella specifica, selezionarla e confermare l’applicazione del profilo.
Seleziona una cartella nell’interfaccia utente di Assets e fai clic su Proprietà per aprire le proprietà della cartella. Fai clic sulla scheda Elaborazione delle risorse e seleziona il profilo di elaborazione appropriato per la cartella dall’elenco Profilo di elaborazione. Per salvare le modifiche, fai clic su Salva e chiudi.
Per applicare un profilo di elaborazione, gli utenti possono selezionare cartelle o risorse specifiche nell’interfaccia utente di Assets, quindi selezionare Rielabora risorse tra le opzioni disponibili nella parte superiore.

TIP

A una cartella può essere applicato un solo profilo di elaborazione.

Dopo aver applicato un profilo di elaborazione a una cartella, tutte le nuove risorse caricate (o aggiornate) in questa cartella o in una delle sue sottocartelle vengono elaborate utilizzando il profilo di elaborazione aggiuntivo configurato. Questa elaborazione si aggiunge al profilo predefinito standard.

NOTE

Un profilo di elaborazione applicato a una cartella funziona per l’intera struttura, tuttavia, può essere sostituito con un altro profilo applicato a una sottocartella.

Quando le risorse vengono caricate in una cartella, Experience Manager comunica con le proprietà della cartella contenitore per identificare il profilo di elaborazione. Se nessun profilo è applicato, viene selezionata una cartella principale nella gerarchia per un profilo di elaborazione da applicare.

Generare la trascrizione delle risorse audio o video

Quando si elabora una risorsa video, il Profilo di elaborazione basato sull’intelligenza artificiale genera automaticamente la trascrizione (file .vtt) come rappresentazione insieme alla risorsa originale nella stessa cartella.

configure-transcription-service

Puoi anche vedere la rappresentazione della trascrizione accedendo alle rappresentazioni della risorsa video originale. Per accedere al pannello Rappresentazioni seleziona la risorsa video originale e apri la barra a sinistra. È possibile vedere che la rappresentazione della trascrizione (file .vtt) è visibile sotto l’intestazione TRANSCRIPTVTT.

configure-transcription-service

Puoi scaricare la trascrizione (file di testo .vtt) direttamente dalla cartella come una rappresentazione separata della risorsa o dall’interno del pannello Rappresentazioni della risorsa originale scaricando tutte le rappresentazioni della risorsa.

Attualmente, Experience Manager non supporta l’anteprima full-text o la modifica nativa di file VTT. Tuttavia, puoi scaricare la rappresentazione della trascrizione e utilizzare qualsiasi editor di testo per modificarla o verificarla. La trascrizione riflette la lingua parlata come un testo in una marca temporale determinata nel video con il punteggio di affidabilità (precisione) della trascrizione.

configure-transcription-service

Utilizzo della trascrizione in Dynamic Media

Se hai configurato Dynamic Media nell’istanza di Experience Manager Assets, puoi pubblicare la risorsa (file audio o video) e la relativa trascrizione (file .vtt) in Dynamic Media. In questo modo, la risorsa originale (file audio o video) e la relativa rappresentazione trascritta (file .vtt) vengono pubblicati in Dynamic Media nella stessa cartella. L’amministratore di Dynamic Media può abilitare l’esperienza con CC Closed Caption per il file audio o video che utilizza la rappresentazione della trascrizione (file .vtt).

Consulta anche:

Nell’illustrazione seguente, la parte “caption” nell’URL fa riferimento alla trascrizione (file .vtt). Nel video, il testo parlato (testo trascritto) compare come sottotitolo codificato in corrispondenza del tempo appropriato nel video. L’utente può abilitare o disabilitare i sottotitoli mediante il pulsante CC.

configure-transcription-service

Formati di file supportati per la trascrizione

La trascrizione supporta i seguenti formati di file audio e video:

Formati audio/video supportati

Estensioni

FLV (con codec H.264 e AAC)

(.flv)

MXF

(.mxf)

MPEG2-PS, MPEG2-TS, 3GP

(.ts, .ps, .3gp, .3gpp, .mpg)

Windows Media Video (WMV)/ASF

(.wmv, .asf)

AVI (non compresso 8 bit/10 bit)

(.avi)

MP4

(.mp4, .m4a, .m4v)

Microsoft® Digital Video Recording (DVR-MS)

(.dvr-ms)

Matroska/WebM

(.mkv)

WAVE/WAV

(.wav)

QuickTime

(.mov)

NOTE

Le risorse (file audio o video) di tipo applicazione non sono supportate per la trascrizione.

Limitazioni note

La funzione di trascrizione è supportata per video di durata fino a 10 minuti.
Il titolo del video non può contenere più di 80 caratteri.
Sono supportati file di dimensione fino a 15 GB.
La durata massima di elaborazione supportata è di 60 minuti.
In un account Azure a pagamento, puoi caricare fino a 50 filmati al minuto. Tuttavia, in un account di prova puoi caricare fino a cinque filmati al minuto.

Suggerimenti per la risoluzione dei problemi

Accedi al tuo account Azure Media Services con le stesse credenziali (quelle utilizzate per la configurazione) per verificare lo stato della richiesta. Contatta il supporto Azure se la richiesta non viene elaborata correttamente.

Consulta anche

recommendation-more-help