在Experience Manager Assets中配置转录 configure-transcription-service
转录是使用语音识别技术将音频或视频文件中的音频转换为文本(语音到文本)的过程。Adobe Experience Manager Assets 配置了 Azure Media Services,它可以自动生成 WebVTT (vtt) 格式的支持音频或视频文件中的口语文本转录。在Experience Manager Assets 中处理音频或视频资产时,转录服务会自动生成音频或视频资产的文本转录演绎版,并将其存储在原始资产所在的 Assets 存储库中的同一位置。此 Experience Manager Assets 转录服务允许营销人员通过增加文本内容的可发现性来有效管理其音频和视频内容,并通过支持可访问性和本地化来提高这些资产的ROI。
转录是口语内容的文本版本;例如,您在任何 OTT 平台上观看的电影通常都包括解说词或字幕,帮助您访问或使用其他语言的内容。或任何用于营销、学习或娱乐目的的音频或视频文件。这些体验从转录开始,然后根据需要进行格式化或翻译。当手动执行时,转录音频或视频是一个很耗时间且容易出错的过程。鉴于对音频视频内容的需求不断增加,扩展手动过程也是一个挑战。Experience Manager Assets 使用Azure基于人工智能的转录,允许对音频和视频资产进行大规模处理,并生成文本转录(.vtt文件)以及时间戳细节。 除了 Assets,Dynamic Media 也支持转录功能。
转录功能在 Experience Manager Assets 中可以免费使用。但是,管理员需要用户的Azure凭据才能在中配置转录服务 Experience Manager Assets. 您还可以直接从 Microsoft® 获得 试用凭证,体验 Assets 中的音频或视频转录功能。
转录先决条件 prerequisites
-
启动并运行的 Experience Manager Assets as a Cloud Service 实例。
-
在 Experience Manager Assets 中进行配置需要以下 Azure 凭据:
- 客户端 ID(API 密钥)
- 客户端密钥
- 租户端点(域)
- 媒体帐户
- 资源组
- 订阅 ID
要获取访问 Azure Media Services API 的凭据,请参阅 Azure 文档。
-
确保 Azure 帐户有足够的信用来处理新请求。
在Experience Manager Assets中配置转录 configure-transcription
以下是在 Experience Manager Assets 中启用转录功能所需的配置:
配置 Azure Media Services configure-azure-media-services
Experience Manager Assets 使用 Azure Media Services,它可以自动生成 WebVTT (vtt) 格式的支持音频或视频文件中的口语文本转录。管理员可使用 Azure 凭据在 Experience Manager Assets 中配置 Azure Media Services。转录先决条件列出配置所需的Azure凭据。如果您没有 Azure 帐户和凭据,请参阅 Azure Media Services 文档获取试用凭据。
转到 “工具”>“Cloud Service”>“Azure Media Services 配置”。从左边栏中选择一个文件夹(位置),然后单击 创建 按钮以配置与的连接 Azure 帐户。 此文件夹是 Experience Manager Assets 中存储您的 Azure 云配置的位置。输入Azure凭据,然后单击 “保存并关闭”。
配置转录的处理配置文件 configure-processing-profile
一旦在 Experience Manager Assets 中配置了Azure Media Services,下一步就是创建一个资产处理配置文件,用于生成音频和视频资产的基于人工智能的转录。基于人工智能的处理配置文件在 Experience Manager Assets 中生成支持音频或视频资产的转录文件作为演绎版,并将该演绎版(.vtt 文件)存储在原始资产所在的同一文件夹中。因此,用户更容易搜索和定位资产及其转录演绎版。
转到 工具 > 资产 > 处理配置文件 然后单击 创建 按钮创建基于人工智能的处理配置文件,用于生成音频和视频文件的转录。 默认情况下,“处理配置文件”页面仅显示三个选项卡(图像、视频和自定义)。但是,如果您已在Experience Manager Assets实例中配置了Azure Media Services选项卡,则 内容人工智能 选项卡可见。如果在创建处理配置文件时,您没有看到 内容人工智能 选项卡,请验证您的 Azure 凭据。
在 内容人工智能 选项卡,单击 新增 按钮以配置转录。 在这里,您可以通过从下拉列表中选择文件类型,来包含和排除用于生成转录的文件格式(MIME类型)。 在下列插图中,包含所有受支持音频和视频文件,排除文本文件。
启用 “在同一目录中创建 VTT 转录文件” 切换功能,在原始资产所在的同一文件夹中创建和存储转录演绎版(.vtt 文件)。其他演绎版也由默认的 DAM 资产处理工作流生成,与此设置无关。
下列插图详细介绍了在 Experience Manager Assets 中创建的自定义视频配置文件。
视频配置文件还包含以下自定义配置。有关如何创建自定义处理配置文件的详细信息,请参阅处理配置文件文档。
现在,让我们在此视频配置文件中配置转录。导航至 内容人工智能 选项卡,然后单击 新增 按钮。 包括所有音频和视频文件,排除图像和应用程序文件。启用 “在同一目录中创建 VTT 转录文件” 切换功能,并保存配置。
将处理配置文件配置为音频和视频文件的转录后,您可以使用以下方法之一将此处理配置文件应用于文件夹:
-
选择中的处理配置文件定义 工具 > 资产 > 处理配置文件,并使用 将配置文件应用到文件夹 操作。 内容浏览器允许您导航到特定文件夹,选择文件夹并确认配置文件的应用。
-
在 Assets 用户界面中选择一个文件夹,然后单击打开文件夹 属性 的操作。单击 “资产处理” 选项卡,并从 处理配置文件 列表中为文件夹选择适当的处理配置文件。要保存更改,请单击 “保存并关闭”。
-
用户可以在 Assets 用户界面中选择文件夹或特定资产以应用处理配置文件,然后从顶部可用的选项中选择 重新处理资产。
生成音频或视频资产的转录 generate-transcription
处理视频资源时,基于人工智能的处理配置文件自动生成转录文件(.vtt 文件),与同一文件夹中的原始资产共同作为演绎版。
您还可以通过访问原始视频资产的演绎版来查看转录演绎版。要访问 演绎版 面板,请选择原始视频资产并打开左边栏。您可以看到转录演绎版(.vtt 文件)在 TRANSCRIPTVTT 标题下可见。
您可以直接从文件夹中下载转录文件(.vtt 文本文件)作为单独的资产演绎版,也可以从原始资产的 演绎版 面板中下载资产的所有演绎版。
目前,Experience Manager 不支持对 VTT 文件进行本地全文预览或编辑。但是,您可以下载转录演绎版,并使用任何文本编辑器编辑或验证转录文件。转录文件反映了视频中给定时间戳的口语文本以及转录的置信度分数(准确性)。
在 Dynamic Media 中使用转录 using-transcription-in-dynamic-media
如果您已在 Experience Manager Assets 实例中配置了 Dynamic Media,则可以将资产(音频或视频文件)及其转录文件(.vtt 文件)发布到 Dynamic Media。这样,原始资产(音频或视频文件)及其转录的演绎版(.vtt 文件)将发布到同一文件夹中的 Dynamic Media 中。Dynamic Media 管理员可以使用转录演绎版(.vtt 文件)为音频或视频文件启用 CC 闭路字幕体验。
另请参阅:
在下列插图中,URL 反映了引用转录文件(.vtt 文件)的字幕部分。视频在视频中给定的时间戳将口语(转录文本)作为 闭路字幕 反映出来。用户可以使用 CC 按钮启用或禁用字幕。
支持的转录文件格式 supported-file-format
转录支持以下音频和视频文件格式:
已知限制 known-limitations
- 转录功能支持时长不超过 10 分钟的视频。
- 视频标题不能超过80个字符。
- 支持的文件大小最多为 15 GB。
- 支持的最大处理时间是 60 分钟。
- 在付费 Azure 帐户中,您每分钟最多可以上传 50 部电影。然而,在试用账户中,您每分钟最多可以上传 5 部电影。
疑难解答提示 troubleshooting
使用相同的凭据(用于配置)登录 Azure Media Services 帐户以验证请求状态。如果您的请求未成功处理,请联系 Azure 支持。
另请参阅