标记、分类和元数据最佳实践:高级摘要

元数据和标记是AEM中提高效率的关键。 用户、领导和管理层认识到全面战略的需要,但他们发现很难取得进展。 知识往往被孤立在用户之间,使得整体战略变得困难,并使调整问题更加严重。

元数据和标记之间有何区别? 在制定策略时,需要考虑哪些业务方面?

元数据的用途是什么?

元数据将结构添加到结构较少的内容。
示例:基本图像具有像素。 我们可以把这些称为“核心数据”。 它是描述格式、类别、许可详细信息等的元数据。
元数据最常用于资源。 但是,内容页面或体验片段中也有大量元数据的用例。

元数据的来源

以下是可以生成元数据的类别:

  • 提取的元数据 — 文档中已有可用的信息,例如自然语言的信息。
  • 派生元数据 — 信息在原始数据中不可用,但可通过交叉引用先验知识来派生。
  • 手动添加的元数据 — 这是不属于第一个类别且需要人工手动添加的元数据。

元数据的类型

在上面列出的类别中,有四种主要类型:

  • 技术和描述性元数据:提供有关内容的技术详细信息(即标题、语言等)的信息
  • 运营元数据:记录资产的生命周期(即,在创意和营销活动中获得批准)
  • 管理元数据:组织内资产的状态或状态(即许可证信息、所有权)
  • 结构化元数据:帮助对资产或页面进行分类,以顺利完成业务流程(适用于大多数标记和分类)

文件夹和文件名

文件夹是在AEM中导航和浏览内容的自然方式。 您的利益相关者将如何与AEM进行交互? 这将决定文件夹的结构。 通常,文件夹结构采用以下一种(或两种)设计:

  • 导航
  • 浏览
  • 分类
  • 访问控制

对于AEM Sites,导航是关键。 文件夹用于控制对资源和页面的访问。

哪些层次的作者需要访问主页? 产品页面呢? 还是营销活动? 使用权限和文件夹结构来进行正确的管理。

存储元数据

有三种方法存储元数据:

  • 二进制:与资源性质相关的二进制格式(Photoshop、InDesign、PNG、JPG)。
  • 资产节点:这是资产本身的元数据,与使用的系统或进程无关。
  • 外部位置:元数据,它不直接位于资源上,但可用作资源的“状态”描述符(例如:可能影响资源但未直接应用于资源的工作流)

元数据模型

如何捕获和格式化元数据的结构称为元数据模型或元数据架构。 在将资产或页面引入到系统中之前,必须对此进行协商。

元数据模型的构建通常符合以下用例:

  • 搜索和检索:帮助存储内容的各个关键方面,以方便企业检索。
  • 重复使用:帮助利用旧资产进行重新利用(节省时间和金钱)
  • 许可证管理:跟踪组织对资产的所有权(通常出于法律原因)
  • 分发:向消费者提供内容,或者向业务合作伙伴联合资产。
  • 存档:指出资产已过期的元数据(始终最佳实践是在资产上放置“已存档”标记,以免丢失重要信息)/
  • 交叉引用:捕获两个或多个资产彼此之间关系的关联元数据(元数据的合成支持交叉引用和一致的组组织)
  • 导航:存储资产的文件夹结构(用于通过浏览检索信息)

作者元数据主要支持操作流程。 Publish支持检索和分发用例。

使用标记作为预定义术语

标记是指派给一段信息的关键字或术语。例如,标记系统不允许输入“car”、“vehicle”、“automol”,而是仅允许选择一个值,从而使搜索更可预测。 标记可标准化并简化资产分类。

注意:虽然AEM允许临时标记,但最佳做法是避免使用此类标记,因为它可能会导致分类未定义且难以使用。

标记的常见用法:

  • 关键词搜索:标记可以描述资源属于特定的实体组。 例如,标记“image/subject/car”描述资源属于显示汽车的图像集。
  • 驱动关系:共享同一标记的所有资源均可视为已连接。 在有大量动态和关联内容的网站上,标记而非直接链接特别有用。
  • 驱动器导航:按分层分类排序的标记可以构建导航,或指向类似文档的链接。
    标记还应该被视为根据商业条款而不是技术属性连接各种类型数据的信息。

标记的常见应用

在AEM中使用标记时,标记可帮助实现更短的复杂功能实施,例如:

  • 分面搜索
  • 个性化导航
  • 相关内容
  • 内容引用
  • 搜索引擎优化
  • 突出显示关键概念

分类

分类法是基于共享特征组织标记的系统,这些特征通常是根据组织需求而构建的分层结构。 这种结构有助于更快地找到标记或强制推广。
示例:需要对汽车的库存图像进行子分类。 分类法可能如下所示:

/subject/car/
/subject/car/sportscar
/subject/car/sportscar/porsche
/subject/car/sportscar/ferrari

/subject/car/minivan
/subject/car/minivan/mercedes
/subject/car/minivan/大众

/subject/car/limousine

现在,用户可以选择想要查看的是普通运动鞋的图片,还是特别想要一辆“保时捷”的图片。 毕竟,两者都是运动鞋。
最佳实践:避免使用平面分类。 平面分类法缺乏上述优势,需要持续维护

使用分类法作为同义词。 ​当用户搜索关键字时,系统会为在该处找到的所有同义词创建第二次搜索。
此外,系统可以提供关键字列表以提高一致性,而不是手动键入“car”。

将分类用作词典。 ​您可以展开单个标记并使用标记的所有同义词,而不是只打印“car”。

多个类别。 ​与文件夹层次结构相反,标记可用于同时表示多个分类。 带有以下标记的资产:

/subject/car/minivan/mercedes
/subject/people/family
/color/red

元数据和标记

并非所有元数据都应视为标记系统的候选对象。 技术元数据可能会不必要地复制信息。 标记的最佳候选项是业务元数据。标记是实施一致的词汇、多面向搜索和导航的理想选择。

标记管理

标签管理从专门的核心团队中获益。 新成员应在添加新标记之前首先了解分类法的用途和功能。 经验丰富的专家充当新标签的看门人,将减少长期的不一致性。

标记创建

分类应由内容作者使用并受最终用户理解。 它们应在内容创建过程之前创建。 任何快捷方式都会导致额外的管理和维护工作。

持续维护

情况发生了变化,标记列表的需求也会发生变化。 制定完善的维护流程,减少重复工作。

确保内容投稿人知道他们可以如何提出更改,并且编辑或内容经理会定期查看术语。

使用标记和分类的最佳实践

标准化标记。 ​创建提供权威词汇的词汇表。 如果不制定标准,重复就会造成问题。 此外,建议不仅审核分类,还要审核标记的使用情况。

请勿过度标记。如果过于频繁地分发, ​标记可能会失去其重要性。剪裁无关标记以获得最佳效率。

在一段时间内重新评估标记。 ​请记住,业务术语和业务上下文很少保持静态。 您可能会发现需要重新标准化并重新应用标记。

使用AI支持的智能标记。 ​智能标记[查看链接]是AEM中的AI功能,可减少手动标记资源的工作量。 智能标记使用AI推断有关图像主题的信息。 它会生成描述图像内容的描述性标记。

元数据质量和维护

了解业务需求是执行元数据管理模型的重要步骤。 如果没有定义,则无法存储信息。 需要定期重新访问模型。 这是一项重要的质量控制活动。

此外,应在内容创建过程中尽早捕获元数据。 如果元数据未在正确的时间应用,则不太可能将其逆向应用。

利用元数据 ​加强协作:利用AdobeAsset Link、Adobe Bridge和AEM Desktop将创作流程绑定在一起,并利用元数据简化创作工作流。 使用这些工具将丰富创意过程中的元数据和用户体验。

元数据管理最佳实践

  • 分配具有强大的执行任务的核心团队:组建一个元数据核心团队,该团队对业务生态系统有全面的了解,并且组织管理层有强大的执行任务。
  • 定义元数据战略和治理:良好的元数据战略可帮助组织解释元数据的需要和好处。 策略包括元数据架构、分类、业务流程(用于数据质量和捕获)、角色和责任以及治理流程。 *
  • 定义并传达一致的元数据模型:定义的策略和推理应在组织内得到良好的记录和沟通。
  • 标准命名约定:创建一致且描述性的文件命名约定,以增强品牌策略、信息管理和可用性。
  • 文件名中的安全字符:文件名应该能够被所有常用操作系统解释。 您可以安全地使用字符、数字、变音符号、空格和下划线。 减号也是安全的,但如果您剪切并粘贴,它可能会看起来像“短划线”。
  • 版本命名约定:AEM提供了一些功能来保留资产的早期版本。 在某些情况下,您可能希望保留多个版本。 但是,应确保版本化方案保持一致。

组织和描述性元数据

以下准则可能会帮助您确定如何对元数据分类:

描述 — 如果数据描述了资源或内容段,则它应是附加元数据的一部分。

搜索 — 如果元数据应在搜索中使用,则必须附加该元数据。

公开 — 如果您向第三方公开分发平台上的元数据,请注意不要同时公开“内部”元数据。

持续时间 — 元数据应存在的时间越长,它就越有可能是附加元数据的合适候选项。

相关业务流程 — 在元数据中包含永久产品ID绝对有帮助。 但是,与产品目录相关的项目类别是存在问题的资产元数据。

组织和处理 — 如果元数据的性质是组织性的,如审批工作流中的状态或特定部门的所有权,则应考虑外部元数据,而不是将元数据附加到资产。

要创建策略,请提出以下问题:

  • 需要哪种内容和“附加信息”(=元数据)来解决业务问题/业务问题/业务问题?
  • 架构中的变量、“字段”是什么以及可能的值是什么? 哪些变量需要自由文本输入,哪些变量可以通过类型(数字、日期、布尔值……)、一组固定值(例如国家/地区)或给定分类法的标记进行缩小。 需要多少个标记?允许?
  • 元数据可以解决哪些技术问题/问题/问题?
  • 如何获取/创建该内容/元数据? 获取/创建该元数据需要多少成本?
  • 特定用户组需要哪些类型的元数据?
  • 如何维护和更新元数据?
  • 谁应该对流程中的哪个部分负责?
  • 您如何确保遵循商定的业务流程?
  • 您应该遵循什么标准? 您是否应该采用并修改行业标准(都柏林核心、ISO 19115、PRISM等) 还是说组织应该制定自己的标准?
  • 在何处记录该战略? 如何确保所有利益相关者都具有访问权限? 如何确保新加入的员工遵守商定的标准(例如,在获得访问权限之前访问培训?)
recommendation-more-help
bb44cebf-d964-4e3c-b64e-ce882243fe4d