迁移非DITA内容 id181AH0R02HT

本节将指导您完成将非DITA文档迁移到DITA格式的迁移过程。 AEM Guides提供了从以下源进行的迁移:

迁移Microsoft Word文档 id1949B040Z5Z

AEM Guides允许您将现有Word文档(.docx)迁移到DITA主题类型文档。 您需要指定输入和输出文件夹位置以及其他参数,文档将被转换为DITA文档。 根据内容的不同,可以有.dita文件和.ditamap文件。

为了能够成功转换Word文档,您的文档应该结构良好。 例如,您的文档应该有一个标题,后跟标题1、标题2,依此类推。 每个标题中都应包含一些内容。 如果您的文档结构不正确,则该过程可能无法按预期运行。

默认情况下,AEM Guides使用Word到DITA (Word2DITA)转换框架。 此转换依赖于样式到标记的映射配置文件。 要成功使用Word2DITA转换,您必须考虑以下准则来准备Word文档进行转换:

NOTE
如果在默认样式到标记的映射配置文件中进行任何更改,则必须更新并使用确认已更新样式映射的准则。
  • 确保您的文档以标题开头;此标题已映射到DITA映射标题。 此外,标题后面必须跟一些常规内容。

  • 在标题之后,应该有标题1、标题2,依此类推。 每个标题中都必须有一些内容。 标题将转换为新的概念类型主题。 根据文档中的标题级别,生成的主题的层次结构是,例如,标题1位于标题2之前,标题2位于标题3内容之前。

  • 文档必须具有至少一个标题类型内容。

  • 确保您没有任何分组的图像。 如果文档中包含已分组的图像,请取消所有此类图像的分组。

  • 删除所有页眉和页脚。

  • 内联样式(如粗体、斜体和下划线)将转换为biu元素。

  • 所有已排序和未排序列表都转换为olul元素。 这也适用于嵌套列表、表格、注释或脚注中的列表。

  • 所有超链接都已转换为xref

  • 转换文件的文件名基于标题文本,后跟文件编号。 文件编号是基于标题文本在文档中的位置的连续数字。 例如,如果标题文本是“示例标题”,并且是文档中的第10个标题,则此主题的结果文件名将类似于Sample_Heading_10.dita。

执行以下步骤,将现有Word文档转换为DITA主题类型文档:

  1. 使用包管理器下载/libs/fmdita/config/w2d_io.xml文件。

  2. 自定义下载的w2d_io.xml文件。

  3. 在Cloud Manager Git存储库中的以下位置添加文件:

    /apps/fmdita/config/w2d_io.xml

    w2d_io.xml文件包含以下可配置参数:

    • inputDir元素中,指定可用源Word文档的输入文件夹的位置。 例如,如果您的Word文档存储在位于projects文件夹中名为wordtodita的文件夹中,则将位置指定为: /content/dam/projects/wordtodita/

    • outputDir元素中,指定输出文件夹的位置或保留默认输出位置以保存转换的DITA文档。 如果DAM上不存在指定的输出文件夹,则转换工作流将创建该输出文件夹。

    • 对于createRev元素,指定是否创建转换的DITA主题的新版本(true)(false)。

    • s2tMap元素中,指定映射文件的位置,该文件包含Word文档样式到DITA元素的映射。 默认映射存储在位于以下位置的文件中:

      code language-none
      /libs/fmdita/word2dita/word-builtin-styles-style2tagmap.xml
      
      note note
      NOTE
      有关word-builtin-styles-style2tagmap.xml文件的结构以及如何对其进行自定义的更多信息,请参阅​ DITA For Publishers用户指南 ​中的样式到标记映射
    • 在props2Propagate元素中,指定应传递到DITA映射的属性。 要将默认元数据(如dc:title、dc:subject、dam:keywords、dam:category)从文档元数据传递到已转换的DITA资源,需要此属性。

  4. 运行Cloud Manager管道以部署更新的配置。

  5. w2d_io.xml文件中配置所需参数后,登录AEM并打开Assets UI。

  6. 导航到输入文件夹位置(wordtodita)。

  7. 将源Word文档上传到此文件夹中。 有关在DAM上上传内容的信息,请参阅上传现有DITA内容

使用config /config块,您可以定义一个或多个转换配置块。 将执行转换工作流,并且以DITA主题形式的最终输出保存在outputDir元素中指定的位置。

现有用户的自定义更新

如果您是AEM Guidesas a Cloud Service的现有用户,并且正在从2021年8月版本升级到2022年1月或更高版本,请更新给定属性,因为只有少数文件已移动。

NOTE
此更新仅适用于已在使用Microsoft Word到DITA转换工作流的情况。
  • 文件路径: /apps/fmdita/config/w2d_io.xml
  • <s2tMap>的值从/apps/dxml/word2dita/word-builtin-styles-style2tagmap.xml更改为/libs/fmdita/word2dita/word-builtin-styles-style2tagmap.xml
  • 在Cloud Manager Git存储库中进行必要的更改,因为对于Cloud Service, /apps中的所有文件都将通过Cloud Manager Git进行覆盖。

迁移Adobe InDesign文档 id195AD0B0K5Z

AEM Guides允许您转换InDesign文档。 与FrameMaker类似,InDesign还允许您创建非结构化和结构化文档。 非结构化文档使用段落和字符样式来格式化内容。 结构化文档使用元素及其相应的属性。

转换过程需要将段落和字符样式格式映射到相关的DITA元素。 同样,对于结构化文档,映射文件将包含具有DITA元素和属性的InDesign元素和属性的一对一映射。

转换过程涉及后端中的以下操作:

  • InDesign标记语言 (IDML)文件已解压缩到工作目录。
  • 读取designmap.xml文件以定位各个InDesign剧本。
  • 所有故事都合并到一个XML实例中,“空”故事将被丢弃。
  • 所有嵌入式图形都将导出。
  • 将标准结构(如表和图形)预转换为DITA格式。
  • 根据映射文件映射到最终输出的样式或结构。
  • 创建和验证单个DITA主题和DITA映射文件。
  • 删除临时文件。

概括地说,转换过程要求您准备InDesign文件以进行转换 appendix.md#id195DBF0045Z准备映射文件以InDesign到DITA迁移 appendix.md#id194AF0003HT,然后您需要按照给定的过程运行转换过程。

执行以下步骤,将现有InDesign文档转换为DITA主题类型文档:

  1. 登录AEM并打开CRXDE Lite模式。

  2. 导航到以下位置提供的默认配置文件:

    /libs/fmdita/config/idml2dita_io.xml

  3. apps节点内创建config文件夹的覆盖节点。

  4. 导航到apps节点中可用的配置文件:

    /apps/fmdita/config/idml2dita_io.xml

    idml2dita_io.xml文件中配置以下参数:

    • inputDir元素中,指定源InDesign文档可用的输入文件夹的位置。 例如,如果您的InDesign文档存储在位于projects文件夹中名为indesigntodita的文件夹中,则将位置指定为: /content/dam/idmlfiles/indesigntodita/

    • outputDir元素中,指定输出文件夹的位置或保留默认输出位置以保存转换的DITA文档。 如果DAM上不存在指定的输出文件夹,则转换工作流将创建该输出文件夹。

    • mapStyle元素中,指定映射文件的位置,该文件包含用于InDesign文档样式到DITA元素的映射。 默认映射存储在位于以下位置的文件中:

      code language-none
      /stmap.adobeidml.xml
      
      note note
      NOTE
      有关stmap.adobeidml.xml文件的结构以及如何对其进行自定义的更多信息,请参阅附录中的appendix.md#id194AF0003HT部分。
  5. 保存 idml2dita_io.xml 文件。

  6. idml2dita_io.xml文件中配置所需参数后,登录AEM并打开Assets UI。

  7. 导航到输入文件夹位置(indesigntodita)。

  8. 将源InDesign文档上载到此文件夹。 有关在DAM上上传内容的信息,请参阅上传现有DITA内容

迁移XHTML文档 id1949B04L0Y4

AEM Guides允许您将现有XHTML文档转换为DITA主题类型文档。 您需要指定输入和输出文件夹位置以及其他参数,文档将转换为DITA格式。 可以使用两种方法来转换结构化HTML文档:

  • 将所有文档上载到输入文件夹,或
  • 创建包含所有文档以及媒体文件的ZIP文件,并将其上载到输入文件夹中。 这种方法通常用于一组相互链接的HTML文件,这些文件有一个目录(index.html)。 index.html文件包含指向集合中所有HTML文件的链接。

无论您是单独上传所有文件,还是以ZIP格式捆绑上传所有文件,转换过程都会在HTML文件和生成的DITA文件之间创建一对一映射。 这基本上意味着为输入文件夹中的每个.html文件创建了一个.dita文件。

在ZIP文件中上传文档时必须考虑以下几点:

  • 所有引用的主题都应放在ZIP文件中。

  • 所有被引用的介质文件应使用相对链接在主题文件中被引用。

  • 创建一个index.html文件,并添加指向要在目录中添加的主题的链接。 此index.html文件用于创建DITA映射文件。 在index.html文件中,还可以创建嵌套主题列表,如以下代码示例中所示:

    code language-none
    <?xml version="1.0" encoding="UTF-8"?>
    <html
    xmlns="http://www.w3.org/1999/xhtml">
        <head>
            <title>Sample Index File</title>
        </head>
        <body>
            <h1>Sample Index</h1>
            <div class="content">
                <ul class="book">
                    <li class="topicref">
                        <a href="Topic1.html">Topic 1</a>
                        <ul class="book">
                            <li class="topicref">
                                <a href="Topic1-1.html">Topic 1.1</a>
                            </li>
                            <li class="topicref">
                                <a href="Topic1-2.html">Topic 1.2</a>
                            </li>
                        </ul>
                    </li>
                    <li class="topicref">
                        <a href="Topic2.html">Topic 2</a>
                    </li>
                </ul>
            </div>
        </body>
    </html>
    

    请注意,每个ul标记都必须将class属性设置为book。 同样,必须将每个li标记的class设置为topicref

  • 如果使用内联样式,则在XHTML文件中将内联样式转换为基于CSS的样式类。 然后,使用样式属性映射将这些基于类的样式转换为转换后的DITA文件中的DITA outputclass属性。

    从这些DITA文件生成HTML或AEM Site输出时,outputclass属性可用于对生成的HTML或AEM Site应用样式类,以匹配源HTML内容。

除了创建ZIP文件的注意事项外,您的XHTML文档还必须结构良好。 例如,您的文档应该有一个​ 标题,后面应该有​ 标题1标题2,依此类推。 每个标题中都应包含一些内容。 如果您的文档结构不正确,迁移过程可能无法按预期进行。

要将现有XHTML文档转换为DITA主题,请执行以下步骤:

  1. 使用包管理器下载/libs/fmdita/config/h2d_io.xml文件。

  2. 自定义下载的h2d_io.xml文件。

  3. 在Cloud Manager Git存储库中的以下位置添加文件:

    /apps/fmdita/config/h2d_io.xml

    h2d_io.xml文件包含以下可配置参数:

    • inputDir元素中,指定可用源XHTML文档的输入文件夹的位置。 例如,如果您的XHTML文档存储在projects文件夹中名为xhtmltodita的文件夹中,则将位置指定为: /content/dam/projects/xhtmltodita/

    • outputDir元素中,指定输出文件夹的位置或保留默认输出位置。 如果DAM上不存在指定的输出文件夹,则转换工作流将创建该输出文件夹。

    • 对于createRev元素,指定是否创建转换的DITA主题的新版本(true)(false)。

  4. 运行Cloud Manager管道以部署更新的配置。

  5. w2d_io.xml文件中配置所需参数后,登录AEM并打开Assets UI。

  6. \(可选\) ​您还可以将相关链接部分添加到转换后的文档。 要启用此功能,请执行以下步骤:

    note note
    NOTE
    默认情况下,转换后的文档中不会创建相关链接部分。
    1. 使用包管理器下载/libs/fmdita/html2dita/h2d.xsl文件。

    2. 搜索以下参数:

      <xsl:param name="generate-related-links" select="false()"/>

    3. 将上述参数的值设置为true()

    4. 在Cloud Manager Git存储库中的以下位置提交更新的文件:

      /libs/fmdita/html2dita/

    5. 运行Cloud Manager管道以部署更新的配置。

  7. 导航到输入文件夹位置(xhtmltodita)。

  8. 将源XHTML文档上传到此文件夹中。 有关在DAM上上传内容的信息,请参阅上传现有DITA内容

使用<config> </config>块,您可以定义一个或多个转换配置块。 将执行转换工作流,并且以DITA主题形式的最终输出保存在outputDir元素中指定的位置。

迁移非结构化FrameMaker文档 id1949B050VUI

AEM Guides允许您将现有的非结构化FrameMaker\(.fm.book\)文档转换为DITA文档。 第一步是使用FrameMaker创建样式映射,并将这些设置保存在.sts文件中。 接下来,如果您使用的是自定义DITA,则可以将自定义元素与ditaElems.xml文件中的源FrameMaker格式进行映射。 例如,如果您创建了一个名为impnote的自定义元素来处理所有重要注释,则可以在ditaElems.xml文件中定义此自定义元素。 定义此自定义元素后,在转换包含impnote元素的FrameMaker文档时,AEM Guides不会引发错误。

此外,如果要使用自定义或有效的DITA元素指定一些其他属性,可以在style2attrMap.xml文件中定义这些属性。 例如,您可以指定要通过impnote元素传递的值为importanttype属性。 可以在style2attrMap.xml文件中指定此附加信息。

除了指定

要将现有的非结构化FrameMaker文档转换为DITA格式,请执行以下步骤:

  1. 在FrameMaker中创建样式映射,并将这些设置保存在.sts文件中。

  2. 使用包管理器下载/libs/fmdita/config/ditaElems.xml文件。

  3. 如果您有自定义DITA元素,请在位于以下位置的ditaElems.xml文件中定义这些元素:

    /libs/fmdita/config/ditaElems.xml

  4. 在Cloud Manager的Git存储库中的以下位置创建ditaElems.xml文件的副本:

    /apps/fmdita/config/ditaElems.xml

  5. 导航到apps节点中可用的配置文件:

    /apps/fmdita/config/ditaElems.xml

    ditaElems.xml文件包含单个可配置参数:

    • elem参数中,指定要在转换的DITA文档中使用的自定义元素的名称。 此元素将像在生成的DITA文档中一样传递。
  6. 如果要指定其他属性,请在位于以下位置的style2attrMap.xml文件中定义这些属性:

    /libs/fmdita/config/style2attrMap.xml

  7. apps节点内创建config文件夹的覆盖节点。

  8. 导航到apps节点中可用的配置文件:

    /apps/fmdita/config/style2attrMap.xml

    style2attrMap.xml文件包含以下可配置参数:

    • fmStyle参数中,指定要映射的FrameMaker文档中使用的源格式。

    • ditaAttr元素中,指定要使用源格式映射的DITA属性。

    • ditaVal元素中,指定映射属性的值。 如果您没有任何值,则可以将此条目留空。

  9. 保存 style2attrMap.xml 文件。

  10. style2attrMap.xml文件中配置所需参数后,登录AEM并打开Assets UI。

  11. 导航到要转换的FrameMaker文档并单击该文档。

    此时将显示DITA映射控制台,其中显示了可用于生成输出的输出预设列表。

  12. 选择DITA输出格式并配置所需的参数。

    note note
    NOTE
    必须使用您在FrameMaker中创建的相同设置文件(.sts)。 另外,指定设置名称和目标路径。
  13. 单击​ 生成 ​图标以启动输出生成进程。

使用<attrMap> </attrMap>块,您可以定义一个或多个转换配置块。 根据内容的不同,可以将.dita文件和.ditamap文件作为转换后的文件。

迁移任何其他结构化文档 id1949B0590YK

AEM Guides允许您将现有结构化文档转换为有效的DITA文档。 您需要指定输入和输出文件夹位置、转换文件的位置、保存最终输出的扩展名以及是否需要文档的新版本。

要将现有结构化文档转换为DITA格式,请执行以下步骤:

  1. 使用包管理器下载/libs/fmdita/config/XSLConfig.xml文件。

  2. 在Cloud Manager Git存储库中的以下位置创建XSLConfig.xml文件的副本:

    /apps/fmdita/config/XSLConfig.xml

    XSLConfig.xml文件包含以下可配置参数:

    • inputDir元素中,指定输入文件夹中可用源结构化文档的位置。 例如,如果您的结构化文档存储在projects文件夹中名为xsltodita的文件夹中,则将位置指定为: /content/dam/projects/xsltodita/

    • outputDir元素中,指定输出文件夹的位置或保留默认输出位置。 如果DAM上不存在指定的输出文件夹,则转换工作流将创建该输出文件夹。

    • xslFolder元素中,指定存储XSL转换文件的文件夹的位置。

    • xslPath元素中,指定用于启动转换过程的主.XSL文件的位置。

    • outputExt元素中,指定从转换流创建的最终输出文件的文件扩展名。

    • 对于createRev元素,指定是否创建转换的DITA主题的新版本(true)(false)。

  3. 保存 XSLConfig.xml 文件。

  4. XSLConfig.xml文件中配置所需参数后,登录AEM并打开Assets UI。

  5. 导航到输入文件夹位置(xsltodita)。

  6. 将源结构化文档上传到此文件夹中。 有关在DAM上上传内容的信息,请参阅上传现有DITA内容

使用<config> </config>块,您可以定义一个或多个转换配置块。 将执行转换工作流,并且以DITA主题形式的最终输出保存在outputDir元素中指定的位置。

父主题:​迁移现有内容

recommendation-more-help
11125c99-e1a1-4369-b5d7-fb3098b9b178