迁移非DITA内容 id181AH0R02HT
本节将指导您完成将非DITA文档迁移到DITA格式的迁移过程。 AEM Guides提供了从以下源进行的迁移:
迁移Microsoft Word文档 id1949B040Z5Z
AEM Guides允许您将现有Word文档(.docx)迁移到DITA主题类型文档。 您需要指定输入和输出文件夹位置以及其他参数,文档将被转换为DITA文档。 根据内容的不同,可以有.dita文件和.ditamap文件。
为了能够成功转换Word文档,您的文档应该结构良好。 例如,您的文档应该有一个标题,后跟标题1、标题2,依此类推。 每个标题中都应包含一些内容。 如果您的文档结构不正确,则该过程可能无法按预期运行。
默认情况下,AEM Guides使用Word到DITA (Word2DITA)转换框架。 此转换依赖于样式到标记的映射配置文件。 要成功使用Word2DITA转换,您必须考虑以下准则来准备Word文档进行转换:
-
确保您的文档以标题开头;此标题已映射到DITA映射标题。 此外,标题后面必须跟一些常规内容。
-
在标题之后,应该有标题1、标题2,依此类推。 每个标题中都必须有一些内容。 标题将转换为新的概念类型主题。 根据文档中的标题级别,生成的主题的层次结构是,例如,标题1位于标题2之前,标题2位于标题3内容之前。
-
文档必须具有至少一个标题类型内容。
-
确保您没有任何分组的图像。 如果文档中包含已分组的图像,请取消所有此类图像的分组。
-
删除所有页眉和页脚。
-
内联样式(如粗体、斜体和下划线)将转换为
b、i和u元素。 -
所有已排序和未排序列表都转换为
ol和ul元素。 这也适用于嵌套列表、表格、注释或脚注中的列表。 -
所有超链接都已转换为
xref。 -
转换文件的文件名基于标题文本,后跟文件编号。 文件编号是基于标题文本在文档中的位置的连续数字。 例如,如果标题文本是“示例标题”,并且是文档中的第10个标题,则此主题的结果文件名将类似于Sample_Heading_10.dita。
执行以下步骤,将现有Word文档转换为DITA主题类型文档:
-
登录AEM并打开CRXDE Lite模式。
-
导航到以下位置提供的默认配置文件:
/libs/fmdita/config/w2d_io.xml -
在
config节点内创建apps文件夹的覆盖节点。 -
导航到
apps节点中可用的配置文件:/apps/fmdita/config/w2d_io.xmlw2d_io.xml文件包含以下可配置参数:-
在
inputDir元素中,指定可用源Word文档的输入文件夹的位置。 例如,如果您的Word文档存储在位于wordtodita文件夹中名为projects的文件夹中,则将位置指定为:/content/dam/projects/wordtodita/ -
在
outputDir元素中,指定输出文件夹的位置或保留默认输出位置以保存转换的DITA文档。 如果DAM上不存在指定的输出文件夹,则转换工作流将创建该输出文件夹。 -
对于
createRev元素,指定是否创建转换的DITA主题的新版本(true)(false)。 -
在
s2tMap元素中,指定映射文件的位置,该文件包含Word文档样式到DITA元素的映射。 默认映射存储在位于以下位置的文件中:code language-xml /libs/fmdita/word2dita/word-builtin-styles-style2tagmap.xmlnote note NOTE 有关 word-builtin-styles-style2tagmap.xml文件的结构以及如何对其进行自定义的更多信息,请参阅DITA For Publishers用户指南中的样式到标记映射。 -
在props2Propagate元素中,指定应传递到DITA映射的属性。 此属性需要将默认元数据(如dc:title、dc:subject、dam:keywords、dam:category)从文档元数据传递到转换的DITA资产。
-
-
保存
w2d_io.xml文件。 -
在
w2d_io.xml文件中配置所需的参数后,登录到AEM并打开Assets UI。 -
导航到输入文件夹位置(
wordtodita)。 -
将源Word文档上传到此文件夹中。 有关在DAM上上传内容的信息,请参阅上传现有DITA内容。
使用config /config块,您可以定义一个或多个转换配置块。 将执行转换工作流,并且以DITA主题形式的最终输出保存在outputDir元素中指定的位置。
迁移Adobe InDesign文档 id195AD0B0K5Z
AEM Guides允许您转换InDesign文档。 与FrameMaker类似,InDesign还允许您创建非结构化和结构化文档。 非结构化文档使用段落和字符样式来格式化内容。 结构化文档使用元素及其相应的属性。
转换过程需要将段落和字符样式格式映射到相关的DITA元素。 同样,对于结构化文档,映射文件将包含具有DITA元素和属性的InDesign元素和属性的一对一映射。
转换过程涉及后端中的以下操作:
- InDesign标记语言 (IDML)文件已解压缩到工作目录中。
- 读取designmap.xml文件以查找各个InDesign故事。
- 所有故事都合并到一个XML实例中,“空”故事将被丢弃。
- 所有嵌入式图形都将导出。
- 将标准结构(如表和图形)预转换为DITA格式。
- 根据映射文件映射到最终输出的样式或结构。
- 创建和验证单个DITA主题和DITA映射文件。
- 删除临时文件。
概括地说,转换过程要求您准备InDesign文件进行转换和准备映射文件以进行InDesign到DITA的迁移,然后您需要按照给定的过程运行转换过程。
执行以下步骤,将现有InDesign文档转换为DITA主题类型文档:
-
登录AEM并打开CRXDE Lite模式。
-
导航到以下位置提供的默认配置文件:
/libs/fmdita/config/idml2dita_io.xml -
若要根据您的要求创建自定义配置,请在
config节点内创建apps文件夹的覆盖节点。 -
将以下文件或文件夹从
libs文件夹复制到apps文件夹:/fmdita/config/idml2dita_io.xml/fmdita/idml2dita/config/fmdita/idml2dita/xsl
-
导航到
apps节点中可用的配置文件:/apps/fmdita/config/idml2dita_io.xml -
在
idml12dita文件中添加idml2dita_io.xml文件夹中存在的配置的映射。 -
在
idml2dita_io.xml文件中添加以下属性:code language-none <entry key="idml2DitaConfig">/apps/fmdita/idml2dita/config</entry> <entry key="idml2DitaXsl">/apps/fmdita/idml2dita/xsl</entry>
在idml2dita_io.xml文件中配置以下参数:
-
在
inputDir元素中,指定可在其中使用源InDesign文档的输入文件夹的位置。 例如,如果您的InDesign文档存储在indesigntodita文件夹中名为projects的文件夹中,则将位置指定为:/content/dam/idmlfiles/indesigntodita/ -
在
outputDir元素中,指定输出文件夹的位置或保留默认输出位置以保存转换的DITA文档。 如果DAM上不存在指定的输出文件夹,则转换工作流将创建该输出文件夹。 -
在
mapStyle元素中,指定映射文件的位置,该文件包含InDesign文档样式到DITA元素的映射。 默认映射存储在位于以下位置的文件中:
/stmap.adobeidml.xml
stmap.adobeidml.xml文件的结构以及如何对其进行自定义的更多信息,请参阅附录中的 准备映射文件以用于InDesign到DITA的迁移 部分。-
保存
idml2dita_io.xml文件。 -
在
idml2dita_io.xml文件中配置所需的参数后,登录到AEM并打开Assets UI。 -
导航到输入文件夹位置(
indesigntodita)。 -
将源InDesign文档上传到此文件夹中。 有关在DAM上上传内容的信息,请参阅上传现有DITA内容。
迁移XHTML文档 id1949B04L0Y4
AEM Guides允许您将现有XHTML文档转换为DITA主题类型文档。 您需要指定输入和输出文件夹位置以及其他参数,文档将转换为DITA格式。 可以使用以下两种方法转换结构化HTML文档:
- 将所有文档上载到输入文件夹,或
- 创建包含所有文档以及媒体文件的ZIP文件,并将其上载到输入文件夹中。 这种方法通常用于一组相互链接的HTML文件,这些文件有一个目录(index.html)。 index.html文件包含指向集合中所有HTML文件的链接。
无论您是单独上传所有文件,还是以ZIP格式捆绑上传所有文件,转换过程都会在HTML文件与生成的DITA文件之间创建一对一映射。 这基本上意味着为输入文件夹中的每个.html文件创建了一个.dita文件。
在ZIP文件中上传文档时必须考虑以下几点:
-
所有引用的主题都应放在ZIP文件中。
-
所有被引用的介质文件应使用相对链接在主题文件中被引用。
-
创建一个index.html文件,并添加指向要在目录中添加的主题的链接。 此index.html文件用于创建DITA映射文件。 在index.html文件中,还可以创建嵌套主题列表,如以下代码示例中所示:
code language-xml <?xml version="1.0" encoding="UTF-8"?> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>Sample Index File</title> </head> <body> <h1>Sample Index</h1> <div class="content"> <ul class="book"> <li class="topicref"> <a href="Topic1.html">Topic 1</a> <ul class="book"> <li class="topicref"> <a href="Topic1-1.html">Topic 1.1</a> </li> <li class="topicref"> <a href="Topic1-2.html">Topic 1.2</a> </li> </ul> </li> <li class="topicref"> <a href="Topic2.html">Topic 2</a> </li> </ul> </div> </body> </html>请注意,每个
ul标记都必须将class属性设置为book。 同样,必须将每个li标记的class设置为topicref。 -
如果使用内联样式,则在XHTML文件中将内联样式转换为基于CSS的样式类。 然后,使用样式属性映射将这些基于类的样式转换为转换后的DITA文件中的DITA
outputclass属性。从这些DITA文件生成HTML或AEM站点输出时,
outputclass属性可用于对生成的HTML或AEM站点应用样式类,以匹配源HTML内容。
除了创建ZIP文件的注意事项外,您的XHTML文档还必须结构良好。 例如,您的文档应该有一个标题,后面应该有标题1、标题2,依此类推。 每个标题中都应包含一些内容。 如果您的文档结构不正确,迁移过程可能无法按预期进行。
要将现有XHTML文档转换为DITA主题,请执行以下步骤:
-
登录AEM并打开CRXDE Lite模式。
-
导航到以下位置提供的默认配置文件:
/libs/fmdita/config/h2d_io.xml -
在
config节点内创建apps文件夹的覆盖节点。 -
导航到
apps节点中可用的配置文件:/apps/fmdita/config/h2d_io.xmlh2d_io.xml文件包含以下可配置参数:-
在
inputDir元素中,指定可用源XHTML文档的输入文件夹的位置。 例如,如果您的XHTML文档存储在xhtmltodita文件夹中名为projects的文件夹中,则将位置指定为:/content/dam/projects/xhtmltodita/ -
在
outputDir元素中,指定输出文件夹的位置或保留默认输出位置。 如果DAM上不存在指定的输出文件夹,则转换工作流将创建该输出文件夹。 -
对于
createRev元素,指定是否创建转换的DITA主题的新版本(true)(false)。
-
-
保存
h2d_io.xml文件。 -
在
h2d_io.xml文件中配置所需的参数后,登录到AEM并打开Assets UI。 -
\(可选\)您还可以将相关链接部分添加到转换后的文档。 要启用此功能,请执行以下步骤:
note note NOTE 默认情况下,转换后的文档中不会创建相关链接部分。 -
导航到位于以下位置的h2d.xsl文件:
/libs/fmdita/html2dita/
-
搜索以下参数:
<xsl:param name="generate-related-links" select="false()"/> -
将上述参数的值设置为
true()。 -
保存并关闭该文件。
-
-
导航到输入文件夹位置(
xhtmltodita)。 -
将源XHTML文档上传到此文件夹中。 有关在DAM上上传内容的信息,请参阅上传现有DITA内容。
使用<config> </config>块,您可以定义一个或多个转换配置块。 将执行转换工作流,并且以DITA主题形式的最终输出保存在outputDir元素中指定的位置。
迁移非结构化FrameMaker文档 id1949B050VUI
要将非结构化Adobe FrameMaker内容(.fm和.book)转换为结构化DITA,您可以使用FrameMaker的转换表机制。 此过程侧重于使用基于模板的方法评估现有内容,以及通过转化表将FrameMaker样式映射到DITA。 有关更多详细信息,请查看在Adobe FrameMaker中将技术文档从非结构化迁移到DITA。
转换后,结构化内容可迁移到AEM Guides中。 有关更多详细信息,请查看上载现有DITA内容。
迁移任何其他结构化文档 id1949B0590YK
AEM Guides允许您将现有结构化文档转换为有效的DITA文档。 您需要指定输入和输出文件夹位置、转换文件的位置、保存最终输出的扩展名以及是否需要文档的新版本。
要将现有结构化文档转换为DITA格式,请执行以下步骤:
-
登录AEM并打开CRXDE Lite模式。
-
导航到以下位置提供的默认配置文件:
/libs/fmdita/config/XSLConfig.xml -
在
config节点内创建apps文件夹的覆盖节点。 -
导航到
apps节点中可用的配置文件:/apps/fmdita/config/XSLConfig.xmlXSLConfig.xml文件包含以下可配置参数:-
在
inputDir元素中,指定输入文件夹中可用源结构化文档的位置。 例如,如果您的结构化文档存储在xsltodita文件夹中名为projects的文件夹中,则将位置指定为:/content/dam/projects/xsltodita/ -
在
outputDir元素中,指定输出文件夹的位置或保留默认输出位置。 如果DAM上不存在指定的输出文件夹,则转换工作流将创建该输出文件夹。 -
在
xslFolder元素中,指定存储XSL转换文件的文件夹的位置。 -
在
xslPath元素中,指定用于启动转换过程的主.XSL文件的位置。 -
在
outputExt元素中,指定从转换流创建的最终输出文件的文件扩展名。 -
对于
createRev元素,指定是否创建转换的DITA主题的新版本(true)(false)。
-
-
保存
XSLConfig.xml文件。 -
在
XSLConfig.xml文件中配置所需的参数后,登录到AEM并打开Assets UI。 -
导航到输入文件夹位置(
xsltodita)。 -
将源结构化文档上传到此文件夹中。 有关在DAM上上传内容的信息,请参阅上传现有DITA内容。
使用<config> </config>块,您可以定义一个或多个转换配置块。 将执行转换工作流,并且以DITA主题形式的最终输出保存在outputDir元素中指定的位置。
父主题:迁移现有内容