“SegmentNotFoundException 和 IllegalArgumentException”

运行脱机压缩可能会失败,出现​ SegmentNotFoundException ​或​ IllegalArgumentException。 本文讨论如何解决错误并成功完成离线压缩。 但是,在继续之前,请对存储库执行完整备份。

描述 description

环境

Adobe Experience Manager (AEM)

问题

方案1
当存储库存在完整性问题时,运行离线压缩可能会失败并出现 SegmentNotFoundException

您在AEM日志文件中观察到​ SegmentNotFoundException,并且AEM未按预期工作。

方案2

当存储库存在完整性问题时,运行离线压缩可能会失败,并出现​ SegmentNotFoundException

与日志中显示的栈栈跟踪类似:

13:51:21.523 [ main]  ERROR o.a.j.o.p.segment.SegmentTracker - Segment not found: 4d139bc4-150c-4f0a-b82a-4867593098a. Creation date delta is 4 ms.
org.apache.jackrabbit.oak.plugins.segment.SegmentNotFoundException: Segment 4d139bc4-150c-4f0a-b82a-4867593098a not found
at org.apache.jackrabbit.oak.plugins.segment.file.FileStore.readSegment(FileStore.java:855) [ oak-run-1.0.22.jar:1.0.22]
at org.apache.jackrabbit.oak.plugins.segment.SegmentTracker.getSegment(SegmentTracker.java:134) ~[ oak-run-1.0.22.jar:1.0.22]
at org.apache.jackrabbit.oak.plugins.segment.SegmentId.getSegment(SegmentId.java:101) [ oak-run-1.0.22.jar:1.0.22]
...
Exception in thread "main" org.apache.jackrabbit.oak.plugins.segment.SegmentNotFoundException: Segment 4d139bc4-150c-4f0a-b82a-4867593098a not found
at org.apache.jackrabbit.oak.plugins.segment.file.FileStore.readSegment(FileStore.java:855)
at org.apache.jackrabbit.oak.plugins.segment.SegmentTracker.getSegment(SegmentTracker.java:134)
at org.apache.jackrabbit.oak.plugins.segment.SegmentId.getSegment(SegmentId.java:101)
...

方案3

当存储库存在完整性问题时,运行离线压缩可能会失败并出现​ IllegalArgument ​异常。

与日志中显示的栈栈跟踪类似:

java.lang.IllegalArgumentException
at com.google.common.base.Preconditions.checkArgument(Preconditions.java:77)
at org.apache.jackrabbit.oak.plugins.segment.ListRecord.(ListRecord.java:41)
at org.apache.jackrabbit.oak.plugins.segment.ListRecord.getEntry(ListRecord.java:64)
at org.apache.jackrabbit.oak.plugins.segment.ListRecord.getEntries(ListRecord.java:81)
at org.apache.jackrabbit.oak.plugins.segment.SegmentStream.read(SegmentStream.java:153)
at org.apache.jackrabbit.oak.commons.IOUtils.readFully(IOUtils.java:53)
at org.apache.jackrabbit.oak.plugins.segment.Compactor.getBlobKey(Compactor.java:412)
at org.apache.jackrabbit.oak.plugins.segment.Compactor.compact(Compactor.java:362)
at org.apache.jackrabbit.oak.plugins.segment.Compactor.compact(Compactor.java:321)
at org.apache.jackrabbit.oak.plugins.segment.Compactor.access$500(Compactor.java:54)
at org.apache.jackrabbit.oak.plugins.segment.Compactor$CompactDiff.propertyAdded(Compactor.java:227)
at org.apache.jackrabbit.oak.plugins.segment.CancelableDiff.propertyAdded(CancelableDiff.java:47)
at org.apache.jackrabbit.oak.plugins.memory.EmptyNodeState.compareAgainstEmptyState(EmptyNodeState.java:156)
at org.apache.jackrabbit.oak.plugins.segment.SegmentNodeState.compareAgainstBaseState(SegmentNodeState.java:434)
at org.apache.jackrabbit.oak.plugins.segment.Compactor$CompactDiff.diff(Compactor.java:214)
at org.apache.jackrabbit.oak.plugins.segment.Compactor$CompactDiff.childNodeAdded(Compactor.java:263)
at org.apache.jackrabbit.oak.plugins.segment.CancelableDiff.childNodeAdded(CancelableDiff.java:74)
at org.apache.jackrabbit.oak.plugins.memory.EmptyNodeState.compareAgainstEmptyState(EmptyNodeState.java:161)
at org.apache.jackrabbit.oak.plugins.segment.SegmentNodeState.compareAgainstBaseState(SegmentNodeState.java:434)
at org.apache.jackrabbit.oak.plugins.segment.Compactor$CompactDiff. diff (Compactor.java:214)
at org.apache.jackrabbit.oak.plugins.segment.Compactor$CompactDiff.childNodeAdded(Compactor.java:263)
at org.apache.jackrabbit.oak.plugins.segment.CancelableDiff.childNodeAdded(CancelableDiff.java:74)
at org.apache.jackrabbit.oak.plugins.memory.EmptyNodeState.compareAgainstEmptyState(EmptyNodeState.java:161)
at org.apache.jackrabbit.oak.plugins.segment.SegmentNodeState.compareAgainstBaseState(SegmentNodeState.java:434)
at org.apache.jackrabbit.oak.plugins.segment.Compactor$CompactDiff. diff (Compactor.java:214)
at org.apache.jackrabbit.oak.plugins.segment.Compactor$CompactDiff.childNodeAdded(Compactor.java:263)
at org.apache.jackrabbit.oak.plugins.segment.CancelableDiff.childNodeAdded(CancelableDiff.java:74)
at org.apache.jackrabbit.oak.plugins.memory.EmptyNodeState.compareAgainstEmptyState(EmptyNodeState.java:161)
at org.apache.jackrabbit.oak.plugins.segment.SegmentNodeState.compareAgainstBaseState(SegmentNodeState.java:434)
at org.apache.jackrabbit.oak.plugins.segment.Compactor$CompactDiff. diff (Compactor.java:214)
at org.apache.jackrabbit.oak.plugins.segment.Compactor$CompactDiff.childNodeAdded(Compactor.java:263)
at org.apache.jackrabbit.oak.plugins.segment.CancelableDiff.childNodeAdded(CancelableDiff.java:74)

分辨率 resolution

我们可以遵循多种程序来解决这种情况并成功完成离线压缩。

重要的: ​在执行以下步骤之前,请对存储库执行完整备份。

A. 恢复到区段存储的最后一个已知良好修订。

oak-run的检查运行模式可用于确定区段存储的最后一个已知良好修订。
这可用于手动将损坏的区段存储恢复为其最新的良好修订。

*警告:*此过程会将系统中的数据回滚到之前的时间点。
如果您希望避免丢失系统中的更改,则可以尝试下面的 选项B

要执行检查和恢复,请执行以下步骤:

  1. 从这里https://repo1.maven.org/maven2/org/apache/jackrabbit/oak-run/下载oak-run jar文件。

  2. 停止 AEM。

  3. 运行此命令:

    java -jar oak-run-*.jar check --bin=-1 crx-quickstart/repository/segmentstore/

    此命令向后搜索修订,直到找到一致的修订:

    14:00:30.783 [ main] INFO  o.a.j.o.p.s.f.t.ConsistencyChecker - Found latest good revision afdb922d-ba53-4a1b-aa1b-1cb044b535cf:234880

    (如果ConsistencyChecker失败,请转到下一部分。)

  4. 通过编辑将存储库恢复到此版本:

    /crx-quickstart/repository/segmentstore/journal.log

    删除包含最新良好修订的行之后的所有行。

    如果您想了解将存储库还原到的日期和时间,请在segmentstore文件夹中运行此命令(将​ afdb922d-ba53-4a1b-aa1b-1cb044b535cf ​替换为journal.log中的最新良好修订):

    find . -type f -name "data*.tar" -exec sh -c "tar -tvf {} |grep afdb922d-ba53-4a1b-aa1b-1cb044b535cf" \; -print

    输出将显示该修订的大致日期和时间。

  5. 移除全部 ./crx-quickstart/repository/segmentstore/*.bak files.

  6. 如果使用AEM 6.0,则下载与AEM中安装的内容相匹配的oak-run版本以完成其余步骤。

    从这里https://repo1.maven.org/maven2/org/apache/jackrabbit/oak-run/下载。

  7. 运行 检查点清理 以删除孤立的检查点:

    java -jar oak-run-*.jar checkpoints ./crx-quickstart/repository/segmentstore rm-unreferenced

  8. 最后,压缩存储库:

    java -jar oak-run-*.jar compact ./crx-quickstart/repository/segmentstore/

B. 手动移除损坏的节点。

在 AEM 中,对于没有配置 FileDatastore 的 TarMK 设置以及二进制文件中存在损坏的情况,您可以执行以下操作。

*注意:*以下步骤适用于超级用户。
删除损坏的节点时,您需要确保它们不是系统节点(例如/home/jcr:system等)。
或者,如果它们是系统节点,那么您需要确保可以恢复它们。
如果您不确定,请咨询AEM客户关怀团队以获得此处记录的步骤的帮助。

  1. 停止 AEM。

  2. 使用Oak运行控制台并加载childCount groovy脚本来识别区段存储中的损坏节点:

    加载 oak-run 控制台外壳:

    java -jar oak-run-*.jar console crx-quickstart/repository/segmentstore

    在外壳中运行以下两个命令来加载脚本并运行它:

    :load

    https://gist.githubusercontent.com/stillalex/e7067bcb86c89bef66c8/raw/d7a5a9b839c3bb0ae5840252022f871fd38374d3/childCount.groovy

    countNodes(session.workingNode)

    这将导致以下输出指示损坏节点的路径:

    21:21:42.029 [ main] ERROR o.a.j.o.p.segment.SegmentTracker - Segment not found: 63ae05a4-b506-445c-baa2-cfa1b13b6e2f. Creation date delta is 3 ms.

    warning unable to read node /content/dam/test.txt/jcr:content/renditions/original/jcr:content

    在某些情况下,该问题与二进制属性有关,并且childCount groovy脚本无法找到任何损坏的节点。

    在这些情况下,您可以使用以下命令代替,它将读取遍历期间遇到的每个二进制文件的前1024个字节(请注意,此命令会较慢,并且仅当上述命令未返回预期结果时才应使用):

    countNodes(session.workingNode,true)

  3. 使用rmNodes.groovy删除最后一个命令输出中列出的所有已识别损坏节点。

    加载 oak-run 控制台外壳:

    java -jar oak-run-*.jar console crx-quickstart/repository/segmentstore

    加载 groovy 脚本:

    :load

    https://gist.githubusercontent.com/stillalex/43c49af065e3dd1fd5bf/raw/9e726a59f75b46e7b474f7ac763b0888d5a3f0c3/rmNode.groovy

    运行 rmNode 命令移除损坏的节点,通过带有您需要移除的损坏节点的路径替换 /path/to/corrupt/node

    rmNode(session, "/path/to/corrupt/node")

    其中损坏的节点路径为步骤2中获得的路径,例如: /content/dam/test.txt/jcr:content/renditions/original/jcr:content/
    注意:使用oak-run.jar版本1.6.13及更高版本时,如果遇到以下错误,请设置--read-write JVM参数:

    code language-none
    /> rmNode(session,"/path/to/corrupt/node")
    Removing node /path/to/corrupt/node
    ERROR java.lang.UnsupportedOperationException:
    Cannot write to read-only store
    at org.apache.jackrabbit.oak.segment.SegmentWriterBuilder$1.execute (SegmentWriterBuilder.java:171)
    at org.apache.jackrabbit.oak.segment.SegmentWriter.writeNode (SegmentWriter.java:318)
    at org.apache.jackrabbit.oak.segment.SegmentNodeBuilder.getNodeState (SegmentNodeBuilder.java:111)
    at org.apache.jackrabbit.oak.segment.SegmentNodeStore$Commit.<init> (SegmentNodeStore.java:581)
    at org.apache.jackrabbit.oak.segment.SegmentNodeStore.merge (SegmentNodeStore.java:333)
    at org.apache.jackrabbit.oak.spi.state.NodeStore$merge.call (Unknown Source)
    at groovysh_evaluate.rmNode (groovysh_evaluate:11)
    
  4. 针对步骤 2 中找到的所有节点,请重复步骤 3。

    以上 rmNode 命令应该为损坏路径返回 true,这意味着该命令删除了此损坏路径。

    通过在这些路径上重新运行rmNode命令,确保删除这些找到的三个损坏路径。

    对于下一次运行,它应返回false

    如果您仍然看到存储库中存在相同的路径,则使用修补版本的oak-run jar  (即​ oak-run-1.2.18-NPR-17596)。

    oak-run jar的补丁版本有什么功能?

    此版本的jar在压缩时跳过不可读的二进制文件,将它们替换为0字节二进制文件并记录异常和syserr的路径。

    这样压缩的存储库应该会通过oak-run检查、节点计数脚本,并且您还应该能够使用未打补丁的oak-run再次压缩它。

  5. 通过使用以下列出检查点来执行检查点清理。

    如果有多个检查点,则清理它们:

    nohup java -Xmx4096m -jar oak-run-1.2.18.jar checkpoints /app/AEM6/author/crx-quickstart/repository/segmentstore rm-all>>nohup.out &

  6. 运行离线压缩。

    如果您不知道如何运行离线压缩,请参阅GitHub Gist上的Oak离线压缩说明

  7. 启动服务器并等待索引完成。

原因
如果在压缩尝试读取节点时区段不存在,则会返回 SegmentNotFoundException

这可能是由不同的根本原因造成的:

  1. 该区段已被手动干预删除(例如: rm -rf /)。
  2. 高渠段已通过修订垃圾收藏集移除。
  3. 由于代码中的一些错误,无法找到该区段。

如果问题是由修订垃圾收藏集引起的(原因#2),请确保禁用在线压缩以避免进一步的节点损坏。

recommendation-more-help
3d58f420-19b5-47a0-a122-5c9dab55ec7f