疑難排解復寫 troubleshooting-replication

此頁面提供如何疑難排解復寫問題的資訊。

問題 problem

復寫(非反向復寫)由於某些原因而失敗。

解決方法 resolution

復寫失敗的原因有很多。 本文會說明分析這些問題時可能會採取的方法。

按一下[啟動]按鈕時,是否會觸發復寫? 如果NOT,則執行下列動作:

  1. 前往/crx/explorer並以管理員身分登入。
  2. 開啟「內容總管」
  3. 檢視節點/bin/replicate或/bin/replicate.json是否存在。 如果節點存在,則刪除它並儲存。

復寫是否在復寫代理程式佇列中排入佇列?

請前往/etc/replication/agents.author.html檢查此專案,然後按一下復寫代理程式以進行檢查。

如果一個代理程式佇列或幾個代理程式佇列卡住:

  1. 佇列是否顯示​ 已封鎖 ​狀態? 如果存在,則發佈執行個體是否未執行或無回應? 檢查發佈執行個體看看它有什麼問題。 也就是說,檢查記錄檔,並檢視是否發生OutOfMemory錯誤或某些其他問題。 如果速度很慢,則進行對話串傾印並加以分析。

  2. 佇列狀態是否顯示​ 佇列為作用中 — # pending? 基本上,復寫工作可能會卡在等待發佈執行個體或Dispatcher回應的通訊端讀取中。 這可能表示發佈執行個體或Dispatcher處於高負載或卡在鎖定中。 在此情況下,從作者進行對話串傾印並發佈。

    • 在執行緒傾印分析器中開啟來自作者的執行緒傾印,檢查它是否顯示復寫代理程式的sling事件工作卡在socketRead中。
    • 在執行緒傾印分析器中從發佈開啟執行緒傾印,分析可能導致發佈執行個體未回應的原因。 您應該會看到其名稱中有POST/bin/receive的執行緒,這是從作者接收復寫的執行緒。

如果所有代理程式佇列都卡住

  1. 由於存放庫損毀或某些其他問題,可能無法在/var/replication/data下序列化特定內容片段。 如需相關錯誤,請檢視logs/error.log 。 若要清除錯誤的復寫專案,請執行下列動作:

    1. 前往https://<host>:<port>/crx/de並以管理員使用者身分登入。
    2. 按一下頂端功能表中的「工具」。
    3. 按一下放大鏡按鈕。
    4. 選取「XPath」作為「型別」。
    5. 在「查詢」方塊中,輸入此查詢/jcr:root/var/eventing/jobs//element(*,slingevent:Job) order by @slingevent:created
    6. 按一下「搜尋」。
    7. 在結果中,排名最前的專案是最新的Sling事件工作。 按一下每個復寫,然後尋找符合佇列頂端所顯示內容的停滯復寫。
  2. Sling事件框架工作佇列可能有問題。 請嘗試在/system/console中重新啟動org.apache.sling.event套件組合。

  3. 可能是工作處理已關閉。 您可以在Sling事件標籤中的Felix主控台下檢視它。 檢查是否顯示 — Apache Sling事件(作業處理已停用!)

    • 如果是,請檢查Felix主控台中「設定」索引標籤下的Apache Sling工作事件處理常式。 可能是未勾選「啟用工作處理」核取方塊。 如果勾選了此方塊,但畫面仍顯示「作業處理已停用」,則請檢查/apps/system/config下是否有任何覆蓋正在停用作業處理。 請嘗試為jobmanager.enabled建立osgi:config節點(布林值為true),並重新檢查啟動是否開始,以及佇列中是否沒有其他作業。
  4. DefaultJobManager組態可能也會進入不一致的狀態。 當有人透過OSGiconsole手動修改「Apache Sling工作事件處理常式」設定(例如,停用並重新啟用「啟用工作處理」屬性並儲存設定)時,就會發生這種情況。

    • 此時,儲存在crx-quickstart/launchpad/config/org/apache/sling/event/impl/jobs/DefaultJobManager.config的DefaultJobManager設定會進入不一致的狀態。 即使「Apache Sling作業事件處理常式」屬性將「作業處理已啟用」顯示為已勾選狀態,當使用者導覽至「Sling事件」標籤時,會顯示訊息 — 「作業處理已停用」且復寫無法運作。
    • 若要解決此問題,請導覽至OSGi主控台的「設定」頁面,並刪除「Apache Sling工作事件處理常式」設定。 然後重新啟動叢集的主節點,讓設定回到一致的狀態。 這應該會修正問題,且復寫會再次開始運作。

建立replication.log

有時候,在DEBUG層級將所有的復寫記錄檔設定為新增到個別的記錄檔中會很有幫助。 若要這麼做:

  1. 前往https://host:port/system/console/configMgr並以管理員身分登入。

  2. 尋找Apache Sling Logging Logger Factory,並按一下工廠設定右側的​ + ​按鈕以建立執行個體。 這會建立新的記錄日誌程式。

  3. 設定設定如下:

    • 記錄層級: DEBUG
    • 記錄檔路徑: logs/replication.log
    • 類別: com.day.cq.replication
  4. 如果您懷疑問題與任何方式的Sling事件/工作有關,您也可以在categories:org.apache.sling.event底下新增此Java™套件

暫停復寫代理程式佇列 pausing-replication-agent-queue

有時候,暫停復寫佇列以減輕作者系統的負載,而不停用它可能是合適的。 目前,這只能透過暫時設定無效連線埠的駭客攻擊來完成。 從5.4版開始,復寫代理程式佇列中可能會顯示暫停按鈕,但有一些限制

  1. 狀態不會持續存在,這表示如果您重新啟動伺服器或復寫套件組合回收,它會回復到執行狀態。
  2. 暫停會閒置較短的時間(沒有其他執行緒使用復寫的活動後出現1小時),而不會再閒置較長時間。 因為Sling中有避免閒置執行緒的功能。 基本上會檢查工作佇列執行緒是否閒置了較長時間,如果是,它會啟動清除週期。 由於清除循環,它會停止執行緒,因此會遺失暫停的設定。 由於作業持續存在,因此會起始新的執行緒來處理沒有暫停組態詳細資訊的佇列。 因為此佇列會變成執行中狀態。

使用者啟動時不會復寫頁面許可權 page-permissions-are-not-replicated-on-user-activation

不會復寫頁面許可權,因為這些許可權儲存在授予存取權的節點下,而不是儲存在使用者中。

一般而言,頁面許可權不應從作者復寫至發佈,預設情況下也不應如此。 這是因為在這兩個環境中,存取許可權應該不同。 因此,Adobe建議您在publish上設定ACL (與作者分開)。

將名稱空間資訊從作者復寫到Publish時封鎖復寫佇列 replication-queue-blocked-when-replicating-namespace-information-from-author-to-publish

嘗試將名稱空間資訊從製作執行個體復寫到發佈執行個體時,有時復寫佇列會被封鎖。 發生此狀況是因為復寫使用者沒有jcr:namespaceManagement許可權。 若要避免此問題,請確定:

  • 復寫使用者(在傳輸索引標籤>使用者下設定)也存在於Publish執行個體上。
  • 使用者在安裝內容的路徑具有讀取和寫入許可權。
  • 使用者在存放庫層級具有jcr:namespaceManagement許可權。 您可以授與許可權,如下所示:
  1. 以管理員身分登入CRX/DE ( https://localhost:4502/crx/de/index.jsp)。
  2. 按一下「存取控制」標籤。
  3. 選取​ 存放庫
  4. 按一下​ 新增專案 (加號圖示)。
  5. 輸入使用者的名稱。
  6. 從許可權清單中選取jcr:namespaceManagement
  7. 按一下​ 「確定」
recommendation-more-help
19ffd973-7af2-44d0-84b5-d547b0dffee2