如何使AEM用TarMK Cold Standby運行

簡介

Tar微內核的冷備用容量允許一個或多個備用實例AEM連接到主實例。 同步進程只表示它只從主實例到備用實例完成。

備用實例的目的是保證主儲存庫的即時資料拷貝,並確保在主儲存庫因任何原因不可用時快速切換而不丟失資料。

內容在主實例和備用實例之間線性同步,不會對檔案或儲存庫損壞進行任何完整性檢查。 由於這種設計,備用實例是主實例的精確副本,無法幫助緩解主實例的不一致性。

注意

「冷備用」功能旨在保護​author​實例上需要高可用性的情形。 如果​publish​實例需要使用Tar Micro內核的高可用性,Adobe建議使用發佈群。

有關更多可用部署的資訊,請參閱建議部署頁。

其運作方式

在主實AEM例上,開啟一個TCP埠並監聽傳入消息。 目前,從系統將向主系統發送兩種消息:

  • 請求當前頭段ID的消息
  • 以指定ID要求區段資料的訊息

備用設備定期請求主設備當前頭的段ID。 如果區段在本機未知,則會擷取該區段。 如果區段已顯示,則會比較區段,並視需要要求參考區段。

注意

待機實例不接收任何類型的請求,因為它們僅以同步模式運行。 備用實例上唯一可用的部分是Web控制台,以便便於進行捆綁和服務配置。

典型的TarMK冷備用部署:

chlimage_1

其他特性

魯棒

資料流設計用於自動檢測和處理連接和網路相關問題。 所有資料包都與校驗和捆綁在一起,一旦連接或損壞的資料包發生重試機制時,就會觸發。

效能

在主實例上啟用TarMK Cold Standby對效能幾乎沒有可衡量的影響。 額外的CPU消耗非常低,額外的硬碟和網路IO不應產生和效能問題。

在待機狀態下,同步過程中的CPU消耗會很高。 由於該過程不是多線程的,因此不能通過使用多個內核來加速。 如果沒有變更或傳輸任何資料,則不會有可衡量的活動。 連接速度會因硬體和網路環境而異,但不取決於儲存庫的大小或SSL使用。 在估計初始同步所需的時間或在主節點上同時更改了大量資料時,應牢記這一點。

安全性

假設所有實例都運行在同一內部網安全區域,則安全漏洞的風險大大降低。 不過,您可以在從系統和主系統之間啟用SSL連接,從而添加額外的安全層。 這樣做會降低資料被中間人所破壞的可能性。

此外,您還可以通過限制傳入請求的IP地址來指定允許連接的備用實例。 這應有助於確保內部網中的任何人都不能複製儲存庫。

注意

建議在作為Coldy備用設定一部分的Dispatcher和伺服器之間添加負載平衡器。 應將負載平衡器配置為僅將用戶流量引導到​primary​實例,以確保一致性,並防止內容通過非Cold Standby機制被複製到備用實例。

建立AEMTarMK冷備用設定

注意

與舊版相比,「段」節點儲存和「備用儲存」服務的PID在AEM6.3中發生了更改,如下所示:

  • 來自org.apache.jackrabbit.oak。plugins.segment.standby.standby.StandbyStoreService to org.apache.jackrabbit.oak.segment.standby.store.StandbyStoreService
  • 來自org.apache.jackrabbit.oak。plugins.segment.SegmentNodeStoreService to org.apache.jackrabbit.oak.segment.SegmentNodeStoreService

請務必進行必要的組態調整,以反映此變更。

要建立TarMK冷備用安裝,首先需要通過將主安裝資料夾的整個檔案系統副本複製到新位置來建立備用實例。 然後,您可以使用將指定其角色(primarystandby)的執行模式來啟動每個例項。

以下是建立具有一個主實例和一個備用實例的設定時需要遵循的過程:

  1. 安裝AEM。

  2. 關閉實例,並將其安裝資料夾複製到冷備用實例的運行位置。 即使從不同的電腦執行,請務必為每個資料夾提供描述性名稱(例如​aem-primary​或​aem-standby),以區分執行個體。

  3. 轉到主實例的安裝資料夾,並:

    1. 檢查並刪除您在aem-primary/crx-quickstart/install下可能擁有的任何以前的OSGi配置

    2. aem-primary/crx-quickstart/install下建立名為install.primary的資料夾

    3. aem-primary/crx-quickstart/install/install.primary下為首選節點儲存和資料儲存建立所需的配置

    4. 在相同位置建立名為org.apache.jackrabbit.oak.segment.standby.store.StandbyStoreService.config的檔案,並相應地進行配置。 有關配置選項的詳細資訊,請參見Configuration

    5. 如果您正將AEMTarMK實例與外部資料儲存一起使用,請在aem-primary/crx-quickstart/install下建立名為crx3crx3資料夾

    6. 將資料儲存配置檔案放在crx3資料夾中。

    例如,如果您正在運行具有外部文AEM件資料儲存的TarMK實例,則需要以下配置檔案:

    • aem-primary/crx-quickstart/install/install.primary/org.apache.jackrabbit.oak.segment.SegmentNodeStoreService.config
    • aem-primary/crx-quickstart/install/install.primary/org.apache.jackrabbit.oak.segment.standby.store.StandbyStoreService.config
    • aem-primary/crx-quickstart/install/crx3/org.apache.jackrabbit.oak.plugins.blob.datastore.FileDataStore.config

    以下是主要實例的示例配置:

    例oforg.apache.jackrabbit.oak.segment.SegmentNodeStoreService.config

    org.apache.sling.installer.configuration.persist=B"false"
    customBlobStore=B"true"
    standby=B"false"
    

    org.apache.jackrabbit.oak.segment.standby.store.StandbyStoreService.config的範例

    org.apache.sling.installer.configuration.persist=B"false"
    mode="primary"
    port=I"8023"
    

    org.apache.jackrabbit.oak.plugins.blob.datastore.FileDataStore.config的範例

    org.apache.sling.installer.configuration.persist=B"false"
    path="./crx-quickstart/repository/datastore"
    minRecordLength=I"16384"
    
  4. 啟動主模式,確保指定主運行模式:

    java -jar quickstart.jar -r primary,crx3,crx3tar
    
  5. 建立​org.apache.jackrabbit.oak.segment​套件的新Apache Sling Logging Logger。 將日誌級別設定為「調試」,並將其日誌輸出指向單獨的日誌檔案,如​/logs/tarmk-coldstandby.log。 如需詳細資訊,請參閱記錄

  6. 轉到​standby​實例的位置,並通過運行jar啟動它。

  7. 建立與主日誌配置相同的日誌配置。 然後,停止例項。

  8. 接下來,準備備用實例。 您可以通過執行與主實例相同的步驟來執行此操作:

    1. 刪除您在aem-standby/crx-quickstart/install下可能擁有的任何檔案。

    2. aem-standby/crx-quickstart/install下建立名為install.standby的新資料夾

    3. 建立兩個名為:

      • org.apache.jackrabbit.oak.segment.SegmentNodeStoreService.config
      • org.apache.jackrabbit.oak.segment.standby.store.StandbyStoreService.config
    4. aem-standby/crx-quickstart/install下建立名為crx3的新資料夾

    5. 建立資料儲存區組態,並將它置於aem-standby/crx-quickstart/install/crx3下。 在此範例中,您需要建立的檔案為:

      • org.apache.jackrabbit.oak.plugins.blob.datastore.FileDataStore.config
    6. 編輯檔案並建立必要的設定。

    以下是典型備用實例的示例配置檔案:

    org.apache.jackrabbit.oak.segment.SegmentNodeStoreService.config的範例

    org.apache.sling.installer.configuration.persist=B"false"
    name="Oak-Tar"
    service.ranking=I"100"
    standby=B"true"
    customBlobStore=B"true"
    

    org.apache.jackrabbit.oak.segment.standby.store.StandbyStoreService.config的範例

    org.apache.sling.installer.configuration.persist=B"false"
    mode="standby"
    primary.host="127.0.0.1"
    port=I"8023"
    secure=B"false"
    interval=I"5"
    standby.autoclean=B"true"
    

    org.apache.jackrabbit.oak.plugins.blob.datastore.FileDataStore.config的範例

    org.apache.sling.installer.configuration.persist=B"false"
    path="./crx-quickstart/repository/datastore"
    minRecordLength=I"16384"
    
  9. 使用備用運行模式啟動​standby​實例:

    java -jar quickstart.jar -r standby,crx3,crx3tar
    

此服務也可通過Web控制台進行配置,方法是:

  1. 前往Web主控台:https://serveraddress:serverport/system/console/configMgr
  2. 尋找名為​Apache Jackrabbit Oak Segment Tar Cold Standby Service​的服務,然後按兩下它以編輯設定。
  3. 儲存設定,然後重新啟動執行個體,讓新設定生效。
注意

您可以隨時檢查例項的角色,方法是檢查Sling Settings Web Console中存在​primary​或​standby​執行模式。

您可前往​https://localhost:4502/system/console/status-slingsettings​並檢查​**"Run Modes"**​行,以完成此作業。

首次同步

準備完成並首次啟動備用後,當備用接近主備份時,實例之間將會出現大量網路通信。 您可以查閱日誌來觀察同步的狀態。

在待機​tarmk-coldstandby.log​中,您將看到以下條目:

    *DEBUG* [defaultEventExecutorGroup-2-1] org.apache.jackrabbit.oak.segment.standby.store.StandbyStore trying to read segment ec1f739c-0e3c-41b8-be2e-5417efc05266

    *DEBUG* [nioEventLoopGroup-3-1] org.apache.jackrabbit.oak.segment.standby.codec.SegmentDecoder received type 1 with id ec1f739c-0e3c-41b8-be2e-5417efc05266 and size 262144

    *DEBUG* [defaultEventExecutorGroup-2-1] org.apache.jackrabbit.oak.segment.standby.store.StandbyStore got segment ec1f739c-0e3c-41b8-be2e-5417efc05266 with size 262144

    *DEBUG* [defaultEventExecutorGroup-2-1] org.apache.jackrabbit.oak.segment.file.TarWriter Writing segment ec1f739c-0e3c-41b8-be2e-5417efc05266 to /mnt/crx/author/crx-quickstart/repository/segmentstore/data00016a.tar

在待機的​error.log​中,您應看到如下條目:

*INFO* [FelixStartLevel] org.apache.jackrabbit.oak.segment.standby.store.StandbyStoreService started standby sync with 10.20.30.40:8023 at 5 sec.

在上述日誌代碼片段中,10.20.30.40​是主IP地址。

在​primary tarmk-coldstandby.log​中,您將看到以下條目:

    *DEBUG* [nioEventLoopGroup-3-2] org.apache.jackrabbit.oak.segment.standby.store.CommunicationObserver got message ‘s.d45f53e4-0c33-4d4d-b3d0-7c552c8e3bbd’ from client c7a7ce9b-1e16-488a-976e-627100ddd8cd

    *DEBUG* [nioEventLoopGroup-3-2] org.apache.jackrabbit.oak.segment.standby.server.StandbyServerHandler request segment id d45f53e4-0c33-4d4d-b3d0-7c552c8e3bbd

    *DEBUG* [nioEventLoopGroup-3-2] org.apache.jackrabbit.oak.segment.standby.server.StandbyServerHandler sending segment d45f53e4-0c33-4d4d-b3d0-7c552c8e3bbd to /10.20.30.40:34998

    *DEBUG* [nioEventLoopGroup-3-2] org.apache.jackrabbit.oak.segment.standby.store.CommunicationObserver did send segment with 262144 bytes to client c7a7ce9b-1e16-488a-976e-627100ddd8cd

在這種情況下,日誌中提及的「客戶端」是​standby​實例。

一旦這些項目停止出現在記錄中,您就可以放心地假設同步程式已完成。

雖然上述項目顯示輪詢機制正常運作,但瞭解是否有任何資料在發生輪詢時同步通常很有用。 若要這麼做,請尋找下列項目:

*DEBUG* [defaultEventExecutorGroup-156-1] org.apache.jackrabbit.oak.segment.file.TarWriter Writing segment 3a03fafc-d1f9-4a8f-a67a-d0849d5a36d5 to /<<CQROOTDIRECTORY>>/crx-quickstart/repository/segmentstore/data00014a.tar

此外,當使用非共用FileDataStore執行時,像下列訊息會確認二進位檔案已正確傳輸:

*DEBUG* [nioEventLoopGroup-228-1] org.apache.jackrabbit.oak.segment.standby.codec.ReplyDecoder received blob with id eb26faeaca7f6f5b636f0ececc592f1fd97ea1a9#169102 and size 169102

設定

以下OSGi設定可用於Cold Standby服務:

  • 持續配置: 如果啟用,則會將配置儲存在儲存庫中,而不是傳統的OSGi配置檔案中。建議在生產系統上禁用此設定,以使備用系統不會提取主配置。

  • 模式(mode): 這將選擇實例的運行模式。

  • 埠(埠): 用於通信的埠。預設值為8023

  • 主主機(primary.host): -主實例的主機。此設定僅適用於備用設備。

  • 同步間隔(interval): —— 此設定確定同步請求之間的間隔,並且僅適用於備用實例。

  • 允許的IP範圍(primary.allowed-client-ip-ranges): —— 主要允許連接的IP範圍。

  • 安全(secure):啟 用SSL加密。為了使用此設定,必須在所有例項上啟用此設定。

  • 備用讀超時(standby.readtimeout):從備 用實例發出的請求超時(以毫秒為單位)。建議的逾時設定為43200000。 通常建議您將逾時值設為至少12小時。

  • 備用自動清理(standby.autoclean): 如果儲存的大小在同步週期上增加,請調用清理方法。

注意

強烈建議主資料庫ID和備用資料庫ID不同,以便對於「卸載」之類的服務可以單獨區分。

確保涵蓋此功能的最佳方式是在待機裝置上刪除​sling.id​檔案,然後重新啟動執行個體。

故障切換過程

如果主實例因任何原因而失敗,您可以通過更改以下詳細說明的啟動運行模式,將其中一個備用實例設定為承擔主實例的角色:

注意

還需要修改配置檔案,以便它們與用於主實例的設定匹配。

  1. 轉到安裝備用實例的位置,然後停止它。

  2. 如果已使用設定配置了負載平衡器,則此時可以從負載平衡器配置中刪除主。

  3. 從備用安裝資料夾備份crx-quickstart資料夾。 在設定新備用時,可將其用作起點。

  4. 使用primary runmode重新啟動實例:

    java -jar quickstart.jar -r primary,crx3,crx3tar
    
  5. 向負載平衡器添加新主要。

  6. 建立並啟動新的備用實例。 如需詳細資訊,請參閱上述「建立AEMTarMK Cold Standby Setup🔗」中的程式。

將修補程式應用於冷備用設定

建議將修補程式套用至Cold Standby設定的方式是將它們安裝至主要執行個體,然後將它複製至已安裝修補程式的新Cold Standby執行個體。

您可依照下列步驟進行:

  1. 前往JMX主控台並使用​org.apache.jackrabbit.oak來停止冷備用例項上的同步程式:狀態(「備用」)​bean。 有關如何執行此操作的詳細資訊,請參見監控一節。
  2. 停止冷備用實例。
  3. 在主實例上安裝Hotfix。 有關如何安裝修補程式的詳細資訊,請參閱如何使用套件
  4. 在安裝後測試實例以瞭解問題。
  5. 通過刪除其安裝資料夾來刪除冷備用實例。
  6. 通過將主實例的整個安裝資料夾的檔案系統副本複製到冷備用實例的位置來停止它並克隆它。
  7. 重新配置新建立的克隆以充當冷備用實例。 如需詳細資訊,請參閱「建立AEMTarMK冷備用設定」。🔗
  8. 啟動主實例和冷備用實例。

監控

此功能會使用JMX或MBeans公開資訊。 這樣,您可以使用JMX控制台檢查備用和主設備的當前狀態。 該資訊可在名為Statustype org.apache.jackrabbit.oak:type="Standby" MBean中找到。

備用

觀察待機實例時,您將公開一個節點。 ID通常是通用UUID。

此節點有五個只讀屬性:

  • Running: 指示同步進程是否正在運行的布爾值。

  • Mode: 客戶:後跟用於標識實例的UUID。請注意,每次更新配置時,此UUID都會變更。

  • Status: 目前狀態的文字表示( running like或 stopped)。

  • FailedRequests:連續錯誤的數量。

  • SecondsSinceLastSuccess: 自上次成功與伺服器通信以來的秒數。如果未成功通信,則將顯示-1

還有三種可調用的方法:

  • start(): 啟動同步進程。
  • stop(): 停止同步進程。
  • cleanup(): 對待機運行清除操作。

主要

觀察主伺服器通過MBean公開一些一般資訊, MBean的ID值是TarMK備用服務使用的埠號(預設為8023)。 大多數方法和屬性與待機方法和屬性相同,但有些不同:

  • Mode: 將始終顯示值 primary

此外,還可以檢索與主設備連接的多達10個客戶機(備用實例)的資訊。 MBean ID是實例的UUID。 這些MBean沒有可調用的方法,但有一些非常有用的只讀屬性:

  • Name: 用戶端的ID。
  • LastSeenTimestamp: 文本表示中最後一個請求的時間戳。
  • LastRequest: 客戶的最後要求。
  • RemoteAddress: 客戶機的IP地址。
  • RemotePort: 用於上次請求的客戶端的埠。
  • TransferredSegments: 傳送至此用戶端的區段總數。
  • TransferredSegmentBytes:傳送到此客戶機的位元組數。

Cold Standby Repository維護

修訂清除

注意

如果在主實例上運行聯機修訂清除,則不需要下面顯示的手動過程。 此外,如果您使用「線上修訂清除」,則備用實例上的cleanup ()操作將自動執行。

注意

請勿在備用系統上運行離線修訂清除。 不需要它,也不會降低區段儲存區大小。

Adobe建議定期運行維護,以防止隨著時間的推移儲存庫出現過度增長。 要手動執行冷備用儲存庫維護,請執行以下步驟:

  1. 前往JMX主控台並使用​org.apache.jackrabbit.oak來停止備用例項上的備用程式:狀態(「備用」) Bean。 有關如何執行此操作的詳細資訊,請參見上述關於監視的章節。

  2. 停止主實AEM例。

  3. 在主實例上運行oak壓縮工具。 有關詳細資訊,請參閱維護儲存庫

  4. 啟動主實例。

  5. 使用與第一步中所述的相同JMX Bean,在備用實例上啟動備用進程。

  6. 觀看日誌並等待同步完成。 此時,備用儲存庫可能出現大幅增長。

  7. 對備用實例運行cleanup()操作,使用第一步中所述的相同JMX Bean。

備用實例與主實例完成同步可能需要比平時更長的時間,因為離線壓縮可以有效重寫儲存庫歷史記錄,因此計算儲存庫中的更改需要更多的時間。 還應指出,一旦此過程完成,備用儲存庫的大小將與主儲存庫的大小大致相同。

作為替代方法,在主系統上運行壓縮後,主系統資訊庫可以手動複製到備用系統上,實際上每次壓縮運行時都重建備用系統。

資料存放庫廢棄項目收集

在檔案資料儲存實例上不時運行廢棄項目收集非常重要,否則,已刪除的二進位檔案將保留在檔案系統中,最終填滿驅動器。 要運行廢棄項目收集,請遵循以下過程:

  1. 運行冷備用儲存庫維護,如上面節所述。

  2. 在維護過程完成並重新啟動實例後:

    • 在主系統上,如本文所述,透過相關的JMX Bean運行資料儲存廢棄項目收集。
    • 在待機狀態下,資料儲存廢棄項目收集只能通過​BlobGarbageCollection MBean - startBlobGC()使用。 RepositoryManagement MBean不可用於備用。
    注意

    如果您未使用共用資料存放區,則必須先在主要儲存區上執行廢棄項目收集,然後再在備用儲存區上執行。

本頁內容