從Adobe Experience Manager資產的角度來看,監測工作應包括觀察和報告以下流程和技術:
系統CPU
系統記憶體使用
系統磁碟IO和IO等待時間
系統網路IO
用於:
OSGi控制台運行狀況檢查
通常,Assets可以通過兩種方式進行監控,即即時監控和長期監控。
您應在開發的效能測試階段或高負載情況下執行即時監控,以了解環境的效能特性。 通常應使用一套工具來執行即時監控。 以下是一些建議:
Visual VM:Visual VM使您能夠查看詳細的Java VM資訊,包括CPU使用量、Java記憶體使用量。此外,它可讓您取樣並評估在執行個體上執行的程式碼。
排名:Top是開啟儀表板的Linux命令,該儀表板顯示使用情況統計資訊,包括CPU、記憶體和IO使用情況。它提供執行個體上所發生情況的概觀。
頂端:Htop是互動式程式檢視器。除了Top提供的功能外,它還提供詳細的CPU和記憶體使用。 Htop可以在大多數使用yum install htop
或apt-get install htop
的Linux系統上安裝。
Iotop:Iotop是磁碟IO使用情況的詳細儀表板。它顯示的條形和儀表,用於描述使用磁碟IO的過程及其使用量。 使用yum install iotop
或apt-get install iotop
,Iotop可安裝在大多數Linux系統上。
Iftop:Iftop顯示有關乙太網/網路使用的詳細資訊。Iftop會針對使用乙太網的實體顯示每個通訊通道的統計資料,以及其使用的頻寬量。 Iftop可以安裝在使用yum install iftop
或apt-get install iftop
的大多數Linux系統上。
Java飛行記錄器(JFR):來自Oracle的商業工具,可在非生產環境中自由使用。 如需詳細資訊,請參閱如何使用Java飛行記錄器診斷CQ執行階段問題。
Experience Manager error.log檔案:您可以調查 Experience Manager error.log檔案,了解系統中記錄的錯誤的詳細資訊。使用命令tail -F quickstart/logs/error.log
標識應調查的錯誤。
工作流程主控台:運用工作流程主控台來監控延遲或卡住的工作流程。
通常,您會一起使用這些工具來獲得有關Experience Manager實例效能的全面概念。
這些工具是標準工具,不直接受Adobe支援。 他們不需要額外的授權。
對Experience Manager實例進行長期監視包括對受監視的同一部分進行更長時間的監視。 也包含定義環境專屬的警報。
有數種工具可用於匯總日誌,例如Splunk™和Elastic Search/Logstash/Kabana(ELK)。 要評估Experience Manager實例的正常運行時間,您必須了解系統特定的日誌事件,並根據這些事件建立警報。 對您的開發和操作實踐有良好的了解,可幫助您更好地了解如何調整日誌聚合過程以生成關鍵警報。
環境監控包括監控下列項目:
您需要外部工具,例如NewRelic™和AppDynamics™來監視每個項目。 使用這些工具,您可以定義系統特有的警報,例如高系統利用率、工作流備份、運行狀況檢查失敗或未驗證的網站訪問。 Adobe不建議使用任何特定工具而非其他工具。 尋找適合您的工具,並運用它來監控討論的項目。
內部應用程式監視包括監視構成Experience Manager堆棧的應用程式元件,包括JVM、內容儲存庫,以及通過平台上構建的自定義應用程式代碼進行監視。 一般來說,它通過JMX Mbeans來執行,這些JMX Mbeans可以直接由許多流行的監控解決方案進行監控,如SolarWinds™、HP OpenView™、Hyperic™、Zabbix™等。 對於不支援直接連接到JMX的系統,可以編寫shell指令碼以提取JMX資料,並以它們本來理解的格式將其公開到這些系統。
預設情況下不啟用對JMX Mbeans的遠程訪問。 有關通過JMX進行監視的詳細資訊,請參閱使用JMX技術進行監視和管理。
在許多情況下,需要基線來有效監視統計資料。 要建立基線,請在預定時段內的正常工作條件下觀察系統,然後識別正常度量。
JVM監視
與任何基於Java的應用程式堆棧一樣,Experience Manager取決於通過基礎Java虛擬機提供給它的資源。 您可以透過JVM公開的Platform MXBean來監視其中許多資源的狀態。 有關MXBean的詳細資訊,請參閱使用平台MBean伺服器和平台MXBean。
以下是可監視JVM的一些基線參數:
記憶體
MBean: lava.lang:type=Memory
注意:此Bean提供的資訊以位元組表示。
線程
java.lang:type=Threading
Experience Manager監控
Experience Manager 還通過JMX公開一組統計和操作。這些功能有助於評估系統運行狀況並在潛在問題影響用戶之前找出這些問題。 如需詳細資訊,請參閱Experience Manager JMX MBean上的檔案。
以下是可監視Experience Manager的一些基線參數:
復寫代理
MBean:com.adobe.granite.replication:type=agent,id=”<AGENT_NAME>”
URL:/system/console/jmx/com.adobe.granite.replication:type=agent,id="<AGENT_NAME>"
例項:一個製作和所有發佈執行個體(適用於排清代理)
警報閾值:當QueueBlocked
值為true或QueueNumEntries
值大於基線的150%時。
警報定義:系統中是否存在阻止的隊列,表明複製目標已關閉或無法訪問。 網路或基礎架構問題通常會導致過多的條目排隊,從而對系統效能產生負面影響。
注意:對於MBean和URL參數,請用 <AGENT_NAME>
要監視的複製代理的名稱替換。
會話計數器
org.apache.jackrabbit.oak:id=7,name="OakRepository Statistics",type="RepositoryStats"
健康狀態檢查
操作儀表板中可用的運行狀況檢查具有用於監視的相應JMX MBean。 但是,您可以編寫自定義運行狀況檢查以公開其他系統統計資訊。
以下是有助於監控的現成可用健康狀態檢查:
系統檢查
org.apache.sling.healthcheck:name=systemchecks,type=HealthCheck
復寫佇列
org.apache.sling.healthcheck:name=replicationQueue,type=HealthCheck
回應效能
org.apache.sling.healthcheck:name=requestsStatus,type=HealthCheck
查詢效能
org.apache.sling.healthcheck:name=queriesStatus,type=HealthCheck
作用中組合
日誌錯誤
org.apache.sling.healthcheck:name=logErrorHealthCheck,type=HealthCheck
在監控過程中,如果您遇到問題,您可以執行以下一些疑難排解工作,以解決Experience Manager例項的常見問題:
OutOfMemoryError
日誌。 有關詳細資訊,請參閱分析記憶體問題。access.log
和error.log
檔案,以了解是否有問題發生的前後條目。 尋找可能表示自訂程式碼異常的模式。 將它們新增至您監視的事件清單。