從Adobe Experience Manager資產的角度來看,監測工作應包括觀察和報告以下流程和技術:
系統CPU
系統記憶體使用
系統磁碟IO和IO等待時間
系統網路IO
用於:
OSGi控制台運行狀況檢查
通常, Assets 可通過兩種方式進行監控:即即時監控和長期監控。
您應在開發的效能測試階段或高負載情況下執行即時監控,以了解環境的效能特性。 通常應使用一套工具來執行即時監控。 以下是一些建議:
Visual VM:Visual VM使您能夠查看詳細的Java VM資訊,包括CPU使用量、Java記憶體使用量。 此外,它可讓您取樣並評估在執行個體上執行的程式碼。
頂端:Top是開啟儀表板的Linux命令,該儀表板顯示使用情況統計資訊,包括CPU、記憶體和IO使用情況。 它提供執行個體上所發生情況的概觀。
Htop:Htop是互動式程式檢視器。 除了Top提供的功能外,它還提供詳細的CPU和記憶體使用。 Htop可安裝在大部分的Linux系統上,使用 yum install htop
或 apt-get install htop
.
伊托普:Iotop是磁碟IO使用情況的詳細儀表板。 它顯示的條形和儀表,用於描述使用磁碟IO的過程及其使用量。 Iotop可安裝在大部分的Linux系統上,使用 yum install iotop
或 apt-get install iotop
.
Iftop:Iftop顯示有關乙太網/網路使用的詳細資訊。 Iftop會針對使用乙太網的實體顯示每個通訊通道的統計資料,以及其使用的頻寬量。 Iftop可安裝在大部分的Linux系統上,使用 yum install iftop
或 apt-get install iftop
.
Java飛行記錄器(JFR):來自Oracle的商業工具,可在非生產環境中自由使用。 如需詳細資訊,請參閱 Java飛行記錄器在CQ運行時診斷中的應用.
Experience Manager error.log檔案:您可以調查 Experience Manager error.log檔案,以取得系統中記錄的錯誤詳細資訊。 使用命令 tail -F quickstart/logs/error.log
來識別您應調查的錯誤。
工作流程主控台:運用工作流程主控台來監控延遲或卡住的工作流程。
通常,您會一起使用這些工具,以取得有關 Experience Manager 例項。
這些工具是標準工具,不直接受Adobe支援。 他們不需要額外的授權。
長期監控 Experience Manager 執行個體包括長時間監視受監控的相同部分。 也包含定義環境專屬的警報。
有數種工具可用於匯總日誌,例如Splunk™和Elastic Search/Logstash/Kabana(ELK)。 評估您的正常運行時間 Experience Manager 例如,您必須了解系統專屬的記錄事件,並根據這些事件建立警報。 對您的開發和操作實踐有良好的了解,可幫助您更好地了解如何調整日誌聚合過程以生成關鍵警報。
環境監控包括監控下列項目:
您需要外部工具,例如NewRelic™和AppDynamics™來監視每個項目。 使用這些工具,您可以定義系統專屬的警報,例如高系統利用率、工作流備份、運行狀況檢查失敗,或未驗證的網站訪問。 Adobe不建議使用任何特定工具而非其他工具。 尋找適合您的工具,並運用它來監控討論的項目。
內部應用程式監控包括監控構成 Experience Manager 堆疊,包括JVM、內容存放庫,以及透過平台上建置的自訂應用程式程式碼進行監控。 通常,它通過JMX Mbeans來執行,這些JMX Mbeans可以直接由許多流行的監控解決方案進行監控,如SolarWinds™、HP OpenView™、Hyperic™、Zabbix™等。 對於不支援直接連接到JMX的系統,可以編寫shell指令碼以提取JMX資料,並以它們本來理解的格式將其公開到這些系統。
預設情況下不啟用對JMX Mbeans的遠程訪問。 有關通過JMX進行監視的詳細資訊,請參見 使用JMX技術進行監控和管理.
在許多情況下,需要基線來有效監視統計資料。 要建立基線,請在預定時段內的正常工作條件下觀察系統,然後識別正常度量。
JVM監視
和任何基於Java的應用程式棧一樣, Experience Manager 取決於透過基礎Java虛擬機提供給它的資源。 您可以透過JVM公開的Platform MXBean來監視其中許多資源的狀態。 如需MXBean的詳細資訊,請參閱 使用Platform MBean伺服器和Platform MXBean.
以下是可監視JVM的一些基線參數:
記憶體
MBean: lava.lang:type=Memory
附註:此Bean提供的資訊以位元組表示。
線程
java.lang:type=Threading
Experience Manager監控
Experience Manager 還通過JMX公開一組統計和操作。 這些功能有助於評估系統運行狀況並在潛在問題影響用戶之前找出這些問題。 如需詳細資訊,請參閱 檔案 on Experience Manager JMX MBean。
以下是一些基線參數,您可以監視 Experience Manager:
復寫代理
MBean: com.adobe.granite.replication:type=agent,id=”<AGENT_NAME>”
URL: /system/console/jmx/com.adobe.granite.replication:type=agent,id="<agent_name>"
例項:一個製作和所有發佈執行個體(適用於排清代理)
警報閾值:若 QueueBlocked
為true或的值 QueueNumEntries
大於基線的150%。
警報定義:系統中是否存在阻止的隊列,表明複製目標已關閉或無法訪問。 網路或基礎架構問題通常會導致過多的條目排隊,從而對系統效能產生負面影響。
附註:對於MBean和URL參數,請替換 <AGENT_NAME>
以及您要監視的復寫代理的名稱。
會話計數器
org.apache.jackrabbit.oak:id=7,name="OakRepository Statistics",type="RepositoryStats"
健康狀態檢查
健康狀態檢查 操作儀表板 有相應的JMX MBean用於監視。 但是,您可以編寫自定義運行狀況檢查以公開其他系統統計資訊。
以下是有助於監控的現成可用健康狀態檢查:
系統檢查
org.apache.sling.healthcheck:name=systemchecks,type=HealthCheck
復寫佇列
org.apache.sling.healthcheck:name=replicationQueue,type=HealthCheck
回應效能
org.apache.sling.healthcheck:name=requestsStatus,type=HealthCheck
查詢效能
org.apache.sling.healthcheck:name=queriesStatus,type=HealthCheck
作用中組合
日誌錯誤
org.apache.sling.healthcheck:name=logErrorHealthCheck,type=HealthCheck
在監控過程中,如果您遇到問題,以下是一些疑難排解工作,您可以執行以解決 Experience Manager 例項:
OutOfMemoryError
記錄檔。 如需詳細資訊,請參閱 分析記憶體問題.access.log
和 error.log
某個時段的條目檔案出錯。 尋找可能表示自訂程式碼異常的模式。 將它們新增至您監視的事件清單。