从 Experience Manager Assets 站在立场上,监测应包括观察和报告下列进程和技术:
通常, Experience Manager Assets 可以通过两种方式进行监控,即实时监控和长期监控。
您应在开发的性能测试阶段或高负载情况下执行实时监控,以了解环境的性能特性。 通常,应使用一套工具执行实时监视。 以下是一些建议:
可视化虚拟机:Visual VM允许您查看详细的Java VM信息,包括CPU使用率、Java内存使用率。 此外,它还允许您对在部署中运行的代码进行采样和评估。
顶部:顶部是一个Linux命令,用于打开一个功能板,其中显示使用情况统计信息,包括CPU、内存和IO使用情况。 它提供了实例中所发生情况的高级概述。
Htop:Htop是一个交互式进程查看器。 除了Top提供的功能外,它还提供详细的CPU和内存使用情况。 Htop可安装在大多数Linux系统上, yum install htop
或 apt-get install htop
.
Iotop:Iotop是有关磁盘IO使用情况的详细功能板。 它显示一些条形和米表,这些条形和米表描述了使用磁盘IO的流程及其使用量。 Iotop可安装在大多数Linux系统上, yum install iotop
或 apt-get install iotop
.
Iftop:Iftop显示有关以太网/网络使用的详细信息。 Iftop显示使用以太网的实体的每个通信通道统计信息以及它们使用的带宽量。 Iftop可安装在大多数Linux系统上, yum install iftop
或 apt-get install iftop
.
Java飞行记录器(JFR):oracle中的商业工具,您可以在非生产环境中自由使用。 有关更多详细信息,请参阅 如何使用Java飞行记录器诊断CQ运行时问题.
Experience Manager error.log
文件:你可以调查 Experience Manager error.log
文件,以了解系统中记录的错误的详细信息。 使用命令 tail -F quickstart/logs/error.log
以识别要调查的错误。
工作流控制台:利用工作流控制台监控滞后或卡住的工作流。
通常,您会结合使用这些工具来全面了解您的 Experience Manager 部署。
这些工具是标准工具,不直接受Adobe支持。 它们不需要额外的许可证。
图:使用Visual VM工具进行实时监控。
对 Experience Manager 部署涉及对实时监视的相同部分进行较长时间的监视。 它还包括定义特定于您的环境的警报。
有几种可用于聚合日志的工具,例如Splunk™和Elastic Search、Logstash和Kabana(ELK)。 评估您的 Experience Manager 部署时,了解特定于您系统的日志事件并基于这些事件创建警报非常重要。 了解您的开发和操作实践有助于您更好地了解如何调整日志聚合过程以生成关键警报。
环境监控包括监控以下内容:
您需要外部工具(如NewRelic™和AppDynamics™)来监控每个项目。 使用这些工具,您可以定义特定于您系统的警报,例如系统利用率高、工作流备份、运行状况检查失败或未经身份验证的网站访问。 Adobe不推荐任何特定工具而不是其他工具。 找到适合您的工具,并利用它监控所讨论的项目。
内部应用程序监控包括监控构成 Experience Manager 堆栈,包括JVM、内容存储库,以及通过在平台上构建的自定义应用程序代码进行监控。 通常,它通过JMX Mbeans执行,而JMX Mbeans可以由许多常用的监控解决方案(如SolarWinds™、 HP OpenView™、Hyperic™、Zabbix™等)直接监控。 对于不支持直接连接到JMX的系统,您可以编写shell脚本以提取JMX数据,并以它们本身理解的格式将其公开给这些系统。
默认情况下,不启用对JMX Mbean的远程访问。 有关通过JMX进行监控的更多信息,请参阅 使用JMX技术进行监控和管理.
在许多情况下,需要基线才能有效地监控统计数据。 要创建基线,请在预定时间段内在正常工作条件下观察系统,然后识别正常量度。
JVM监控
与任何基于Java的应用程序堆栈一样, Experience Manager 取决于通过基础Java虚拟机提供给它的资源。 您可以通过JVM公开的Platform MXBean来监控其中许多资源的状态。 有关MXBean的更多信息,请参阅 使用Platform MBean服务器和Platform MXBeans.
以下是一些可监控JVM的基线参数:
内存
MBean: lava.lang:type=Memory
/system/console/jmx/java.lang:type=Memory
此Bean提供的信息以字节表示。
线程
java.lang:type=Threading
/system/console/jmx/java.lang:type=Threading
监视器Experience Manager
Experience Manager 还通过JMX公开一组统计和操作。 这些功能有助于评估系统运行状况,并在潜在问题影响用户之前发现它们。 有关更多信息,请参阅 文档 on Experience Manager JMX MBean。
以下是一些可监视的基线参数 Experience Manager:
复制代理
MBean: com.adobe.granite.replication:type=agent,id="<AGENT_NAME>"
URL: /system/console/jmx/com.adobe.granite.replication:type=agent,id="<AGENT_NAME>"
实例:一个创作实例和所有发布实例(用于刷新代理)
警报阈值:当 QueueBlocked
is true
或 QueueNumEntries
大于基线的150%。
警报定义:系统中存在阻止的队列,表示复制目标已关闭或不可访问。 通常,网络或基础架构问题会导致过多条目排入队列,从而对系统性能产生不利影响。
对于MBean和URL参数,请替换 <AGENT_NAME>
以及要监视的复制代理的名称。
会话计数器
org.apache.jackrabbit.oak:id=7,name="OakRepository Statistics",type="RepositoryStats"
运行状况检查
运行状况检查 操作仪表板 具有相应的JMX MBean进行监控。 但是,您可以编写自定义运行状况检查以显示其他系统统计信息。
以下是一些开箱即用的运行状况检查,这些检查有助于进行监控:
系统检查
org.apache.sling.healthcheck:name=systemchecks,type=HealthCheck
/system/console/jmx/org.apache.sling.healthcheck:name=systemchecks,type=HealthCheck
复制队列
org.apache.sling.healthcheck:name=replicationQueue,type=HealthCheck
/system/console/jmx/org.apache.sling.healthcheck:name=replicationQueue,type=HealthCheck
响应性能
org.apache.sling.healthcheck:name=requestsStatus,type=HealthCheck
/system/console/jmx/org.apache.sling.healthcheck:name=requestsStatus,type=HealthCheck
查询性能
org.apache.sling.healthcheck:name=queriesStatus,type=HealthCheck
/system/console/jmx/org.apache.sling.healthcheck:name= queriesStatus,type=HealthCheck
活动包
org.apache.sling.healthcheck:name=inactiveBundles,type=HealthCheck
/system/console/jmx/org.apache.sling.healthcheck:name=inactiveBundles,type=HealthCheck
日志错误
org.apache.sling.healthcheck:name=logErrorHealthCheck,type=HealthCheck
/system/console/jmx/org.apache.sling.healthcheck:name=logErrorHealthCheck,type=HealthCheck
在监控过程中,如果您遇到问题,您可以执行以下一些故障诊断任务来解决 Experience Manager 部署:
如果使用TarMK,请经常运行焦油压缩。 有关更多详细信息,请参阅 维护存储库.
检查 OutOfMemoryError
日志。 有关更多信息,请参阅 分析内存问题.
检查日志中是否有对未索引查询、树遍历或索引遍历的任何引用。 这表示未编入索引的查询或索引不足的查询。 有关优化查询和索引性能的最佳实践,请参阅 有关查询和索引的最佳实践.
使用工作流控制台验证工作流是否按预期执行。 如有可能,将多个工作流精简为单个工作流。
重新访问实时监控,并寻找任何特定资源的其他瓶颈或高消费者。
调查来自客户端网络的出口点和指向 Experience Manager 部署网络,包括调度程序。 这些往往是瓶颈领域。 有关更多信息,请参阅 资产网络注意事项.
放大 Experience Manager 服务器。 您的 Experience Manager 部署。 Adobe客户支持可以帮助您确定您的服务器是否太小。
检查 access.log
和 error.log
出现问题时,条目的文件会出错。 查找可能指示自定义代码异常的模式。 将它们添加到您监视的事件列表。