使用Adobe Commerce上的New Relic排除性能故障

本文介绍了使用New Relic解决Adobe Commerce云基础架构性能问题的故障排除步骤。 它还提供了获取进一步信息的资源。 下表包含推荐资源的以下问题:

  • Apdex得分低
  • 高CPU使用率
  • 高输入/输出操作
  • 中断
问题
故障排除
资源

Apdex得分低:

您的New Relic Apdex得分衡量用户对Web应用程序和服务的响应时间的满意度。

您登录到New Relic > APM >概述。 在“概述”页面的右侧,您会看到Apdex得分图。 Apdex得分为0.5或以下是一个值得关注的问题,需要调查:Web事务时间(服务器请求):

    1. 登录到New Relic > APM > (选择应用程序) >概述。 确保在主图表下拉过滤器上将过滤器设置为Web事务时间。 在“事务”表的下方,查找应用程序服务器时间。 验证是否有任何长期运行或可疑的交易。

    2. 通过转至“监控”>“事务”逐个调查,并确保为Web和最耗时的 . 设置筛选器

    3. 然后搜索使用资源的第三方模块:支付提供商、ERP等。

    4. 在APM的“监视”部分中:

      1. 单击“事务”。
      2. 向下滚动,单击显示所有事务表。
      3. 您可以按各种参数对事务进行排序,并跳转到引起怀疑的事务。
      4. 查看Apdex得分低、Count异常高或Avg时间长或Dissat %的事务。
      5. 单击每个单独的事务。 如果无法解决此问题,请提交支持票证。
      6. 如果需要进一步调查,请考虑检查非Web事务。

非Web事务时间(操作和后台任务):

    1. 登录到New Relic > APM > (选择应用程序) >概述。 确保在主图形下拉过滤器中选择非Web事务时间。 单击“事务处理”表中的单个事务处理。 查找长期运行或可疑的交易。 这包括后端作业、cron作业或导入/导出作业(包括第三方作业)。
要了解有关New Relic Apdex得分的更多信息,请参阅New Relic文档> APM Apdex >衡量用户满意度。 您还可以在我们的支持知识库中参考Adobe Commerce托管警报:Apdex警告警报

高CPU使用率:

高CPU使用率可能表示存在特别繁忙的服务,如MySQL、Redis等。

  1. 登录到New Relic >基础架构>进程。
  2. 查看CPU图形,查看是否存在占用超过100% CPU时间的停滞或高耗时的进程,并与实例上的处理器计数进行比较。 请注意资源利用率的高峰。 不建议您终止进程,除非该进程处于卡住状态。
要了解有关性能指标的更多信息,特别是单个或进程组的CPU百分比、I/O字节数和内存使用率,请参阅New Relic文档>基础架构UI页面>基础架构主机页面>进程选项卡
高I/O操作:对于每个客户,此数字将各不相同,但会与平均值有显着差异。

与以前的平均I/O操作相比,请寻找不寻常的峰值:

  1. 登录到New Relic >基础架构>进程。
  2. 查看“I/O每秒读取字节数”图表。
  3. 记录尖峰的时间。
  4. 单击APM。
  5. 确保在主图形下拉过滤器中选择Web事务时间。
  6. 设置您记录的尖峰时间的时间。
  7. 搜索导致高I/O操作的事务。
  8. 深入到每个交易跟踪>跟踪详细信息,以找到可能导致问题的原因。
服务中断:New Relic按Apdex确定服务中断。 在Apdex得分图表上,您将看到一条红线,指示Apdex < 0.4(被视为中断)。

调查中断可能需要几个步骤,包括检查Web和非Web事务、数据库和第三方事务。 Web事务:

  1. 登录到New Relic > APM >概述。 确保在下拉图形过滤器上将该过滤器设置为Web事务时间。
  2. 手动缩小时间范围。
  3. 单击“事务”。 确保将过滤器设置为Web且最耗时。 调查运行时间最长的事务处理。
  4. 如果需要进一步调查,请考虑检查非Web事务。

非Web事务:

  1. 返回概述页面,然后在下拉筛选器中切换到非Web事务。
  2. 逐一查看页面最底部的事务跟踪。
  3. 根据问题而定,您可能需要使用第三方工具(如PHP探查器)来查找瓶颈。
  4. 如果需要进一步调查,请考虑检查数据库进程。

数据库进程:

  1. 在“APM”页上,转到“监视”>“数据库”。

  2. 按最耗时的内容排序。

  3. 查看热门查询。

    注意: 更新插入查询是占用最多的CPU的查询。

  4. 从排序依据选择器切换到吞吐量,并查找导致数据库吞吐量下降的进程。

  5. 如果需要进一步调查,请考虑检查第三方服务。

第三方服务:

  1. 在APM页面上,转到监控>外部服务。
  2. 从排序依据下拉列表中选择最慢的平均响应时间。
  3. 查找就在停机之前发生的流程。
要了解有关调查特定性能问题的更多信息,请参阅New Relic文档> APM UI页面>事务页面>使用向下钻取函数
recommendation-more-help
8bd06ef0-b3d5-4137-b74e-d7b00485808a