Best practices voor middelenbewaking assets-monitoring-best-practices
Vanuit het oogpunt van Adobe Experience Manager Assets dient de monitoring het observeren en rapporteren van de volgende processen en technologieën te omvatten:
-
SysteemCPU
-
Systeemgeheugengebruik
-
Systeemschijf-IO en IO-wachttijd
-
IO van systeemnetwerk
-
JMX MBeans voor:
- Gebruik van heap
- Asynchrone processen, zoals workflows
-
Gezondheidscontroles op de OSGi-console
Doorgaans Assets kan op twee manieren worden gemonitord: live monitoring en langetermijnmonitoring.
Live bewaking live-monitoring
U zou levende controle tijdens de prestaties testende fase van uw ontwikkeling of tijdens high-load situaties moeten uitvoeren om de prestatieskenmerken van uw milieu te begrijpen. Doorgaans moet live controle worden uitgevoerd met behulp van een reeks gereedschappen. Hier volgen enkele aanbevelingen:
-
Visuele VM: Met Visuele VM kunt u gedetailleerde Java VM-informatie weergeven, zoals CPU-gebruik en Java-geheugengebruik. Bovendien kunt u code die op een instantie wordt uitgevoerd, kopiëren en evalueren.
-
Boven: De bovenkant is een bevel van Linux dat omhoog een dashboard opent, dat gebruiksstatistieken, met inbegrip van cpu, geheugen, en gebruik IO toont. Het biedt een overzicht op hoog niveau van wat er op een instantie gebeurt.
-
Bovenkant: Htop is een interactieve procesviewer. Deze biedt naast wat Top kan bieden, een gedetailleerd CPU- en geheugengebruik. De bovenkant kan op de meeste systemen van Linux worden geïnstalleerd gebruikend
yum install htop
ofapt-get install htop
. -
Iotop: Iotop is een gedetailleerd dashboard voor schijf-IO-gebruik. Het toont bars en meters die de processen beschrijven die schijf IO en de hoeveelheid gebruiken zij. Iotop kan op de meeste systemen van Linux worden geïnstalleerd gebruikend
yum install iotop
ofapt-get install iotop
. -
IFtop: Internet toont gedetailleerde informatie over Ethernet/netwerkgebruik. De vertoningen van IFP per communicatiekanaalstatistieken over de entiteiten die ethernet gebruiken en de hoeveelheid bandbreedte zij gebruiken. Installeer de laptop op de meeste Linux-systemen met
yum install iftop
ofapt-get install iftop
. -
Java Flight Recorder (JFR): Een commercieel hulpmiddel van Oracle dat u vrij in non-production milieu's kunt gebruiken. Zie voor meer informatie Java-vluchtrecorder gebruiken om CQ-runtimeproblemen te onderzoeken.
-
Experience Manager error.log, bestand: U kunt de Experience Manager error.log, bestand voor meer informatie over fouten die in het systeem zijn aangemeld. De opdracht gebruiken
tail -F quickstart/logs/error.log
om fouten te identificeren die u zou moeten onderzoeken. -
Workflowconsole: Gebruik de workflowconsole om workflows te controleren die achterblijven of vastlopen.
Doorgaans gebruikt u deze gereedschappen samen om een uitgebreid idee te krijgen van de prestaties van uw Experience Manager -instantie.
Controle op lange termijn long-term-monitoring
Langdurige monitoring van een Experience Manager instantie omvat het gedurende langere tijd controleren van dezelfde delen die live worden bewaakt. Het omvat ook het definiëren van waarschuwingen die specifiek zijn voor uw omgeving.
Aggregatie en rapportage van stamhout log-aggregation-and-reporting
Er zijn verscheidene hulpmiddelen beschikbaar om logboeken samen te voegen, bijvoorbeeld Splunk™ en Elastic Search/Logstash/Kabana (ELK). De uptime van uw Experience Manager bijvoorbeeld, is het belangrijk voor u om logboekgebeurtenissen te begrijpen specifiek voor uw systeem en alarm tot stand te brengen die op hen wordt gebaseerd. Een goede kennis van uw ontwikkeling en verrichtingspraktijken kan u helpen beter begrijpen hoe te om uw proces van de logboeksamenvoeging te stemmen om kritieke alarm te produceren.
Milieu-monitoring environment-monitoring
De bewaking van het milieu omvat de bewaking van het volgende:
- Netwerkdoorvoer
- Schijf-IO
- Geheugen
- CPU-gebruik
- JMX MBeans
- Externe websites
U hebt externe hulpmiddelen nodig, zoals NewRelic™ en AppDynamics™ om elk item te controleren. Met deze gereedschappen kunt u waarschuwingen definiëren die specifiek zijn voor uw systeem, zoals een hoog systeemgebruik, een back-up van de workflow, storingen in de health check of niet-geverifieerde toegang tot uw website. Adobe adviseert geen bepaalde hulpmiddelen over anderen. Zoek het hulpmiddel dat voor u werkt, en hefboomwerking het om de besproken punten te controleren.
Interne toepassingsbewaking internal-application-monitoring
De interne toepassingscontrole omvat de controle van de toepassingscomponenten die omhoog maken Experience Manager stapel, inclusief JVM, de opslagplaats voor inhoud en bewaking via aangepaste toepassingscode die op het platform is gebaseerd. In het algemeen wordt het uitgevoerd via JMX-boonen die rechtstreeks kunnen worden gecontroleerd door veel populaire monitoroplossingen, zoals SolarWinds ™, HP OpenView™, Hyperic™, Zabbix™ en andere. Voor systemen die geen directe verbinding met JMX ondersteunen, kunt u shellscripts schrijven om de JMX-gegevens te extraheren en aan deze systemen beschikbaar te maken in een indeling die ze zelf begrijpen.
Externe toegang tot de JMX-mabeans is niet standaard ingeschakeld. Voor meer informatie over controle via JMX raadpleegt u Controle en beheer met behulp van JMX-technologie.
In veel gevallen is een basislijn nodig om een statistiek effectief te kunnen controleren. Als u een basislijn wilt maken, observeert u het systeem onder normale bedrijfsomstandigheden gedurende een vooraf bepaalde periode en identificeert u vervolgens de normale maatstaf.
JVM-bewaking
Net als bij elke op Java gebaseerde toepassingsstapel, Experience Manager is afhankelijk van de bronnen die hem via de onderliggende Java Virtual Machine worden verschaft. U kunt de status van veel van deze bronnen controleren via Platform MXBeans die door JVM beschikbaar worden gemaakt. Voor meer informatie over MXBeans, zie Het gebruiken van Platform MBean Server en Platform MXBeans.
Hier volgen enkele basislijnparameters die u kunt controleren voor JVM:
Geheugen
MBean: lava.lang:type=Memory
- URL: /system/console/jmx/java.lang:type=Memory
- Instanties: Alle servers
- Alarmdrempel: Wanneer het heap- of non-heap-geheugengebruik meer dan 75% van het overeenkomstige maximale geheugen bedraagt.
- Alarmdefinitie: Het systeemgeheugen is onvoldoende of er is een geheugenlek in de code. Analyseer een draadstortplaats om bij een definitie aan te komen.
Opmerking: De informatie die door dit boon wordt verstrekt wordt uitgedrukt in bytes.
Threads
- MBean:
java.lang:type=Threading
- URL: /system/console/jmx/java.lang:type=Threading
- Instanties: Alle servers
- Alarmdrempel: Wanneer het aantal draden groter is dan 150% van de basislijn.
- Alarmdefinitie: Of er is een actief wegloopproces, of een inefficiënte verrichting verbruikt een grote hoeveelheid middelen. Analyseer een draadstortplaats om bij een definitie aan te komen.
Experience Managertoezicht
Experience Manager stelt ook een reeks statistieken en verrichtingen door JMX bloot. Deze kunnen helpen systeemgezondheid beoordelen en potentiële problemen identificeren alvorens zij gebruikers beïnvloeden. Zie voor meer informatie documentatie op Experience Manager JMX MBeans.
Hier zijn enkele basislijnparameters die u kunt controleren Experience Manager:
Replication-agents
-
MBean:
com.adobe.granite.replication:type=agent,id=”<AGENT_NAME>”
-
URL: /system/console/jmx/com.adobe.granite.replication:type=agent,id="<agent_name>"
-
Instanties: Eén auteur en alle publicatie-instanties (voor uitlijningsmiddelen)
-
Alarmdrempel: Wanneer de waarde van
QueueBlocked
is waar of de waarde vanQueueNumEntries
is groter dan 150% van de basislijn. -
Alarmdefinitie: Aanwezigheid van een geblokkeerde rij in het systeem erop wijst die dat het replicatiedoel neer of onbereikbaar is. Vaak leiden netwerk- of infrastructuurproblemen ertoe dat overdreven items in de wachtrij worden geplaatst, wat de systeemprestaties nadelig kan beïnvloeden.
Opmerking: Vervang voor de parameters MBean en URL <AGENT_NAME>
met de naam van de replicatieagent wilt u controleren.
Sessieteller
- MBean:
org.apache.jackrabbit.oak:id=7,name="OakRepository Statistics",type="RepositoryStats"
- URL: /system/console/jmx/org.apache.jackrabbit.oak:id=7,name="OakRepository Statistics",type="RepositoryStats"
- Instanties: Alle servers
- Alarmdrempel: Wanneer geopende sessies de basislijn met meer dan 50% overschrijden.
- Alarmdefinitie: Sessies kunnen worden geopend via een stuk code en nooit worden gesloten. Dit kan in de loop der tijd langzaam gebeuren en uiteindelijk geheugenlekken in het systeem veroorzaken. Hoewel het aantal sessies op een systeem moet fluctueren, mogen ze niet voortdurend toenemen.
Gezondheidscontroles
Gezondheidscontroles die beschikbaar zijn in de bewerkingsdashboard beschikken over overeenkomstige JMX MBans voor controle. Nochtans, kunt u de controles van de douanegezondheid schrijven om extra systeemstatistieken bloot te stellen.
Hier zijn een aantal uit-van-de-doos gezondheidscontroles die nuttig zijn om te controleren:
-
Systeemcontroles
- MBean:
org.apache.sling.healthcheck:name=systemchecks,type=HealthCheck
- URL: /system/console/jmx/org.apache.sling.health check:name=systemchecks,type=HealthCheck
- Instanties: Eén auteur, alle publicatieservers
- Alarmdrempel: Wanneer de status niet OK is
- Alarmdefinitie: De status van een van de meetwaarden is WAARSCHUWING of KRITIEK. Controleer de logboekattributen voor meer informatie over de oorzaak van de kwestie.
- MBean:
-
Replicatiereeks
- MBean:
org.apache.sling.healthcheck:name=replicationQueue,type=HealthCheck
- URL: /system/console/jmx/org.apache.sling.health check:name=replicationQueue,type=HealthCheck
- Instanties: Eén auteur, alle publicatieservers
- Alarmdrempel: Wanneer de status niet OK is
- Alarmdefinitie: De status van een van de meetwaarden is WAARSCHUWING of KRITIEK. Controleer de logboekattributen voor meer informatie over de rij die de kwestie veroorzaakte.
- MBean:
-
Responsprestaties
- MBean:
org.apache.sling.healthcheck:name=requestsStatus,type=HealthCheck
- URL: /system/console/jmx/org.apache.sling.health check:name=requestStatus,type=HealthCheck
- Instanties: Alle servers
- Duur van waarschuwing: Wanneer de status niet OK is
- Alarmdefinitie: De status van een van de meetwaarden is WAARSCHUWING of KRITIEKE status. Controleer de logboekattributen voor meer informatie over de rij die de kwestie veroorzaakte.
- MBean:
-
Query-prestaties
- MBean:
org.apache.sling.healthcheck:name=queriesStatus,type=HealthCheck
- URL: /system/console/jmx/org.apache.sling.health check:name= queryStatus,type=HealthCheck
- Instanties: Eén auteur, alle publicatieservers
- Alarmdrempel: Wanneer de status niet OK is
- Alarmdefinitie: Één of meerdere vragen die langzaam in het systeem lopen. Controleer de logboekattributen voor meer informatie over de vragen die de kwestie veroorzaakten.
- MBean:
-
Actieve pakketten
- MBean: org.apache.sling.health check:name=inactiveBundles,type=HealthCheck
- URL: /system/console/jmx/org.apache.sling.health check:name=inactiveBundles,type=HealthCheck
- Instanties: Alle servers
- Alarmdrempel: Wanneer de status niet OK is
- Alarmdefinitie: Aanwezigheid van inactieve of onopgeloste OSGi-bundels op het systeem. Controleer het logkenmerk voor meer informatie over de bundels die de uitgave hebben veroorzaakt.
-
Logfouten
- MBean:
org.apache.sling.healthcheck:name=logErrorHealthCheck,type=HealthCheck
- URL: /system/console/jmx/org.apache.sling.health check:name=logErrorHealthCheck,type=HealthCheck
- Instanties: Alle servers
- Alarmdrempel: Wanneer de status niet OK is
- Alarmdefinitie: De logbestanden bevatten fouten. Controleer de logboekattributen voor meer informatie over de oorzaak van de kwestie.
- MBean:
Gemeenschappelijke kwesties en resoluties common-issues-and-resolutions
In het proces van controle, als u problemen ontmoet, zijn hier sommige het oplossen van problementaken die u kunt uitvoeren om gemeenschappelijke kwesties met op te lossen Experience Manager exemplaren:
- Als u TarMK gebruikt, voert u de Tar-compressie vaak uit. Zie voor meer informatie Behoud van de opslagplaats.
- Controleren
OutOfMemoryError
logboeken. Zie voor meer informatie Geheugenproblemen analyseren. - Controleer de logboeken om het even welke verwijzingen naar unindexed vragen, boomstamtraversals, of indextraversals. Deze wijzen op unindexed vragen of op ontoereikend geïndexeerde vragen. Voor beste praktijken bij het optimaliseren van vraag en het indexeren prestaties, zie Beste praktijken voor Vragen en het Indexeren.
- Gebruik de workflowconsole om te controleren of uw workflows naar behoren werken. Indien mogelijk kunt u meerdere workflows samenvoegen tot één workflow.
- Herzie live monitoring en zoek naar extra knelpunten of hoge consumenten van specifieke hulpbronnen.
- Onderzoek de uitgang punten van het cliëntnetwerk en de ingangen richten aan Experience Manager instantienetwerk, inclusief de verzender. Dit zijn vaak knelpunten. Zie voor meer informatie Elementennetwerkoverwegingen.
- Uw Experience Manager server. U kunt een te grote hoeveelheid Experience Manager -instantie. Adobe Klantenondersteuning kan u helpen te bepalen of uw server te klein is.
- Onderzoek
access.log
enerror.log
bestanden voor ingangen rond de tijd van iets gingen fout . Zoek naar patronen die op anomalieën van de douanecode kunnen wijzen. Voeg deze toe aan de lijst met gebeurtenissen die u controleert.