Il bots scheda

Questa scheda contiene informazioni che spiegano come identificare se e cosa bots stanno causando problemi al sito.

Panoramica di alto livello di bots:

  • A bot è un componente software che esegue operazioni automatizzate ripetitive. Con l'evoluzione dell'intelligenza artificiale e dell'apprendimento automatico, le attività, i metodi e le interazioni di bots stanno cambiando. Ci sono buono bots che traggono vantaggio dai siti effettuando ricerche per indicizzazione e aggiungendoli ai motori di ricerca internet. In questo modo gli utenti di Internet vengono guidati al sito attraverso i risultati dei motori di ricerca. A buono bot in genere rispetta i limiti posizionati sul bot da un robots.txt file o impostazioni in una console del motore di ricerca. I limiti possono limitare l'accesso al sito o a parti del sito.

  • Malizioso bots ignora robots.txt file o possono falsificare una bot tramite il campo request user agent (agente utente richiesta) dei dati della richiesta HTTP. Alcune cose dannose bots eseguire le operazioni seguenti:

    • Aggiungi il carico a un sito per negare l’accesso al sito agli utenti legittimi.
    • Eliminare e riutilizzare i contenuti senza autorizzazione.
    • Registrare account falsi per inondare i servizi e-mail o gli indirizzi o reindirizzare ad altri siti (SPAM bots).
    • Creare visualizzazioni false (Viewbots).
    • Acquista prodotti o biglietti (Focused bots).
  • Gestione bots

    • Observation for Adobe Commerce ha visualizzazioni di bot traffico:

      • Mostra il totale dei messaggi non memorizzati in cache bot attività che visualizza il carico che un bot sta aggiungendo a un sito e quando si verifica tale caricamento.

      • Mostra la bots che generano errori. In genere, se un bot : aggiunta di carico che causa problemi al sito, che bot L'indirizzo IP o ha la frequenza più elevata di errori.

      • Mostra bot nomi (valori dei campi dell’agente utente della richiesta) e indirizzi IP da gestire tramite:

        • Fastly (limitando la velocità o VCLs che bloccano indirizzi IP, intervalli o bots per nome (valore).
        • Aggiunta di buone bot informazioni al robots.txt field per limitare o limitare la velocità di accesso al sito.
        • Gestione Bing o Google bots tramite la console dei motori di ricerca.

Experimental Potential Malicious Bots frame

Potenziale sperimentale Bots dannosi frame

Il Experimental Potential Malicious Bots frame frame viene eseguito su 12 query distinte e complesse. Rileva le firme di richieste IP dannose e quindi aggrega i risultati, le somme e li ordina in base al conteggio in ordine decrescente. Le query contengono una moltitudine di firme di dati di exploit CVE e altre richieste dannose. Anche quando gli exploit sono bloccati da correzioni/patch di sicurezza e non rappresentano una minaccia per il sito, la richiesta deve ancora essere gestita dal sito web. Il volume delle richieste può diventare significativo in un breve periodo di tempo. In questo frame non vengono visualizzate tutte le richieste provenienti dall’indirizzo IP, ma solo quelle con segnali che indicano che la richiesta aveva un intento sospetto.

Verifica che il traffico sia sospetto e non provenga da un Content Distributed Network (CDN) che potrebbe anche fornire richieste valide. Se le richieste provengono da un indirizzo IP CDN, contatta il fornitore del servizio per aiutarti a bloccare il traffico sospetto attraverso la rete. Se devi bloccare l’indirizzo o richiedere l’URL, consulta Blocca traffico dannoso per Adobe Commerce su Fastly livello nella Knowledge Base di supporto di Adobe Commerce.

Rate of HTTP request per second (top 25) during requested time period

Frequenza delle richieste HTTP al secondo (primi 25) durante il periodo di tempo richiesto

Il Rate of HTTP request per second (top 25) during requested time period mostra gli indirizzi IP con le richieste più alte al secondo durante l’intervallo di tempo selezionato. Se anche questi indirizzi sono nella tabella precedente, assicurati che non siano indirizzi CDN e dannosi e bloccalo tramite Fastly.

Total Bot traffic by bot name:

Traffico bot totale per nome bot durante il periodo di tempo selezionato:

Il Total Bot traffic by bot name during selected time period contiene il conteggio aggregato delle richieste non memorizzate in cache in cui request_user_agent il campo ha una stringa di bots nel valore. Questo può essere o meno il nome bot come request_user_agent il valore del campo può essere oggetto di spoofing. Il valore sotto Count è la colonna più importante.

Total Bot Traffic by Bot name/IP address

Traffico bot totale per nome bot/indirizzo IP durante il periodo di tempo selezionato Come bloccare il traffico da bot a livello Fastly O gestire i bot tramite il file robots.txt Best practice per i robot Adobe Commerce.txt

Il Total Bot Traffic by Bot name/IP address during selected time period How to block bot traffic on Fastly level OR manage bots through your robots.txt file Best practices for Adobe Commerce robots.txt mostra gli stessi dati della tabella precedente, ma aggiunge indirizzi IP che effettuano le richieste per conto del bot. Come dannoso bots parodia buona bots, gli indirizzi IP devono essere verificati tramite siti web che identificano gli indirizzi IP abusivi o tramite chiosco servizi o DNS lookups. Ad esempio: Google pubblica i propri googlebot Indirizzi IP e Microsoft dispone di uno strumento di verifica per Bingbots.

Graph - Bots with HTTP status errors

Grafico: bot con errori di stato HTTP durante il periodo di tempo selezionato Come bloccare il traffico da bot a livello Fastly O gestire i bot tramite il file robots.txt Best practice per i robot Adobe Commerce.txt

Il Graph - Bots with HTTP status errors during selected time period How to block bot traffic on Fastly level OR manage bots through your robots.txt file Best practices for Adobe Commerce robots.txt il grafico mostra gli errori su bots che si dichiarano nel campo request user agent (richiede agente utente). Ciò non significa necessariamente che l’errore sia causato dal volume proveniente da bot o altro traffico. Gli errori potrebbero essere bot sta richiedendo informazioni inesistenti o si è verificato un altro problema nella richiesta.

Se si verifica un picco di errori sugli indirizzi IP durante l’instabilità o l’interruzione del sito, potrebbero essere sospettati di un problema del sito.

Table - IPs that do not identify as bots

Tabella: IP che non si identificano come bot con errori di stato HTTP durante il periodo di tempo selezionato Come bloccare il traffico da bot a livello Fastly O gestire i bot tramite il file robots.txt Best practice per i robot Adobe Commerce.txt

Il Table - IPs that do not identify as bots with HTTP status errors during selected time period How to block bot traffic on Fastly level OR manage bots through your robots.txt file Best practices for Adobe Commerce robots.txt La tabella mostrerà le richieste IP con codici di stato http diversi da 200 che NON si autoidentificano come bots nel campo richiedi agente utente. Questi indirizzi IP potrebbero essere indirizzi IP dannosi, soprattutto se il conteggio è elevato per il periodo di tempo selezionato.

Se il numero di codici di stato http diversi da 200 è basso e gli intervalli di indirizzi IP non sono simili, gli indirizzi potrebbero non contribuire ai problemi del sito.

Table – Cache Status ‘ERROR’

Tabella: tabella di dettaglio ERROR dello stato della cache (cosa fanno questi IP?) Come bloccare il traffico da bot a livello Fastly O gestire i bot tramite il file robots.txt Best practice per i robot Adobe Commerce.txt

Quando gli indirizzi IP generano una frequenza elevata di errori, chiedi cosa stanno facendo? Il Table – Cache Status ‘ERROR’ detail table (what are these IPs doing?) How to block bot traffic on Fastly level OR manage bots through your robots.txt file Best practices for Adobe Commerce robots.txt La tabella mostra l’URL richiesto e il valore dello stato HTTP per le richieste con uno stato della cache ERROR valore. La frequenza è influenzata dall’URL, pertanto il conteggio potrebbe essere basso. Ricorda che l’indirizzo IP potrebbe effettuare migliaia di richieste durante il periodo di tempo selezionato. Si tratta di una visualizzazione rispetto a un massimo di 2000 richieste durante l’intervallo di tempo (il limite di visualizzazione dei record).

Show 5XX status distribution

Mostra distribuzione dello stato 5XX tra gli indirizzi IP (primi 200 indirizzi) Come bloccare il traffico da bot a livello Fastly O gestire i bot tramite il file robots.txt Best practice per i robot Adobe Commerce.txt

Il Show 5XX status distribution across IP addresses (top 200 addresses) How to block bot traffic on Fastly level OR manage bots through your robots.txt file Best practices for Adobe Commerce robots.txt è potente. Mostra gli indirizzi IP che hanno codici di stato http 5XX durante il periodo di tempo selezionato. Se un indirizzo IP effettua un elevato volume di richieste e il sito è interessato al punto tale da non essere in grado di gestire il traffico, gli indirizzi IP che effettuano la frequenza più elevata di richieste avranno in genere il maggior volume di errori. I codici di stato http 5XX indicano in genere un sito che ha difficoltà a rispondere alle richieste.

Più è ampia la barra, maggiore è la percentuale di errori che l’indirizzo IP ha nel numero totale di errori 5xx durante quel periodo di tempo. Nota: un indirizzo IP può avere più segmenti nel grafico se dispone di più codici di stato http (ad esempio, stati http 502 e 503).

La distribuzione tipica sarebbe indicata verso il lato destro della barra in cui gli indirizzi IP sono uguali in larghezza oppure ci sarebbero alcune barre larghe con conteggi molto bassi.

Se passi il cursore del mouse sul segmento della barra, viene visualizzato il numero di errori indicati durante il periodo di tempo selezionato.

IP cache status (MISS, PASS, ERROR) and HTTP status

Stato della cache IP (MISS, PASS, ERROR) e stato http durante il periodo di tempo selezionato Come bloccare il traffico da bot a livello Fastly O gestire i bot tramite il file robots.txt Best practice per i robot Adobe Commerce.txt

Questo IP cache status (MISS, PASS, ERROR) and HTTP status during selected time period How to block bot traffic on Fastly level OR manage bots through your robots.txt file Best practices for Adobe Commerce robots.txt mostra il conteggio dei codici di stato HTTPS e le richieste non memorizzate in cache per IP nell’intervallo di tempo selezionato. Indica il carico proporzionale da ciascun indirizzo IP e il volume totale. Mostrerà gli indirizzi IP con il maggior numero di richieste.

Fastly Cache Summary for selected time period

Riepilogo Fastly Cache per il periodo di tempo selezionato

Se si fa clic sul pulsante Error nel grafico seguente, puoi confrontare gli ultimi due grafici tra loro. Questo può aiutare a indicare dove il caricamento contribuisce ai problemi del sito.

Controllo rapido degli errori

Graph - IPs that do not identify as bots

IP che non si identificano come bot senza errori durante il periodo di tempo selezionato Come bloccare il traffico da bot a livello Fastly O gestire i bot tramite il file robots.txt Best practice per i robot Adobe Commerce.txt

Il Graph - IPs that do not identify as bots without error during selected time period How to block bot traffic on Fastly level OR manage bots through your robots.txt file Best practices for Adobe Commerce robots.txt Il frame mostra il campo dell’agente utente della richiesta, l’indirizzo IP e il codice di stato per le richieste in cui il campo dell’agente utente della richiesta non indica un bot. Questo frame può mostrare richieste ad alta frequenza da qualsiasi indirizzo IP, ma prestare attenzione alle richieste ad alta frequenza, soprattutto durante un periodo di tempo in cui il sito può avere problemi.

Graph - Suspicious Non-Bot traffic

Traffico non bot sospetto durante il periodo di tempo selezionato

Il Graph - Suspicious Non-Bot traffic during selected time period Il grafico cerca il valore Go-http-client dell’agente utente della richiesta, ma verrà esteso per esaminare altri valori sospetti dell’agente utente della richiesta. Questo valore dell'agente utente della richiesta viene utilizzato dai siti per la connessione dai servizi e può essere valido, ma è utilizzato anche da utenti malintenzionati bots.

Graph - Bot traffic by Bot name

Grafico: traffico bot per nome bot durante il periodo di tempo selezionato)

Il Graph - Bot traffic by Bot name during selected time period mostra gli stessi dati del traffico Bot totale per Bot nome durante la tabella del periodo di tempo selezionato nella parte superiore della scheda. Mostra i dati tramite la timeline in modo da poter vedere quando le richieste di bots e la loro distribuzione.

Graph - Top 250 Bot Names and IP addresses

Primi 250 nomi di bot e indirizzi IP durante il periodo di tempo selezionato Come bloccare il traffico da bot a livello Fastly O gestire i bot tramite il file robots.txt Best practice per i robot Adobe Commerce.txt

Il Graph - Top 250 Bot Names and IP addresses during selected time period How to block bot traffic on Fastly level OR manage bots through your robots.txt file Best practices for Adobe Commerce robots.txt Il fotogramma mostra gli stessi dati del totale Bot Traffico per nome bot/indirizzo IP durante la tabella del periodo di tempo selezionata nella parte superiore della scheda. Mostra i dati tramite la timeline e facet per indirizzo IP. Questo mostra quando le richieste di bots vengono effettuate, l’IP che effettua le richieste e le distribuzioni delle richieste.

Blocked Bot name / IP addresses (in Fastly)

Nome bot/indirizzi IP bloccati (in Fastly) durante il periodo di tempo selezionato. Questo grafico mostra il traffico da bot e gli IP che hanno restituito il codice di stato HTTP 403 non consentito

Il Blocked Bot name / IP addresses (in Fastly) during selected time period. This graph displays bot traffic and IPs that were returned a 403 Forbidden HTTP Status code mostra il nome bot e gli indirizzi IP bloccati. Questo grafico mostra come tutte le richieste sono bloccate in Fastly avanti.

Blocked non-Bot name / IP addresses (in Fastly)

Nome/indirizzo IP non bot bloccato (in Fastly) durante il periodo di tempo selezionato. Questo grafico mostra il traffico non-bot e gli IP che hanno restituito il codice di stato HTTP 403 non consentito

Il Blocked non-Bot name / IP addresses (in Fastly) during selected time period graph displays non-bot traffic and IPs that were returned a 403 Forbidden HTTP Status code mostra gli indirizzi IP che non si identificano come bot che sono stati bloccati tramite Fastly.

This table shows the number of user agents per IP address, number of successful, unsuccessful and blocked requests:

Questa tabella mostra il numero di agenti utente per indirizzo IP e il numero di richieste riuscite, non riuscite e bloccate:

Malizioso bots spesso spoof altro bots attraverso il valore del Request User Agent campo. Questa tabella mostra quanti valori univoci ha l’indirizzo IP in quel campo. Più alto è il valore in Request User Agent più l’indirizzo IP è sospetto.

IP with non-200 status errors

IP con errori di stato non 200 - senza stato 403

Il IP with non-200 status errors – without 403 status Il frame mostra la distribuzione nell’arco temporale selezionato di indirizzi IP con codici di stato HTTP diversi da 200. I valori più elevati che si osservano su un singolo IP o gruppo di indirizzi IP richiedono ulteriori indagini.

IP with 403 status codes:

IP con codici di stato 403:

Il IP with 403 status codes il fotogramma mostra le richieste non memorizzate in cache senza cache_status=ERROR che hanno uno stato HTTP 403. Questo può mostrare che il server di origine è l’origine del 403 (non autorizzato) piuttosto che un blocco da Fastly.

Top 5 with non-200 status codes

Primi 5 con codici di stato diversi da 200 che mostrano cache_status:

Il Top 5 with non-200 status codes showing cache_status tabella mostra a livello di IP / stato i conteggi di ciascuno con il cache_status valore.

Pageview Latency will show as spikes

La latenza di Pageview verrà visualizzata come picchi in questo grafico:

Il Pageview Latency will show as spikes on this graph: mostra la latenza di risposta di caricamento pagina/API che potrebbe essere in linea con il bot traffico.

recommendation-more-help
c2d96e17-5179-455c-ad3a-e1697bb4e8c3