Indice con script

Con l'Indice con script è possibile scrivere, aggiornare e mantenere opzioni di indicizzazione incrementale senza la necessità di accedere. Il robot di ricerca legge le istruzioni da un file di testo ospitato sul server.

Utilizzo dell'indice con script

Informazioni sulla configurazione dell'indicizzazione incrementale script

Per utilizzare l'indice con script, utilizzare la pagina Configurazione indice incrementale con script per specificare l'URL di un file di script (un file di testo normale) che si trova sul server. Ad esempio, https://www.mysite.com/indexlist.txt. Man mano che il tuo sito cambia, puoi aggiungere blocchi di comando al file di testo manualmente o automaticamente (con uno script attivato dall'arrivo di informazioni da un feed di notizie, un ticker di stock o altro file alterato).

Quando inizia l'indice incrementale di script, il robot di ricerca legge il file di testo ed esegue i nuovi comandi che si trovano in quel file. Per impostazione predefinita, il robot di ricerca elabora solo i nuovi comandi, determinati dalla data del file. A meno che non si controlli Clear Date al momento della configurazione di Indice script, il robot di ricerca "ricorda" l'identificatore data del blocco elaborato più di recente.

Informazioni sul file di script

Il file di script specificato nell’URL è un file di testo normale che si trova sul server. È possibile utilizzare ritorni a capo, feed di linea o entrambi per la sequenza di fine riga. Una riga vuota contiene zero o più caratteri di spazio vuoto seguiti da una sequenza di fine riga. Tutti i comandi sono senza distinzione tra maiuscole e minuscole.

Il file di testo è organizzato in blocchi che descrivono le informazioni utilizzate dal robot di ricerca quando esegue un indice incrementale script.

I blocchi sono ordinati per data, con i blocchi più vecchi nella parte superiore del file di testo e i blocchi più recenti nella parte inferiore. Ogni blocco inizia con un comando data-command a riga singola e un comando di identificatore data e termina con un separatore di riga vuoto, come nell'esempio di blocco seguente (tra sono presenti diversi comandi):

Per tutte le date ordinali inferiori al 10° quando si utilizza lo stile HTTP 1.1 è necessario uno zero iniziale. Ad esempio, il 6 novembre è 06 nov, non 6 nov.

Comando

Descrizione

data-command

La prima riga di ogni blocco inizia con uno dei due comandi data:

  • date

    Utilizzare il comando "date" per indicare che l'identificatore data sarà costituito da un giorno, una data, un'ora e un fuso orario.

  • secondi

    Utilizza secondi per indicare che l’identificatore data sarà costituito da un’ora in secondi epoch (ad esempio, 784111777). Quando utilizzi secondi , assicurati che il numero di secondi aumenti tra i blocchi.

identificatore data

Il comando identificatore data registra in genere la data e l'ora ordinali (comando data) o l'ora in secondi epoch (comando secondi) in cui le informazioni sul blocco sono state aggiunte al file. Ad esempio:

date Sun, 06 Nov 1994 08:49:37 GMT (HTTP 1.1 style) date Sunday, 06-Nov-94 08:49:37 GMT (HTTP 1.0 style) date Sun Nov 6 08:49:37 1994 (Unix asctime() date style) seconds 784111777 (Unix epoch-seconds style)

Per tutte le date ordinali inferiori al 10° quando si utilizza lo stile HTTP 1.1 è necessario uno zero iniziale. Ad esempio, il 6 novembre è 06 nov, non 6 nov.

Il robot di ricerca "ricorda" l'identificatore della data del blocco elaborato più di recente e indicizza solo le informazioni che considera "più recenti". (Il tempo reale non ha importanza per il robot di ricerca. Invece, il tempo in relazione ad altri tempi elaborati in precedenza è ciò che conta.)

Dopo che il robot di ricerca legge un blocco con un identificatore di data alle 10:00, per esempio, non legge alcun blocco che registra i tempi prima delle 10:00 p.m., indipendentemente da quando viene eseguito il funzionamento dell'indice. Nel peggiore dei casi, potresti erroneamente inserire l’anno "2040" invece di "2004" nel tuo identificatore data. In questo caso, il robot di ricerca indicizza il blocco 2040 durante l'operazione di indicizzazione successiva e poi rifiuta di leggere qualsiasi altro blocco di informazioni (a meno che non si tratti di un post-date 2040). In questo caso, rimuovi dal file di testo tutti i blocchi elaborati in precedenza, fai clic su Cancella data , quindi invialo in diretta.

riga commento

Inizia le righe del commento con il carattere "#".

Ciascuna riga di commento deve essere una riga propria; non è possibile digitare commenti di fine riga.

Una riga di commento non è considerata una riga vuota. Può anche essere visualizzato in qualsiasi punto di un blocco, anche prima di un comando data o secondi come nell'esempio seguente:

    #Added by Cathy Read after the Y2K seminar     date Mon, 29 Dec 1999 09:32:20 GMT 

action-command

Ogni blocco di testo può contenere tutti i comandi di azione desiderati. Le seguenti opzioni di comando azione corrispondono a quelle per l'indicizzazione incrementale standard:

  • add

    Utilizza con URL. Il robot di ricerca indicizza solo gli URL specificati modificati dall'ultima operazione di indicizzazione. Inoltre, il robot di ricerca segue i collegamenti contenuti in documenti specifici e indicizza solo i documenti che sono cambiati.

    Puoi seguire l’URL con nofollow o noindex parole chiave come nell'esempio seguente:

    add https://www.mydomain.com/ noindex

  • update

    Utilizza con maschera URL. Il robot di ricerca trova e aggiorna tutti i documenti che corrispondono alla maschera URL specificata.

    Puoi seguire l’URL con nofollow o noindex parole chiave come nell'esempio seguente:

    update https://www.mydomain.com/products/

  • include o exclude

    Utilizza con maschera URL. Il robot di ricerca trova e indicizza ("include") o ignora i documenti ("escludi") in base al tipo di maschera specificato.

    Ad esempio,

    include https://www.mydomain.com/products/household/lightbulbs*.html

     oppure 

    exclude https://www.mydomain.com/archive/

  • include-date o exclude-date

    Utilizza con maschera URL. Il robot di ricerca trova e indicizza ("include") o ignora i documenti ("escludi") in base sia all'URL che alla data dei documenti. Sono disponibili i seguenti tipi di maschere:

    • include-days NNN

      Il robot di ricerca indicizza tutti i documenti che corrispondono alla maschera URL specificata e sono giorni NNN o più vecchi.

      Puoi seguire la maschera URL con le parole chiave nofollow noindex e/o server-date .

    • include-date YYYY-MM-DD

      Il robot di ricerca indicizza tutti i documenti che corrispondono alla maschera URL specificata e sono vecchi o precedenti alla data AAAA-MM-GG, dove "AAAA" è l'anno a 4 cifre, "MM" è il mese a una o due cifre (1-12), e "GG" è il giorno a una o due cifre (1-31).

      Puoi seguire la maschera URL con le parole chiave nofollow noindex e/o server-date .

    • exclude-days NNN

      Disattiva l’indicizzazione di tutti i documenti che corrispondono alla maschera URL specificata e sono giorni NNN o più vecchi.

      Puoi seguire la maschera URL con la parola chiave server-date .

    • exclude-date YYYY-MM-DD

      Disabilita l’indicizzazione di tutti i documenti che corrispondono alla maschera URL specificata e che hanno la data in formato AAAA-MM-GG o precedente.

      Puoi seguire la maschera URL con la parola chiave server-date .

  • delete

    Specifica gli URL. Il robot di ricerca rimuove dall'indice i documenti identificati dall'URL.

  • deletemask

    Il robot di ricerca rimuove dall'indice i documenti che corrispondono alla maschera URL specificata.

Consulta anche Informazioni sulle maschere URL.

Esempio di file script

Nell’esempio di file di script seguente, il robot di ricerca elabora i blocchi purché la data specifichi la data dopo la data dell’identificatore data del blocco elaborato più di recente. In questo caso, si verificano le seguenti operazioni di indicizzazione:

  • Elimina y2k-problems.html dall'indice.

  • Aggiunge no-y2k-problems.html all'indice di ricerca e non segue nessuno dei collegamenti per no-y2k-problems.html.

  • Durante la ricerca per indicizzazione, escludi gli URL che corrispondono a housewares.htm e lightfixtures.html dall'indice di ricerca.

  • Includi tutte le altre directory e documenti in www.mydomain.com.

  • Aggiorna tutti i documenti all'interno delle directory products e information, eseguendo la ricerca per indicizzazione e indicizzando tutti i collegamenti sussidiari modificati dall'ultima operazione di indicizzazione.

  • Durante la ricerca per indicizzazione, escludi gli URL nella sezione archive del sito web se sono datati il 1° gennaio 1999 o prima di tale data.

  • Escludi dall’indice di ricerca gli URL che corrispondono a housewares.html e lightfixtures.html.

  • Indice i file nella directory help, ma non eseguire ricerche per indicizzazione o indicizzare i collegamenti di tali file.

  • Esegui la ricerca per indicizzazione e indicizza tutti gli altri file rilevati per www.mydomain.com.

# Start of file. 
# Added by John Smith 
date Sat, 01 Jan 2004 16:05:53 PST 
exclude https://www.mydomain.com/housewares.html 
exclude https://www.mydomain.com/lightfixtures.html 
include https://www.mydomain.com/ 
delete https://www.mydomain.com/y2k-problems.html 
add https://www.mydomain.com/no-y2k-problems.html nofollow 
 
date Sun, 02 Jan 2004 20:19:08 PST 
# Added by the wire service updater 
exclude-date 1999-01-01 https://www.mydomain.com/archive server-date 
exclude https://www.mydomain.com/housewares.html 
exclude https://www.mydomain.com/lightfixtures.html 
include https://www.mydomain.com/help/ nofollow 
include https://www.mydomain.com/ 
# no add files, just update existing files 
# update all files in the "products" directory 
update https://www.mydomain.com/products/ 
# update all files in the "information" directory 
update regexp ^https://www\.mydomain\.com/information/.*$ 
# End of file.

Configurazione di un indice incrementale script

È possibile specificare uno script creato che scrive, aggiorna e mantiene un indice incrementale senza la necessità di effettuare l'accesso. Il robot di ricerca legge le istruzioni dal file di testo ospitato sul server per eseguire l'indice incrementale.

Per configurare un indice incrementale con script

  1. Dal menu del prodotto, fai clic su Index > Scripted Index > Configuration.

  2. Nella pagina Scripted Incremental Index Configuration , immetti l’URL dello script del file di testo sul server.Script File URL

    Consultare Informazioni sull'indice con script.

  3. (Facoltativo) Controllare Clear Date se non si desidera che il robot di ricerca "ricordi" l'identificatore data del blocco elaborato più di recente.

    Per impostazione predefinita, il robot di ricerca elabora solo i nuovi blocchi di comandi presenti nel file di testo, determinati dalla data del file. Se non si desidera impostare il valore predefinito, selezionare Clear Date.

  4. Clic Save Changes.

  5. (Facoltativo) Effettua una delle seguenti operazioni:

Impostazione della pianificazione dell'indice incrementale script per un sito web live

È possibile pianificare l'indicizzazione incrementale script in modo che avvenga a intervalli regolari durante l'intera giornata.

L'ora di base selezionata è locale in base al fuso orario configurato in Impostazioni account.

Consulta Configurazione delle impostazioni account.

I server web sono spesso programmati per la manutenzione nel bel mezzo della notte. Se il server è inattivo durante un'ora di indicizzazione pianificata, il processo di indicizzazione non riuscirà. Assicurati di selezionare un’ora del giorno in cui il server web è disponibile.

La pianificazione dell'indice si applica solo al tuo indice live; non è possibile pianificare indici incrementali in sequenza.

Per impostare la pianificazione incrementale degli indici script per un sito web live

  1. Dal menu del prodotto, fai clic su Index > Scripted Index > Live Schedule.
  2. Nella pagina Scripted Incremental Index Schedule, selezionare nell'elenco a discesa Read the Scripted Incrementally Indexing File la frequenza con cui si desidera eseguire il file di testo dell'indice incrementale script, in ore o minuti.
  3. Nell'elenco a discesa Base Time, selezionare l'ora di inizio quando si desidera rigenerare un nuovo indice incrementale con script.
  4. Clic Save Changes.

Esecuzione di un indice incrementale script di un sito web live o di staging

È possibile utilizzare l'Indice incrementale script per indicizzare "parti" del sito web live o in staging, ad esempio una raccolta di pagine modificate di frequente, il tutto senza la necessità di accedere.

Per utilizzare questa funzione, assicurarsi di aver configurato un file di testo di indice incrementale con script.

Vedere Configurazione di un indice incrementale con script.

Per eseguire un indice incrementale script di un sito web live o in staging

  1. Scegliere una delle seguenti operazioni dal menu prodotto:

    • Fai clic su Index > Scripted Index > Live Index.
    • Fai clic su Index > Scripted Index > Staged Index.
  2. Clic Scripted Index Now.

  3. (Facoltativo) Se si sono verificati errori di indicizzazione, fai clic su View Errors per visualizzare il registro associato.

Visualizzazione del registro dell'indice incrementale script di un sito web live o in staging

Al termine di un indice live con script completo o di un indice con script completo in fase, puoi visualizzare il registro associato per risolvere eventuali errori.

Non puoi esportare i registri né salvarli. Tuttavia, il registro rimane disponibile per la visualizzazione fino a quando non si verifica il nuovo indice.

Per visualizzare il registro dell'indice incrementale di un sito web live o in staging

  1. Scegliere una delle seguenti operazioni dal menu prodotto:

    • Fai clic su Index > Scripted Index > Live Log.

    • Fai clic su Index > Scripted Index > Staged Log.

  2. Nella pagina di log, in alto o in basso, effettua una delle seguenti operazioni:

    • Utilizza le opzioni di navigazione First, Prev, Next, Last o Go to line per spostarsi all’interno del registro.

    • Utilizza le opzioni di visualizzazione Errors only, Wrap line o Show per perfezionare la visualizzazione.

In questa pagina

Adobe Maker Awards Banner

Time to shine!

Apply now for the 2021 Adobe Experience Maker Awards.

Apply now
Adobe Maker Awards Banner

Time to shine!

Apply now for the 2021 Adobe Experience Maker Awards.

Apply now