Domande frequenti

Flash Adobe

Pagina delle domande frequenti che illustra il supporto dell'indicizzazione e della ricerca di file SWF su un sito web.

Di seguito sono riportate le domande comuni relative ai file SWF:

Quando un file SWF viene sottoposto a ricerca per indicizzazione e indicizzato?

Un file SWF viene sottoposto a ricerca per indicizzazione e indicizzato se è contenuto in un tag di incorporamento o di oggetto in una pagina HTML, come nell'esempio seguente:

<embed src="Flash-file-URL">  
 
<object>  
<param name=movie value="Flash-file-URL">  
</object> 

Un file SWF viene riconosciuto anche se si elenca l’URL del file come punto di ingresso.

Consulta Aggiunta di più punti di ingresso URL da indicizzare.

Cosa devo fare per indicizzare un file SWF?

Per eseguire la ricerca per indicizzazione dei file SWF, selezionare il tipo di contenuto Adobe Flash Movies ( Settings > Crawling > Content Types).

Se in un documento HTML è presente un riferimento al file di Flash da un tag <embed> o <object> , il testo viene indicizzato e tutti gli URL elencati nel file vengono sottoposti a ricerca per indicizzazione.

Se al file non viene fatto riferimento da un tag <embed> o <object>, è possibile elencare il file SWF in un tag <a href=...> in un documento HTML o come punto di ingresso URL.

Consulta Aggiunta di più punti di ingresso URL da indicizzare.

Come vengono riconosciuti i file SWF?

I file SWF sono identificati dal seguente tipo MIME:

application/x-shockwave-flash

I file SWF vengono riconosciuti anche con i tipi application/octet-stream" o text/plain MIME, purché l’estensione del file sia .swf.

Un server non configurato correttamente può utilizzare un tipo MIME diverso per i file SWF. Assicurati di controllare la configurazione del server in caso di problemi di ricerca per indicizzazione e indicizzazione dei file SWF.

Come vengono indicizzati i file SWF?

Il testo contenuto in un file SWF è indicizzato come se fosse <body> testo nella pagina HTML di inclusione. Se un risultato della ricerca trova il testo contenuto in un file SWF incorporato, il risultato effettivamente si collega alla pagina HTML di inclusione e non al file SWF. In questo modo, il file SWF viene visualizzato nel contesto corretto.

Se un file SWF contiene un URL come azione "Carica filmato", il testo nel file SWF a cui si fa riferimento viene indicizzato come parte della pagina HTML di inclusione.

Se un file SWF contiene un URL come azione "Ottieni URL", l’URL viene sottoposto a ricerca per indicizzazione e successivamente, proprio come un riferimento HTML <a href=...> viene sottoposto a ricerca per indicizzazione e successivamente.

Se un file SWF è elencato come punto di ingresso URL, il testo del file SWF è indicizzato come una singola pagina. Risultato di ricerca che trova il testo da un file SWF di entrypoint direttamente nel filmato, non in una pagina HTML di inclusione.

Consulta Aggiunta di più punti di ingresso URL da indicizzare.

Un file SWF viene conteggiato come pagina?

No. Un file SWF è considerato parte della relativa pagina HTML di inclusione. Anche tutti gli URL "Load Movie" contenuti nei file SWF sono considerati parte della pagina HTML di inclusione. Pertanto, i file SWF a cui si fa riferimento da una pagina HTML non vengono conteggiati come "pagina" per il totale della pagina dell'account.

Se un file SWF è elencato come punto di ingresso URL, allora quel file SWF e tutti gli URL "Carica filmato" elencati in quel file SWF sono conteggiati come una "pagina" per il totale di pagina dell'account.

Come posso impedire l'indicizzazione di singoli file SWF?

Per impedire l’indicizzazione di un file SWF, è possibile aggiungere un tag meta di robot ( <meta name="ROBOTS" content="NOINDEX">) o un tag <noindex> al documento HTML che lo contiene. Cioè, il documento che contiene il tag <embed> o <object> .

È inoltre possibile utilizzare il tag meta ( <meta name="ROBOTS" content="NOFOLLOW">) dei robot per impedire i seguenti URL contenuti nel file SWF. Se il documento HTML di cui fa parte è stato disattivato, le azioni elencate come “Ottieni URL” nel file SWF non sono seguite.

Come si impedisce l’indicizzazione dei file SWF sul sito web?

Per disattivare l’indicizzazione SWF, deselezionare il tipo di contenuto Adobe Flash Movies ( Settings > Crawling > Content Types).

È inoltre possibile scegliere di utilizzare URL Masks per disabilitare l'indicizzazione dei file SWF.

Consulta Aggiunta di maschere URL per indicizzare o meno parti di indice di….

Per disabilitare l'indicizzazione SWF, immetti una delle seguenti maschere URL:

  • exclude *.swf (se non utilizzi espressioni regolari)
  • exclude regexp ^.*\.swf$ (se utilizzi espressioni regolari)

Consulta Espressioni regolari.

Come mai non riesco a cercare i file SWF cinesi, giapponesi o coreani sul mio sito web?

La ricerca/merchandising del sito ottiene UTF-8 dai file SWF creati con Adobe Flash. L'UTF-8 non contiene alcuna indicazione di lingua. Se è stato selezionato il tipo di contenuto Adobe Flash Movies ( Settings > Crawling > Content Types), è necessario utilizzare le iniezioni di metadati per specificare la lingua utilizzata dal file SWF.

Vedere Aggiunta di definizioni di iniezione di campi.

I file SWF precedenti non specificano neanche un set di caratteri. Se è stato selezionato il tipo di contenuto SWF Adobe Flash Movies ( Settings > Crawling > Content Types), è necessario utilizzare le iniezioni di metadati per specificare il set di caratteri utilizzato nel file SWF.

Ricerca generale

Una pagina delle domande frequenti che illustra come la ricerca/merchandising dei siti aiuta i clienti che visitano il tuo sito web a trovare ciò che stanno cercando.

Di seguito sono riportate le domande comuni relative alla ricerca generale:

Di seguito sono riportate le domande comuni sulle funzioni di ricerca:

Devo installare un software per utilizzare la ricerca/merchandising sul sito?

No. Questo è il vantaggio principale della ricerca/merchandising del sito. Il motore è un'applicazione professionale ospitata e gestita interamente sui nostri server ad alte prestazioni. Questo rende il software più facile da usare rispetto ad altre soluzioni di ricerca. L’unica cosa da fare è aggiungere una piccola quantità di codice HTML alle tue pagine in modo che i clienti del tuo sito web possano inserire le ricerche. La ricerca/merchandising del sito si occupa di tutto il resto.

Cosa succede quando il mio sito supera il limite di pagina?

Continuiamo a servire le tue ricerche in modo che i visitatori possano cercare il tuo sito web senza interruzioni. Per vedere se il tuo sito web supera il limite di pagina, controlla lo stato del tuo Full Index o Live Log.

Vedere Informazioni sull'indice completo.

Vedere Visualizzazione dell'intero registro dell'indice di una live o di una staging….

Come posso modificare l’indirizzo e-mail in cui vengono inviati i rapporti settimanali?

I rapporti settimanali vengono inviati al proprietario di ciascun account attivo. Per modificare l’indirizzo e-mail, fai clic su Settings > My Profile > Personal Information. Se disponi di più account di ricerca attivi, tutte le newsletter vengono inviate al nuovo indirizzo.

Consulta Configurazione delle informazioni utente personali.

Quanto sono sicure le informazioni del mio cliente sulla ricerca del sito/merchandising?

Ricerca/merchandising del sito è sicuro, veloce, stabile e facile da usare. Non sei obbligato a utilizzare i cookie (anche se puoi farlo se vuoi) per utilizzare i nostri prodotti, e le informazioni sensibili, come le password, non vengono mai messe su alcun collegamento URL che può essere recuperato dal tuo browser.

E la privacy delle informazioni sui miei clienti?

Adobe si impegna a rispettare la privacy dei propri clienti e visitatori. Vedi l'Adobe Centro per la privacy.

Posso mostrare i miei banner pubblicitari sulle pagine dei risultati della ricerca?

Sì. Puoi controllare l’aspetto e il contenuto dei risultati della ricerca. All’interno del modello di risultati di ricerca per il sito web, puoi creare collegamenti alla tua rete di scambio banner, ad esempio LinkExchange o SmartClicks. Eventuali hit creati dai visitatori vengono accreditati correttamente nel tuo account di scambio banner.

Posso personalizzare i risultati della ricerca per il mio sito?

Sì. Questa è una funzione esclusiva di ricerca/merchandising del sito. Grazie alla tecnologia avanzata dei modelli e alla poca conoscenza dell’HTML, puoi controllare esattamente come vengono visualizzati i risultati della ricerca.

Consulta Ricerca tag modello.

La transizione tra i server e i server di ricerca/merchandising del sito è completamente semplice e invisibile per i clienti. Se non conosci l’HTML o non hai il tempo di creare un modello personalizzato, puoi scegliere tra un assortimento di modelli attraenti e pronti all’uso creati dal team interno di sviluppatori web professionisti.

Posso vedere quali clienti stanno cercando sul mio sito?

Sì. Manteniamo le statistiche di ricerca per le ricerche effettuate dai visitatori sul tuo sito web negli ultimi due mesi. Puoi esaminare queste statistiche in qualsiasi momento in Rapporti nel menu prodotto. I rapporti di ricerca forniscono informazioni vitali riguardo esattamente ciò che i visitatori stanno cercando sul tuo sito web. Puoi utilizzare queste informazioni per migliorare la progettazione o per ottimizzare il motore di ricerca/merchandising del sito in modo che sia più adatto ai visitatori.

Come posso controllare quali tipi di contenuto (PDF, testo, Flash, MP3 e Microsoft Office) vengono indicizzati e cercati?

È possibile configurare facilmente gli account per abilitare o disabilitare l'indicizzazione e la ricerca del testo trovato all'interno di documenti PDF, documenti di testo normale, filmati di Flash, file MP3 o documenti Microsoft Office.

Queste impostazioni sono controllate nella pagina Staged Content Types .

Consulta Informazioni sui tipi di contenuto.

Sono supportate le pagine web generate dinamicamente tramite contenuti basati su ASP, JSP, PHP, CFM o Perl?

Le pagine web HTML statiche o generate dinamicamente vengono indicizzate, incluse le pagine create da database o qualsiasi altro processo back-end. Poiché il codice HTML visualizzato da un browser è indicizzato, puoi utilizzare la ricerca/merchandising sui siti web, purché queste architetture back-end risultino in pagine HTML.

Il robot di ricerca esegue la ricerca per indicizzazione del sito web partendo dalla prima pagina all'indirizzo del sito web specificato in Account Settings e segue i collegamenti da pagina a pagina.

Consulta Configurazione delle impostazioni account.

Quando il robot di ricerca esegue la ricerca per indicizzazione di tutte le pagine del sito web, è possibile utilizzare il motore di ricerca per cercare il sito. In altre parole, se i documenti generati dinamicamente vengono intrecciati nel sito web con collegamenti provenienti da altre pagine, il robot di ricerca può comunque eseguire la ricerca per indicizzazione e indicizzare il contenuto dinamico.

Una volta effettuato l’indicizzazione e la ricerca per indicizzazione del contenuto del sito web, i clienti possono cercare informazioni all’interno del contenuto indicizzato.

Come posso utilizzare i sinonimi per migliorare i risultati della ricerca per il mio sito?

Puoi utilizzare i sinonimi quando desideri che i visitatori trovino pagine correlate alla query di ricerca.

Ad esempio, supponiamo che tu abbia una pagina che contiene un listino prezzi dei prodotti in vendita sul tuo sito. Tuttavia, dopo aver esaminato i rapporti di ricerca forniti dalla ricerca/merchandising del sito, si scopre che i clienti stanno cercando la parola "costo", "spesa", "costo" o "tassa" nelle loro ricerche. Queste parole non visualizzano la pagina del listino prezzi nei risultati della ricerca. Con la funzione Add Synonyms in Dictionaries, è possibile specificare che queste parole sono tutti sinonimi e il cliente può trovare il proprio listino prezzi, indipendentemente dal termine di ricerca utilizzato.

Vedere Informazioni sui dizionari.

Ho il controllo sull'ordine dei risultati della ricerca?

Sì. Utilizzando l’interfaccia di rilevanza avanzata, puoi controllare quali pagine vengono restituite per una query di ricerca specifica. Questa funzione è utile se si desidera essere certi che i clienti visualizzino una pagina specifica quando eseguono una query per determinate parole.

Consulta Aggiunta di un nuovo campo meta tag.

Posso cambiare la lingua della pagina dei risultati della ricerca?

Sì. Il modello di ricerca/merchandising del sito è flessibile quando si tratta di consentire la creazione di una pagina di risultati che utilizza la lingua scelta e corrisponde all’aspetto del sito web.

Il modello è costituito da una combinazione di testo, tag HTML standard e tag speciali definiti per visualizzare i risultati della ricerca. Quando un cliente esegue una ricerca, il robot di ricerca legge il modello, invia il testo utilizzando tag HTML standard e inserisce i collegamenti ai risultati in base ai tag modello speciali.

Consulta Ricerca tag modello.

Se si desidera modificare la lingua dei risultati, è possibile modificare il testo inglese visualizzato nel modello.

Vedere Modifica di una presentazione o di un modello di trasporto.

Posso avere più di un sito sul mio accesso Adobe al cliente?

Sì. Con un singolo Adobe Accesso cliente, puoi gestire un motore di ricerca diverso per molti siti web diversi. Selezionare e gestire gli account in "Account".

Consulta Selezione di un account diverso da utilizzare.

Posso cercare più di un dominio?

Sì. Puoi configurare l’accesso a più domini utilizzando URL Entrypoints. Fornisci punti di ingresso URL per domini aggiuntivi di tua proprietà. Ricorda che devi disporre dell’autorizzazione per indicizzare domini che non sono di tua proprietà.

Consulta Informazioni sui punti di ingresso URL.

Posso suddividere il mio sito in sezioni separate in modo che i clienti possano cercare una qualsiasi di queste aree singolarmente o nell’intero sito?

Sì. È inclusa una funzione "Raccolte" che consente ai clienti di cercare aree specifiche del sito web per trovare rapidamente ciò che stanno cercando.

Consulta Informazioni sulle raccolte.

Ad esempio, i clienti possono cercare una raccolta di URL relativi alle informazioni di vendita dei prodotti o una raccolta di URL relativi ai servizi di supporto. È possibile impostare le raccolte in modo che i clienti visualizzino un elenco a discesa di raccolte o un gruppo di caselle di controllo.

Come si impedisce la ricerca di parti del sito web?

Sì. Specifica le maschere URL per determinare quali pagine del sito web includere o escludere dall’indicizzazione. Le maschere URL determinano se le pagine del sito web vengono visualizzate nei risultati della ricerca.

Consulta Informazioni sulle maschere URL.

Consulta Informazioni sullo script delle maschere URL.

Per impedire la ricerca di parti di singole pagine web, è possibile escludere parti di una pagina dall’indicizzazione. Circonda il testo con i tag <noindex> e </noindex> . Questo metodo è utile se si desidera escludere il testo di navigazione dalle ricerche.

Quali set di caratteri sono supportati?

Le pagine web in genere specificano il set di caratteri con un tag meta simile al seguente:

<META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=iso-8859-1">

Il motore di ricerca/merchandising del sito indicizza correttamente le pagine web utilizzando tutti i set di caratteri comuni attualmente in uso su Internet. Alcuni dei set di caratteri supportati includono:

Arabo (ISO-8859-6)

Cinese (tradizionale; Big5)

Giapponese (Shift_JIS)

Arabo (Windows-1256)

Cinese (tradizionale; EUC-TW)

Russo (KOI8-R)

Baltico (ISO-8859-4)

Cirillico (ISO-8859-5)

Europa meridionale (ISO-8859-3)

Baltico (Windows-1257)

Cirillico (Windows-1251)

Turco (ISO-8859-9)

Europa centrale (ISO-8859-2)

Greco (ISO-8859-7)

Turco (Windows-1254)

Europa centrale (Windows-1250)

Greco (Windows-1253)

Unicode (UTF-8)

Cinese (ISO-2022-CN)

Ebraico (ISO-8859-8)

US-ASCII (us-ascii)

Cinese (ISO-2022-CN-EXT)

Ebraico (Windows-1255)

Europa occidentale (ISO-8859-1)

Cinese (semplificato; EUC-NC)

Giapponese (EUC-JP)

Europa occidentale (ISO-8859-15)

Cinese (semplificato; (GB2312)

Giapponese (ISO-2022-JP)

Europa occidentale (Windows-1252)

Cinese (semplificato; GBK)

Giapponese (ISO-2022-JP-1)

Europa occidentale (x-mac-roman)

Cinese (semplificato; (HZ-GB-2312)

Giapponese (ISO-2022-JP-2)

Per informazioni sui set di caratteri non elencati sopra, contatta il supporto tecnico .

Cosa succede se cambio o aggiorno il mio sito web?

Dopo aver modificato il contenuto del sito web, puoi eseguire un indice completo o un indice incrementale. La ricerca nel sito/merchandising scarica e indicizza qualsiasi contenuto del sito Web modificato. Al termine dell’indicizzazione, i clienti possono cercare il nuovo contenuto. Puoi anche pianificare un'indicizzazione automatica del tuo sito in un determinato momento e in un giorno specifico.

Vedere Esecuzione di un indice completo di un sito web live o in staging….

Vedi Esecuzione di un indice incrementale di un sito web live o in staging….

Consulta Impostazione della pianificazione completa dell'indice per un sito web live.

Consulta Impostazione della pianificazione incrementale dell'indice per un sito web live.

Il mio sito può essere indicizzato automaticamente?

Sì. Puoi pianificare un indice automatico del sito ogni giorno.

Oltre all'indicizzazione automatica giornaliera, è possibile scegliere di aver cambiato frequentemente parti del loro sito in modo incrementale indicizzato. Nei giorni in cui è pianificato un indice automatico, puoi controllare l'ora del giorno in cui avviene l'indice. Inoltre, puoi sempre avviare manualmente un indice del sito ogni volta che lo desideri.

Consulta Impostazione della pianificazione completa dell'indice per un sito web live.

Consulta Impostazione della pianificazione incrementale dell'indice per un sito web live.

Io uso delle password sul mio sito web. Posso ancora utilizzare la ricerca/merchandising del sito?

Se si utilizza l'autenticazione HTTP di base per proteggere tramite password determinate parti del sito web, è possibile specificare realm e password che la ricerca/merchandising del sito può utilizzare per indicizzare il sito.

Consulta Aggiunta di password per accedere alle aree del sito Web che richiedono….

Supporti la ricerca per indicizzazione e la ricerca per indicizzazione di contenuto https o server protetto?

Sì. È possibile eseguire ricerche per indicizzazione e indicizzazione del contenuto sui server sicuri (https).

Il sito web search/merchandising rispetta il file robots.txt sul mio sito web?

Sì. Il protocollo di esclusione dei robot è conforme. Il robot di ricerca esamina il file robots.txt se è presente sul tuo sito web. Se il file robots.txt esclude tutti i robot dalla ricerca per indicizzazione del sito, viene escluso anche il robot di ricerca/merchandising del sito. Per consentire solo al robot di ricerca/merchandising del sito di eseguire la ricerca per indicizzazione del sito, impostare il contenuto del file robots.txt su quanto segue:

User-agent: Atomz/1.0 
Disallow:
User-agent: * 
Disallow: /

Per ulteriori informazioni sui robot web e sul protocollo di esclusione robot, consulta:

https://www.robotstxt.org/orig.html

Alcune parti del mio sito web devono essere aggiornate frequentemente in modo che i miei clienti ottengano risultati di ricerca più precisi. L’indicizzazione incrementale aiuta con questo problema?

Sì. Questo è lo scenario in cui è stata creata la funzione di indicizzazione incrementale per facilitare la ricerca/merchandising del sito. Il vantaggio principale dell'indicizzazione incrementale è che consente alle aziende di indicizzare frequentemente parti del loro sito web che cambiano dinamicamente. Questa funzionalità assicura che i risultati della ricerca vengano visualizzati con precisione "fino al minuto".

Vedi Esecuzione di un indice incrementale di un sito web live o in staging….

Consulta Impostazione della pianificazione incrementale dell'indice per un sito web live.

Le pagine web generate in modo dinamico sono supportate da un database back-end, ad esempio cataloghi di prodotti o sistemi di gestione dell’inventario?

Vengono indicizzate le pagine web HTML statiche o generate dinamicamente, comprese le pagine create da database o qualsiasi altro processo back-end. Poiché il codice HTML, visualizzato da un browser, è indicizzato, puoi utilizzare la ricerca/merchandising sul sito web, purché le informazioni sul database di back-end risultino in pagine HTML.

Il robot di ricerca esegue la ricerca per indicizzazione del sito web partendo dalla prima pagina all'indirizzo del sito web specificato in Account Settings e segue i collegamenti da pagina a pagina.

Consulta Configurazione delle impostazioni account.

Quando il robot di ricerca esegue la ricerca per indicizzazione di tutte le pagine del sito web, è possibile utilizzare il motore di ricerca per cercare il sito. In altre parole, se i documenti generati dinamicamente vengono intrecciati nel sito web con collegamenti provenienti da altre pagine, il robot di ricerca può comunque eseguire la ricerca per indicizzazione e indicizzare il contenuto dinamico del database.

Una volta effettuato l’indicizzazione e la ricerca per indicizzazione del contenuto del sito web, i clienti possono cercare informazioni all’interno del contenuto indicizzato.

È possibile abilitare facilmente la ricerca di contenuti completi o una ricerca basata su argomenti più ristretta, limitata alle informazioni contenute nel titolo, nella metamodescrizione, nei tag del documento delle parole chiave meta o in tutti e tre. Utilizzando le definizioni dei metadati, puoi anche creare campi di visualizzazione personalizzati, ad esempio un’immagine di prodotto, nei risultati di ricerca effettivi.

Consulta Aggiunta di un nuovo campo meta tag.

È possibile utilizzare script o programmi per avviare un indice incrementale del sito?

Sì. È possibile utilizzare script o programmi per avviare un indice incrementale del sito Web, nonché per eseguire il ping dei server per indicizzare il sito ogni volta che il contenuto viene modificato o aggiornato.

Consultare Informazioni sull'indice con script.

Implementazioni delle funzioni

Pagina delle domande frequenti che illustra diverse implementazioni di funzioni in Search&Promote.

Di seguito sono riportate le domande comuni relative alle implementazioni di funzioni in Search&Promote su un sito web:

Perché le mie regole di business non sono in esecuzione?

Configura le regole di business quando vengono visualizzati i banner o per aiutarti a decidere quali risultati visualizzare e in quale ordine. Puoi anche configurare la posizione di un elemento nel facet e il modello utilizzato per una determinata ricerca.
Riordinare le regole business per modificare l'ordine in cui vengono eseguite sui modelli di presentazione. Le regole aziendali vengono eseguite nell'ordine in cui sono state definite; cioè, più alto è il numero dell'ordine di una regola, più tardi viene eseguito nel processo, trumping regole precedenti. È possibile riordinare le regole immettendo un nuovo numero nella colonna Ordine della tabella nella pagina Regole business.

Consultare Informazioni sulle regole aziendali.

Perché ho problemi di pianificazione dell'indicizzazione, errori durante l'indicizzazione e problemi di avvio dell'indicizzazione temporanea?

Quando si genera un indice, che sia pieno o incrementale, le informazioni sullo stato della ricerca per indicizzazione vengono visualizzate in tempo reale. Ad esempio, puoi visualizzare il tempo di inizio, il tempo trascorso e tutti gli errori che si sono verificati durante il processo di indicizzazione. Vengono visualizzate anche informazioni sullo stato dell'ultimo indice. Usa queste informazioni per risolvere eventuali errori di indicizzazione riscontrati.

Per pianificare un indice, vedi Impostazione della pianificazione dell'indice completo per un sito web live e Impostazione della pianificazione dell'indice incrementale per un sito web live.

Per avviare un indice di staging, vedere Esecuzione di un indice completo di un sito web live o di staging… o Esecuzione di un indice incrementale di un sito web live o in staging….

Il limite di dimensione dell'indice supera il limite consentito. Perché succede e come lo riparo?

Un sito web può tendere a crescere e nel tempo Search&Promote "scopre" più documenti e pagine web che sono stati aggiunti. Alla fine, il tuo account potrebbe superare il limite di dimensioni dell'indicizzazione. In questi casi, puoi prendere in considerazione l'utilizzo di URL Mask. Questa funzione nasconde documenti e pagine web dalla ricerca per indicizzazione che non si desidera o non è necessario avere indicizzato, riducendo in tal modo la dimensione dell'indice. Un'altra opzione potrebbe essere quella di contattare il Supporto Tecnico per avere il limite di dimensione dell'indicizzazione impostato più grande nel tuo account.

Consulta Informazioni sulle maschere URL.

Se non sai cosa fare, contatta il supporto tecnico. Ci possono essere molte altre variabili che influiscono sulla dimensione dell'indice che, se regolate, possono anche influenzare la fatturazione del tuo account.

Internazionale

Una pagina delle domande più frequenti che illustra il supporto dell’indicizzazione e della ricerca di più di 19 lingue, incluse le lingue asiatiche multibyte come cinese (semplificato e tradizionale), giapponese e coreano.

Di seguito sono riportate le domande comuni relative alle lingue e ai set di caratteri:

Cosa controlla la codifica del set di caratteri della query di ricerca?

La sezione "Moduli web" dell’account di ricerca contiene moduli di ricerca di esempio utilizzati per aggiungere funzionalità di ricerca al sito web. Se osservi questo codice dei moduli di ricerca, puoi trovare una riga simile alla seguente:

<input type=hidden name="sp_f" value="iso-8859-1">

Questa riga di codice indica al motore di ricerca che la query in arrivo è codificata in iso-8859-1, una codifica comune per le lingue dell'Europa occidentale. Per modificare questa impostazione, vai al menu del prodotto e fai clic su Settings > My Profile > Personal Information. Nella pagina Personal Information, seleziona una nuova codifica dall’elenco a discesa Character Encoding .

Consulta Configurazione delle informazioni utente personali.

Puoi anche modificare manualmente il valore di codifica nelle pagine web modificando la riga sp_f del modulo di ricerca. Tenere presente che il valore sp_f del modulo di ricerca deve corrispondere alla codifica del set di caratteri della pagina in cui viene visualizzato.

Vengono cercate solo le pagine la cui codifica corrisponde alla codifica della query di ricerca?

Per impostazione predefinita, no. Se le pagine del sito web identificano correttamente la codifica del set di caratteri, vengono effettuate le conversioni necessarie tra la codifica della query di ricerca e quella delle pagine, anche quando le pagine utilizzano più codifiche.

Quale codifica viene utilizzata per la pagina dei risultati di ricerca?

La codifica set di caratteri dell’account determina la codifica predefinita per il modello di risultati.

Consulta Configurazione delle informazioni utente personali.

Per ulteriori informazioni sulla specifica di un set di caratteri in un modello HTML, consulta la sezione .

Consulta Ricerca tag modello.

Posso utilizzare la ricerca/merchandising del sito su pagine codificate Unicode, UTF-8?

Sì. Tuttavia, i set di caratteri Unicode, come UTF-8, non forniscono informazioni sufficienti per determinare la lingua in cui sono scritte le pagine. Per cercare correttamente queste pagine, è necessario specificare la lingua. Per determinare la lingua del documento, le informazioni vengono elaborate nel seguente ordine:

  • Intestazione HTTP Content-Language distribuita per il documento dal server.

  • Elementi META (ad esempio, META HTTP-EQUIV="Content-Language" Content="ja_JP") nella sezione <HEAD> del documento.

  • Attributo LANG del tag <HTML> (ad esempio, <HTML LANG="ja_JP">).

Se il server non è configurato per distribuire l’intestazione HTTP Content-Language e i documenti non contengono né l’elemento META della lingua né l’attributo della lingua per il tag <HTML> , è possibile utilizzare le iniezioni di metadati per specificare la lingua appropriata.

Vedere Aggiunta di definizioni di iniezione di campi.

Perché non è possibile cercare i file PDF cinesi, giapponesi o coreani sul mio sito web?

Ricerca nel sito/merchandising ottiene UTF-8 dai file Adobe PDF senza indicazione di lingua. Se hai selezionato PDF Documents ( Settings > Crawling > Content Types), devi utilizzare le iniezioni di metadati per specificare la lingua utilizzata nel file PDF.

Vedere Aggiunta di definizioni di iniezione di campi.

Come mai non riesco a cercare i file SWF cinesi, giapponesi o coreani sul mio sito web?

La ricerca nel sito/merchandising ottiene l'UTF-8 dai file video di Flash Adobe creati con Adobe Flash senza indicazione della lingua. Se è stato selezionato il tipo di contenuto Adobe Flash Movies ( Settings > Crawling > Content Types), è necessario utilizzare le iniezioni di metadati per specificare la lingua utilizzata nel file SWF.

Per il Flash versione 4 o versioni precedenti dei file SWF, il set di caratteri dei caratteri nel file non è specificato. Se è stato selezionato il tipo di contenuto Adobe Flash Movies ( Settings > Crawling > Content Types), è necessario utilizzare le iniezioni di metadati per specificare il set di caratteri utilizzato nel file SWF.

Vedere Aggiunta di definizioni di iniezione di campi.

Perché non è possibile cercare i file Microsoft Office cinesi, giapponesi o coreani sul sito web?

La ricerca/merchandising del sito ottiene UTF-8 da file di Microsoft Office (Microsoft Word, Microsoft Excel e Microsoft PowerPoint) senza alcuna indicazione di lingua. Se è stato selezionato il tipo di contenuto Microsoft Office Files ( Settings > Crawling > Content Types), è necessario utilizzare le iniezioni di metadati per specificare la lingua utilizzata nei file di Microsoft Office.

Vedere Aggiunta di definizioni di iniezione di campi.

Perché non posso cercare i file MP3 cinesi, giapponesi o coreani sul mio sito web?

Se si seleziona il tipo di contenuto Text in MP3 Music Files ( Settings > Crawling > Content Types), è necessario utilizzare le iniezioni di metadati per specificare il set di caratteri utilizzato per codificare i file MP3.

Vedere Aggiunta di definizioni di iniezione di campi.

Devo fare qualcosa di speciale per ottenere i file .txt sul mio sito web per indicizzarli correttamente?

Se hai selezionato il tipo di contenuto Text Documents ( Settings > Crawling > Content Types), devi utilizzare le iniezioni di metadati per specificare il set di caratteri utilizzato per codificare i file .txt.

Vedere Aggiunta di definizioni di iniezione di campi.

Come mai i font cinesi, giapponesi o coreani compaiono nei risultati di ricerca in Netscape 4.7 e versioni precedenti?

Se l’account utilizza il modello predefinito, uno dei modelli pronti all’uso o un modello basato su uno di questi modelli, può contenere i tag dei font che specificano Arial o Helvetica come font. Ad esempio, <font face="arial, helvetica" size="+1">. Netscape 4.7 e versioni precedenti non visualizza i caratteri cinesi, giapponesi o coreani quando si utilizza il carattere Arial o Helvetica. Rimuovi l’attributo face o sostituisci la faccia del font con una più appropriata per cinese, giapponese o coreano.

Numero di pagine basso

Pagina delle domande frequenti che illustra i problemi comuni associati a un basso conteggio delle pagine di indicizzazione.

Di seguito sono riportate le domande comuni relative ai conteggi bassi delle pagine di indicizzazione:

Hai esaminato il tuo registro degli indici?

Il registro dell'indice contiene informazioni dettagliate che il robot di ricerca/merchandising del sito raccoglie durante l'indicizzazione del sito web. Il registro include un elenco dei collegamenti sottoposti a ricerca per indicizzazione e degli errori rilevati. Esaminare il registro degli indici è il punto migliore per iniziare a determinare perché tutte le pagine del sito web non sono indicizzate.

Vedere Visualizzazione dell'intero registro dell'indice di una live o di una staging….

Vedere Visualizzazione del registro dell'indice incrementale di una Live o Staged….

Hai degli errori di digitazione nell'URL?

Quando si digitano URL lunghi nei moduli HTML, è possibile che si verifichino uno o più errori tipografici. Gli URL non devono contenere spazi. Inoltre, alcuni server web gestiscono gli URL in modo sensibile a maiuscole e minuscole.

Dal menu del prodotto, fai clic su Settings > Crawling > URL Entrypoints. Nella pagina Staged URL Entrypoints , verifica quanto segue:

  • Negli URL non sono presenti errori tipografici.
  • I caratteri negli URL usano tutti il casing corretto.
  • Gli URL non contengono caratteri di spazio.

Per testare i punti di ingresso dell’URL, copia e incolla un URL in un browser web per verificare se il sito web viene visualizzato. Se non viene visualizzato, controlla di nuovo per assicurarti di non aver commesso errori nel percorso URL.

Consulta Informazioni sui punti di ingresso URL.

La pagina web entrypoint include collegamenti ad altre pagine del sito web?

Il robot di ricerca del sito/merchandising esamina il tuo sito web proprio come fa il tuo cliente; seguendo i collegamenti da pagina a pagina. I collegamenti devono essere presenti nella pagina web di entrypoint prima che il robot di ricerca possa trovare e indicizzare altre pagine del sito.

Consulta Aggiunta di più punti di ingresso URL da indicizzare.

I collegamenti ad altre pagine del tuo sito web sono incorporati in JavaScript?

È possibile utilizzare sofisticate tecniche di navigazione sul sito web, ad esempio azioni e menu di scorrimento, che utilizzano JavaScript per il collegamento ad altre pagine. Tuttavia, il robot di ricerca/merchandising del sito non può seguire i collegamenti incorporati in JavaScript.

Una soluzione che è possibile utilizzare per superare questo problema è quella di inserire collegamenti nascosti ad altre pagine nell'HTML che contiene il JavaScript. Anche se i clienti del tuo sito web non vedono questi link, il robot di ricerca continua a trovarli e li striscia. Puoi posizionare i tag nascosti nella parte inferiore della pagina immediatamente prima del tag </body> . Potrebbero avere il seguente aspetto:

<a href="/mydir/mypag1.html?lang=it"></a> 
<a href="/mydir/mypag2.html?lang=it"></a>

Un’altra soluzione consiste nell’elencare gli URL delle pagine aggiuntive sul sito web come punti di ingresso da esaminare e indicizzare. Inizia gli URL con https:// come illustrato di seguito:

https://www.mydomain.com/mydir/mypag1.html 
https://www.mydomain.com/mydir/mypag2.html

Consulta Aggiunta di più punti di ingresso URL da indicizzare.

I tag HTML nella pagina web sono in una sequenza non valida?

La specifica HTML richiede che i tag <html>, <head> e <body> seguano una sequenza specifica in un documento HTML. I tag in tutte le pagine web devono avere la seguente sequenza:

<html> 
<head> 
...  
<i>head tags go here</i> ... 
</head> 
<body> 
...  
<i>body tags go here</i> ... 
</body> 
</html>

Se i tag HTML non sono nell'ordine corretto, il robot di ricerca/merchandising del sito non è in grado di analizzare e indicizzare correttamente la pagina web. Di seguito è riportato un esempio di tag che non si trovano nella sequenza corretta:

<body> 
<head> 
...  
<i>head tags are here</i> ... 
</head> 
...  
<i>body tags are here</i> ... 
</body>

In questo caso, inserisci i tag <html>, <head> e <body> nella sequenza corretta della pagina web.

Hai dei tag di commento HTML non formattati correttamente nella tua pagina web?

Assicurati di esaminare attentamente e correggere eventuali commenti HTML non validi nelle pagine web.

La specifica HTML richiede che un commento HTML inizi con i caratteri <!-- e termini con i caratteri -->. È facile ignorare i commenti formattati in modo errato che causano l'analisi errata dei tag del robot di ricerca/merchandising del sito sulla pagina Web. Un commento formato in modo errato può causare la perdita di altri tag importanti da analizzare al robot di ricerca/merchandising del sito. Presta attenzione ai commenti immediatamente prima del tag <body> nella tua pagina web.

Di seguito è riportato un esempio di commento correttamente formato:

<!-- This HTML comment is OK. -->

Di seguito è riportato un esempio di commenti non correttamente formati:

<!- This HTML comment is improperly formed. -> 
<! This HTML comment is also improperly formed. >

La tua pagina web contiene collegamenti a pagine su un altro dominio?

Spesso un sito web può essere costituito da pagine che in realtà esistono su un server web con un indirizzo di dominio diverso. Ad esempio, se l’indirizzo del sito Web principale è il seguente:

https://www.mydomain.com/

Il tuo sito web può anche contenere pagine su un altro dominio, ad esempio:

https://www.otherdomain.com/

Per impostazione predefinita, il robot di ricerca/merchandising del sito non segue i collegamenti su un dominio diverso da quello principale. Tuttavia, impostando altri punti di ingresso per il tuo account di ricerca, puoi facilmente indicizzare più domini.

Dal menu del prodotto, fai clic su Settings > Crawling > URL Entrypoints. Aggiungi l'URL "principale sito web entrypoint" del tuo sito. Quindi, aggiungi altri punti di ingresso URL a qualsiasi altro dominio che contiene pagine del sito. Ad esempio, puoi impostare il tuo punto di ingresso URL principale su:

https://www.mydomain.com/

e aggiungi il seguente punto di ingresso URL del sito aggiuntivo:

https://www.otherdomain.com/

Utilizzi un servizio di dominio virtuale per il tuo URL?

Potresti utilizzare un servizio di dominio virtuale (talvolta denominato "servizio di reindirizzamento del dominio") per fornire un URL migliore ai clienti per l’accesso al tuo sito web. Ad esempio, supponiamo che l’indirizzo reale del sito web sia il seguente:

https://www.myispdomain.com/~myname/mywebpages/

Tuttavia, puoi utilizzare un servizio di dominio virtuale in modo che i clienti possano accedere al tuo sito ai seguenti indirizzi:

https://myname.adomain.com/

oppure

https://adomain.com/myname/

Per impostazione predefinita, il robot di ricerca/merchandising del sito non segue i collegamenti su un dominio diverso da quello principale. Tuttavia, impostando altri punti di ingresso per il tuo account di ricerca, puoi facilmente indicizzare più domini.

Dal menu del prodotto, fai clic su Settings > Crawling > URL Entrypoints. Aggiungi il "punto di ingresso dell’URL del sito web principale" al nome di dominio virtuale del sito. Quindi, aggiungi ulteriori punti di ingresso al dominio in cui il tuo sito web vive effettivamente.

Ad esempio, imposta il punto di ingresso dell’URL principale su quanto segue:

https://myname.adomain.com/

E aggiungi il seguente punto di ingresso URL del sito Web aggiuntivo:

https://www.myispdomain.com/~myname/mywebpages/

La tua pagina web utilizza un tag di aggiornamento meta?

Molti siti web dispongono di una prima pagina che include un tag di aggiornamento meta tra i tag <head>...</head> simili ai seguenti:

<meta http-equiv="Refresh" content="0;URL=https://www.adomain.com/apath/afile.html">

In alcune circostanze, il robot di ricerca/merchandising del sito non è in grado di seguire l'URL di aggiornamento del meta per indicizzare il contenuto del tuo sito web. Questo problema è facile da risolvere impostando altri punti di ingresso.

Scegliere Settings > Ricerca per indicizzazione > URL Entrypoints dal menu del prodotto. Aggiungi un altro punto di ingresso all’URL del tag di aggiornamento metadati.

La tua pagina web utilizza un tag meta robots?

A volte le pagine web utilizzano i tag meta robots per controllare i robot web che cercano periodicamente di cercare un sito web. I tag Meta robots vengono visualizzati tra i tag <head>...</head> di una pagina web e hanno un aspetto simile al seguente:

<meta name="robots" content="noindex, nofollow">

Poiché il robot di ricerca/merchandising del sito è esso stesso un robot web, segue le indicazioni del tag dei meta robot. Escludendo altri robot in questo modo si esclude anche il robot di ricerca/merchandising del sito.

Per ulteriori informazioni sui robot web e sul protocollo di esclusione robot, consulta:

https://www.robotstxt.org/orig.html

Rimuovi o modifica il tag meta robots sulle pagine web che desideri indicizzare sul tuo sito web.

Il tuo sito web utilizza un file di esclusione robot?

A volte un sito web ha una pagina chiamata robots.txt che esclude tutti o alcuni robot dalla ricerca per indicizzazione. Per vedere se il tuo sito web ha un file robots.txt, cercarlo appena sotto il dominio di primo livello come mostrato in:

https://www.yourdomain.com/robots.txt

Il contenuto del file robots.txt è simile al seguente testo:

User-agent: * 
Disallow: /

Poiché il robot di ricerca/merchandising del sito è esso stesso un robot web, segue le indicazioni nel file robots.txt-esclude il robot di ricerca/merchandising del sito. Per risolvere questo problema, modifica il file di esclusione dei robot (robots.txt) per consentire al robot di ricerca del sito/merchandising di esaminare e indicizzare il tuo sito web come segue:

User-agent: Atomz/1.0 
Disallow: 
 
User-agent: * 
Disallow: /

Microsoft Office

Pagina delle domande frequenti che illustra il supporto dell'indicizzazione e della ricerca dei file di Microsoft® Office su un sito web.

Di seguito sono riportate le domande comuni relative ai file di Microsoft Office:

Cosa viene indicizzato in un file di Microsoft Office?

Il contenuto completo dei file di Microsoft Word, dei file di Microsoft Excel e dei file di Microsoft PowerPoint viene indicizzato.

Le parti seguenti di un file Microsoft Word sono indicizzate:

  • Titolo
  • Parole chiave
  • Oggetto (descrizione)
  • Contenuto basato su testo
  • Collegamenti ipertestuali ad altri documenti

Le parti seguenti di un file Microsoft Excel sono indicizzate:

  • Titolo
  • Parole chiave
  • Oggetto (descrizione)
  • Testo nelle celle
  • Valori da formule numeriche nelle celle

Le parti seguenti di un file Microsoft PowerPoint sono indicizzate:

  • Titolo
  • Parole chiave
  • Oggetto (descrizione)
  • Testo su ogni diapositiva

Cosa non viene indicizzato in un file di Microsoft Office?

Gli elementi grafici contenuti nei file di Microsoft Office o in qualsiasi testo contenuto in un elemento grafico non vengono indicizzati. Le definizioni delle proprietà personalizzate non sono indicizzate come metadati. Anche alcuni testi in campi speciali, come intestazioni e piè di pagina in un file PowerPoint, non sono indicizzati.

In che modo i file di Microsoft Office vengono indicizzati in modo diverso rispetto alle pagine HTML?

La differenza tra il modo in cui il robot di ricerca indicizza i file Microsoft Office e i file HTML è che ogni file HTML è una singola pagina e un singolo file Microsoft Office può rappresentare centinaia di pagine. Per questo motivo, ogni pagina viene conteggiata all'interno di un file di Microsoft Office come pagina separata nell'account di ricerca.

Come si impedisce l'indicizzazione dei file di Microsoft Office sul sito web?

Se non si desidera che il robot di ricerca esegua la ricerca per indicizzazione e indicizzi i file di Microsoft Office, deselezionare il tipo di contenuto Microsoft Office Files ( Settings > Crawling > Content Types).

È inoltre possibile utilizzare URL Masks per disabilitare l'indicizzazione dei file di Microsoft Office.

Inserisci le seguenti maschere URL:

Se non utilizzi espressioni regolari

  • escludi *.doc
  • escludi *.xls
  • escludi *.ppt

Se utilizzi espressioni regolari

  • escludi regexp ^.*\.doc$
  • escludi regexp ^.*\.xls$
  • escludi regexp ^.*\.ppt$

Consulta Aggiunta di maschere URL per indicizzare o meno parti di indice di….

Consulta Espressioni regolari.

MP3

Una pagina delle domande più frequenti che discute il supporto dell'indicizzazione e della ricerca di file musicali MP3 su un sito web.

Di seguito sono riportate le domande comuni relative ai file MP3.

Quando un file MP3 viene sottoposto a ricerca per indicizzazione e indicizzato?

I file MP3 vengono sottoposti a ricerca per indicizzazione in uno dei due modi. Il modo più comune è quello di un tag href di ancoraggio in un file HTML:

<a href="MP3-file-URL"></a>

Un secondo modo è quello di inserire l'URL del file MP3 come punto di ingresso dell'URL.

Consulta Informazioni sui punti di ingresso URL.

Cosa devo fare per eseguire la ricerca per indicizzazione dei file MP3 sul mio sito?

Per attivare la ricerca per indicizzazione e l'indicizzazione MP3 per il tuo account, scegliere Settings dal menu prodotto > Crawling > Content Types. Nella pagina Staged Content Types, seleziona Text in MP3 Music Files.

Consulta Informazioni sui tipi di contenuto.

Come viene riconosciuto un file MP3?

Un file MP3 è riconosciuto dal suo tipo MIME che è "audio/mpeg".

Cosa viene indicizzato in un file MP3?

Facoltativamente, i file MP3 memorizzano una piccola quantità di informazioni testuali. Tali informazioni possono includere il nome dell'album, il nome dell'artista, il titolo della canzone, il genere della canzone, l'anno di pubblicazione e un commento. Queste informazioni vengono memorizzate alla fine del file in quello che viene chiamato TAG. I file MP3 che contengono informazioni TAG sono indicizzati nel modo seguente:

  • Il titolo della canzone viene trattato come il titolo di una pagina HTML.
  • Il commento viene trattato come una descrizione definita per una pagina HTML.
  • Il genere viene trattato come una parola chiave definita per una pagina HTML.
  • Il nome dell'artista, il nome dell'album e l'anno di rilascio vengono trattati come il corpo di un documento HTML.

Un file MP3 viene conteggiato come pagina?

Sì, ogni file MP3 sottoposto a ricerca per indicizzazione e indicizzato sul tuo sito web viene conteggiato come una pagina.

Come posso impedire l'indicizzazione di singoli file MP3?

Racchiudi i tag di ancoraggio che collegano ai file MP3 con tag <nofollow> e </nofollow> . Il robot di ricerca non segue i collegamenti tra questi tag.

Un altro metodo è quello di aggiungere gli URL dei file MP3 come maschere di esclusione.

Consulta Informazioni sulle maschere URL.

Consulta Informazioni sullo script delle maschere URL.

Come posso evitare l’indicizzazione dei file MP3?

Il modo più semplice per controllare l'indicizzazione MP3 per il tuo account è quello di deselezionare Text in MP3 Music Files nella pagina Staged Content Types .

Consulta Selezione dei tipi di contenuto per la ricerca per indicizzazione e l'indice.

Puoi anche utilizzare la funzione URL Mask per disabilitare l'indicizzazione MP3 per estensione di file. A questo scopo, nel menu del prodotto fai clic su Settings > Crawling > URL Masks. Inserisci una delle seguenti maschere:

Se il tuo account..

Inserisci la seguente maschera URL

Non utilizza espressioni regolari

escludi *.mp3

Utilizza espressioni regolari

escludi regexp ^.*\.mp3$

Consulta Espressioni regolari.

Perché non posso cercare i file MP3 cinesi, giapponesi o coreani sul mio sito?

Per cercare i file MP3 cinesi, giapponesi o coreani, scegliere Settings dal menu del prodotto > Crawling > Content Types > Text in MP3 Music Files. Quindi, fai clic su Settings > Metadata > Injections e specifica il set di caratteri utilizzato per codificare i file MP3.

Consulta Selezione dei tipi di contenuto per la ricerca per indicizzazione e l'indice.

Vedere Informazioni sulle iniezioni.

PDF

Una pagina delle domande frequenti in cui viene discusso il supporto dell'indicizzazione e della ricerca di file PDF su un sito web.

Di seguito sono riportate le domande comuni relative ai file PDF:

Cosa viene indicizzato in un file PDF?

Il contenuto completo dei file PDF è indicizzato. Sono indicizzate le parti seguenti di un file PDF:

  • Titolo
  • Parole chiave
  • Oggetto (descrizione)
  • Contenuto basato su testo

Cosa non viene indicizzato in un file PDF?

Il sommario PDF, gli elementi grafici all’interno del file o qualsiasi testo che fa parte di un elemento grafico contenuto non sono indicizzati.

Come vengono conteggiati i file PDF indicizzati?

Ogni file PDF viene conteggiato come un singolo documento, inclusi i PDF che contengono più pagine.

I risultati della ricerca possono visualizzare un’icona PDF?

Sì. Utilizza il tag <search-if-link-extension> all’interno del modello per includere nei risultati di ricerca un’icona PDF o altri elementi grafici o testo:

<search-results> 
  ... 
  <search-if-link-extension value=".pdf"> 
    <img src="/search/i/pdficon.gif?lang=it"> 
  </search-if-link-extension> 
  ... 
</search-results>

Le icone PDF consentono ai clienti di sapere che un risultato della ricerca si collega a un file PDF di grandi dimensioni. Le dimensioni dei file possono essere importanti per i clienti che accedono al tuo sito web tramite un modem o un dispositivo mobile.

I risultati della ricerca possono collegarsi a una pagina particolare in un file PDF?

Sì. Utilizzando il tag modello per collegamenti avanzati ( <search-smart-link>...</search-smart-link>), i clienti possono fare clic per aprire la prima pagina PDF contenente il risultato della ricerca.

Per utilizzare i collegamenti avanzati, sostituisci i tag <search-link>...</search-link> nella sezione dei risultati di ricerca del modello con i tag <search-smart-link>...</search-smart-link> . Quando un cliente fa clic su un collegamento generato dai tag di collegamento intelligente, passa alla prima pagina PDF rilevante per la query di ricerca.

NOTA

Per utilizzare questa funzione, il cliente deve utilizzare una versione recente del Reader Adobe Acrobat o Adobe Acrobat, che deve includere il plug-in di evidenziazione e il plug-in EWH (External Window Handler). Inoltre, il browser deve utilizzare il plug-in Adobe Acrobat per Netscape Navigator (è possibile utilizzare qualsiasi browser che accetta questo plug-in Netscape Navigator) o il controllo Acrobat ActiveX per Internet Explorer 4.0 e versioni successive.

Consulta Ricerca tag modello.

Come si impedisce l’indicizzazione dei file PDF sul sito web?

Se non desideri che il robot di ricerca esegua ricerche per indicizzazione e indicizzazione dei file PDF, deseleziona il tipo di contenuto PDF Documents ( Settings > Crawling > Content Types).

Puoi anche scegliere di utilizzare URL Masks per disabilitare l’indicizzazione PDF.

Consulta Aggiunta di maschere URL per indicizzare o meno parti di indice di….

Per disabilitare l’indicizzazione PDF, immetti una delle seguenti maschere URL:

  • exclude *.pdf (se non utilizzi espressioni regolari)
  • exclude regexp ^.*\.pdf$ (se utilizzi espressioni regolari)

Consulta Espressioni regolari.

Perché non è possibile cercare i file PDF cinesi, giapponesi o coreani sul mio sito web?

Ricerca nel sito/merchandising ottiene UTF-8 da file PDF senza indicazione di lingua. Se è stato selezionato il tipo di contenuto PDF Documents ( Settings > Crawling > Content Types), è necessario utilizzare le iniezioni di metadati per specificare la lingua utilizzata nel file PDF.

Vedere Aggiunta di definizioni di iniezione di campi.

Troppe pagine

Una pagina delle domande frequenti che spiega alcuni dei motivi per cui l’indicizzatore ha conteggiato più pagine di quante ne abbiate effettivamente, e qual è la soluzione in ogni caso.

Se sei sicuro che il tuo sito web sia al di sotto del limite di pagina, ma l'indicizzatore ti sta dicendo che il limite è raggiunto, dovresti esaminare queste domande comuni e le risposte per le possibili soluzioni.

Hai esaminato i tuoi vari registri dell'indice?

Il registro dell'indice contiene informazioni dettagliate raccolte dal robot di ricerca/merchandising del sito durante l'indicizzazione del sito web. Il registro include un elenco di tutti i collegamenti sottoposti a ricerca per indicizzazione ed è stato rilevato un errore. L'esame del registro degli indici è il punto migliore da cui iniziare quando si cerca di determinare quali pagine vengono indicizzate.

Vedere Visualizzazione dell'intero registro dell'indice di una live o di una staging….

Vedere Visualizzazione del registro dell'indice incrementale di una Live o Staged….

Vedere Visualizzazione del registro dell'indice incrementale script di un live o….

Vedere Visualizzazione del registro dell'indice rigenerato di un live o di una staging….

Consulta Visualizzazione del registro dell'indice classificato di un sito web live o di staging.

I programmi CGI vengono indicizzati sul tuo sito web?

I programmi CGI utilizzano parametri URL che talvolta fanno sì che l’indicizzatore esegua la ricerca per indicizzazione di più URL "falsi". Se la ricerca/merchandising del sito sta leggendo i tuoi programmi CGI e segue gli URL con parametri CGI, probabilmente ci sono diversi multipli di pagine che vengono sottoposte a ricerca per indicizzazione e indicizzate che non sono utili per il tuo indice di ricerca. I parametri CGI tipici compaiono negli URL con caratteri ? o &.

Puoi impedire che i programmi CGI vengano indicizzati utilizzando la funzione URL Mask. Puoi mascherare un prefisso URL o utilizzare espressioni regolari per mascherare gli script CGI.

Consulta Informazioni sulle maschere URL.

Consulta Informazioni sullo script delle maschere URL.

Consulta Espressioni regolari.

È abilitata la navigazione nelle directory nel server?

Quando un server web ha abilitato la navigazione nelle directory e non è presente alcun file index.html in una determinata directory, una visita a tale directory può mostrare l’elenco dei file presenti in tale directory. Di solito, ci sono collegamenti nella parte superiore della pagina per consentire di ordinare l’elenco in modi diversi semplicemente facendo clic su Name, Last modified, Size e così via. In genere questi vengono visualizzati nel registro dell'indice di ricerca/merchandising del sito come URL con caratteri come ?M=A alla fine. L’indicizzatore di ricerca/merchandising del sito segue questi come collegamenti e questo può portare all’indicizzazione di più URL "falsi".

In genere, un sito web ben progettato ha file di indice situati in ogni directory, o ha la navigazione della directory disabilitata per quelle directory senza file di indice. Fortunatamente, c'è un modo semplice per mascherare questi "falsi" URL se non si è in grado di cambiare le pagine o disabilitare gli elenchi di directory sul lato server.

Per eseguire questa attività, fai clic su Settings > Crawling > URL Masks. Aggiungi una maschera per mascherare qualsiasi URL contenente il carattere ?. Per eseguire questa operazione, immetti la seguente maschera di espressione regolare:

exclude regexp ^.*\?.*$

Dopo aver creato la maschera, assicurati di reindicizzare il sito web.

Vedere Esecuzione di un indice completo di un sito web live o in staging….

Vedi Esecuzione di un indice incrementale di un sito web live o in staging….

Ci sono forum o newsgroup sul tuo sito web?

Se sul sito Web viene effettuata la ricerca per indicizzazione di forum o newsgroup, è possibile che gli URL seguano per diverse opzioni di visualizzazione o di ordinamento. Questo comportamento significa che la stessa pagina viene indicizzata più volte.

In genere, i forum o i newsgroup sono dotati di motori di ricerca personalizzati. In tal caso, puoi utilizzare URL Masks per mascherare i forum da ricerca/merchandising del sito.

Dal menu del prodotto, fai clic su Settings > Crawling > URL Masks. Nella pagina Staged URL Masks , maschera i forum inserendo i loro URL come maschere di esclusione URL.

Consulta Aggiunta di maschere URL per indicizzare o meno parti di indice di….

Dopo aver creato le maschere, assicurati di reindicizzare il sito web.

Vedere Esecuzione di un indice completo di un sito web live o in staging….

Vedi Esecuzione di un indice incrementale di un sito web live o in staging….

Sul sito Web sono presenti file PDF o Microsoft Office?

Se sul tuo sito web sono presenti file PDF o Microsoft Office file, potresti notare che la dimensione dell'indice di solo pochi file conta molte pagine. Il motivo per cui ci sono più pagine che vengono indicizzate dei documenti è perché ogni pagina in un file PDF o Microsoft Office viene conteggiata come pagina separata.

Dal menu del prodotto, fai clic su Index > Full Index > Live Index. Nella pagina Full Index , seleziona Count All Pages, quindi fai clic su Full Index Now per visualizzare il conteggio totale delle pagine. Se non si desidera indicizzare i file PDF o Microsoft Office, è possibile disattivare questo tipo di contenuto in Settings > Crawling > Content Types.

Vedere Esecuzione di un indice completo di un sito web live o in staging….

Consulta Informazioni sui tipi di contenuto.

Hai più punti di ingresso URL?

Il robot di ricerca/merchandising del sito inizia a eseguire la ricerca per indicizzazione nei punti di ingresso dell'URL specificato e segue tutti i collegamenti trovati a tutti i contenuti di quel particolare dominio. Se hai specificato molti punti di ingresso URL, è possibile che venga effettuata la ricerca per indicizzazione di un numero significativo di pagine.

Utilizza il tag nofollow del protocollo di esclusione robot nelle intestazioni dei documenti di ingresso sui domini aggiuntivi come segue:

<html> 
<head> 
<meta name="robots" content="nofollow"> 
</head>

Il codice di cui sopra comunica al robot di ricerca/merchandising del sito di indicizzare il contenuto della pagina, ma di non seguire i collegamenti a pagine aggiuntive.

Per ulteriori informazioni sui robot web e sul protocollo di esclusione robot, consulta:

https://www.robotstxt.org/orig.html

Se non hai accesso all’origine delle pagine su domini aggiuntivi, puoi rimuovere i diversi punti di ingresso URL. In questo modo puoi limitare l’attività di indicizzazione solo ai domini di cui desideri che i clienti siano in grado di effettuare ricerche nel contenuto.

Consulta Informazioni sui punti di ingresso URL.

Hai superato i byte interni o i limiti di tempo di ricerca/merchandising del sito?

Controlla se il tuo account ha raggiunto il suo limite nella schermata "Full Index Status" (Stato indice completo). Se lo stato segnala che l’indice è più grande del consentito o che ci è voluto più tempo del consentito, il sito web non è completamente indicizzato. È possibile correggere questo errore in modo da ottenere una copertura adeguata e il conteggio delle pagine del sito web.

Per proteggere i server di ricerca/merchandising del sito, esistono limiti interni di byte e tempo. Solo quando i file sottoposti a ricerca per indicizzazione sono molto grandi o quando il server che la ricerca/merchandising del sito sta cercando di raggiungere è lento sono questi limiti raggiunti.

Se raggiungi un limite di tempo, assicurati che il server sia online e riprova in un secondo momento. Se raggiungi un limite di byte, controlla i file sottoposti a ricerca per indicizzazione visualizzando il registro dell'indice. Sono insolitamente grandi? Contatta il supporto tecnico se viene visualizzato uno di questi messaggi.

In questa pagina

Adobe Summit Banner

A virtual event April 27-28.

Expand your skills and get inspired.

Register for free
Adobe Summit Banner

A virtual event April 27-28.

Expand your skills and get inspired.

Register for free
Adobe Maker Awards Banner

Time to shine!

Apply now for the 2021 Adobe Experience Maker Awards.

Apply now
Adobe Maker Awards Banner

Time to shine!

Apply now for the 2021 Adobe Experience Maker Awards.

Apply now