Come forzare l’indicizzazione di un URL su Google

In questo articolo vedremo come sia possibile “spingere” Google a passare su un URL a nostra scelta: come diretta conseguenza, i contenuti di quell’URL verranno reindicizzati (ammesso che ci siano le pre-condizioni perchè ciò possa avvenire senza errori, ovviamente). Andiamo per ordine e vediamo tutto, pertanto.

Come funziona l’indicizzazione dei siti

Quando pubblichiamo un sito web la prima cosa che vogliamo fare, ovviamente, è quella di farlo apparire nei risultati di ricerca di Google: per fare questo, in effetti, non serve fare solitamente nulla di particolare. La cosa essenziale è che il vostro sito sia fatto a regola d’arte, sia privo di errori lato server e che tutte le pagine più importanti da indicizzare siano opportunamente collegate dalla struttura del sito (menù, link interni, widget, ecc.).

Nello specifico, perchè una pagina web sia indicizzabile devono in genere verificarsi una delle seguenti condizioni:

  1. la pagina deve restituire un codice server 200 OK
  2. la pagina deve deve essere scaricabile secondo le indicazioni del robots.txt
  3. la pagina deve contenere un meta tag robots con valore INDEX (o, al limite, non contenere affatto questo meta tag);

A livello pratico cosa significhi è presto detto:

  1. Per verificare il codice restituito dal nostro sito si usa in genere httpstatus.io.
  2. Per verificare le condizioni del robots.txt basta aprire nomedelvostrosito.it/robots.txt (se il file non fosse presente, varrebbe come “semaforo verde” e non porrebbe quindi alcun impedimento alla scansione)
  3. Per verificare i meta tag robots basta visualizzare il sorgente e verificare che sia presente qualcosa del genere (le varie forme di meta tag robots sono discusse qui):
    <meta name="robots" content="INDEX" />

Per quanto riguarda un discorso di completezza lato SEO, è anche opportuno che nel sito sia presente una mappa del sito o sitemap, generalmente reperibile come nomedelvostrosito.it/sitemap.xml (se non si trova a questo indirizzo, significa che la sitemap ha un nome diverso oppure non è stata generata).

L’indicizzazione dei contenuti del nostro sito segue pertanto, di solito, un processo naturale: se il sito è ben fatto ed il server configurato a dovere, entro qualche ora, o al limite un giorno o due da quando abbiamo pubblicato il sito, ogni nuova pagina che pubblichiamo e che rispetti determinati requisiti (sia scansionabile, sia presente nel feed RSS e/o nella sitemap XML del sito) sarà automaticamente acquisita dai motori di ricerca.

Cosa blocca l’indicizzazione dei siti

Di fatto, quello che blocca l’indicizzazione del vostro sito la prima volta è di solito legato:

  1. a siti fatti male tecnicamente (e qui spesso la cosa migliore è buttare giù il sito e rifarlo da zero);
  2. a problemi sull’hosting del sito (pagine web che vengono caricate in modo parziale o non vengono caricate, tempi troppo lunghi di caricamento per problemi sul server e così via);
  3. alla presenza impropria di meta tag robots noindex e/o nofollow
  4. a direttive restrittive nel file robots.txt che impediscono a Google di scaricare la pagina.

Ci sono casi, tuttavia, in cui questo non accade: nella mia esperienza può capitare un ritardo di diversi giorni, per una sorta di effetto sandbox o, detta diversamente, un “rallentamento” dell’indicizzazione di alcune pagine. Questo, secondo alcuni (me incluso), avviene soprattutto per le chiavi di ricerca più concorrenziali, proprio al fine di evitare o limitare il fenomeno dello spamdexing (spam dei motori di ricerca). Questo avviene anche su siti web ben realizzati ed impeccabile tecnicamente, probabilmente come misura di analisi preventiva affinchè si eviti di indicizzare siti inutili di spam o keyword stuffing.

Richiedere la scansione di una pagina a Google

Nel caso in esame, tuttavia, le cose sono più semplici, e così cercheremo di mantenerle nel seguito: se (caso tipico) gli ultimi articoli del vostro blog non venissero indicizzati, potete tentare una indicizzazione “mirata” mediante Search Console. Ovviamente prima di farlo dovrete assicurarvi che il vostro sito funzioni, che non restituisca errori e che le pagine vengano caricate, in media, in meno di 1 o 2 secondi al massimo (limite orientativo pratico anche piuttosto permissivo: secondo Google il tempo medio di caricamento di una pagina dovebbe essere di soli 200 ms)

Per verificare se una pagina o un sito è indicizzato, cerca su Google site:nometuosito.com oppure cerca direttamente l’URL che non ti sembra indicizzato correttamente nella casella di ricerca. In alternativa, leggi la guida contro le penalizzazioni per saperne di più.

Come chiedere a Google di indicizzare un sito (o una pagina)

Storicamente questa operazione si può effettuare da una storica pagina di Google, quella del submit di un sito:

https://www.google.it/intl/it/add_url.html

Questo servizio non è mai stato ufficialmente dismesso negli anni, ma non è raccomandabile di eseguire l’operazione di indicizzazione mediante esso. Questo perchè non avremmo alcun controllo sul processo di sottoposizione, indicizzazione e posizionamento, quindi invieremmo il sito senza avere alcun feedback successivo, quando oggi esistono strumenti più moderni per fare questa operazione – e ne vedremo subito uno, gratuito ed ufficialmente supportato da Google.

Come prima cosa sarà necessario registrare il nostro sito sulla Search Console di Google, ovvero andremo ad inserire l’indirizzo del nostro sito web all’interno dei siti che controlliamo nella SC stessa. Dopo aver fatto questo ed aver validato il sito con file HTML fornito da Google, via DNS oppure con il meta tag HTML sempre fornito da Google, saremo pronti a cominciare la nostra avventura.

Apriamo la Search Console (https://www.google.com/webmasters/tools), andiamo a scegliere l’indirizzo del sito che ci interessa indicizzare, ed apriamo la finestra Scansione, selezionando Visualizza come Google. Di seguito viene riportato un esempio della finestra di menù che sarà necessario cliccare.

Schermata 2016-04-29 alle 10.09.14Dentro la SC cliccando su Scansione e poi suVisualizza come Google dovremmo trovare un box di testo, come riportato di seguito in esso andremo ad inserire parte dell’URL che non viene indicizzato, e cliccheremo su Recupera. Dopo aver fatto il recupero, ammesso che la pagina sia restituita senza redirect 302/301 e senza errori (404, 500, ecc.), saremo pronti alla seconda fase del lavoro, ovvero inviare all’indice di Google la pagina in oggetto.

In pratica nell’applicazione della SC apparirà una nuova riga in basso, con un bel bottone in bella vista con su scritto “Invia all’indice“: Invia all’indice serve, per l’appunto,  ad inviare l’URL del sito a Google per informarlo che qualcosa è cambiato (la fase precedente serviva solo ad assicurarsi che il vostro sito sia interpretato correttamente e per intero da Google, in effetti).

Schermata 2016-04-29 alle 10.11.58

Clicchiamo pertanto sul bottone Invia all’indice.

Per confermare l’invio dell’URL, selezioniamo una delle due opzioni a seconda di quello che ci serve (solo la pagina in esame o anche quelle collegate da essa mediante link diretto), spuntiamo il Recaptcha e confermiamo col bottone Vai.

Schermata 2016-04-29 alle 10.13.16

Fate attenzione, inoltre, ad una cosa fondamentale: il numero di invii con questa tecnica è limitato, per cui non si tratta di uno strumento di cui abusare. Per indicizzare (o tentare di farlo) il numero massimo di pagine possibili, eseguitelo sulla home (non scrivete nulla nel box testo) e spuntate l’opzione “Esegui la scansione di questo URL e dei relativi link diretti“.

Se 1) il sito è ben strutturato come link interni e navigazionali, e 2) se non ci sono direttive noindex inserite in modo scorretto, dovreste riuscire a forzare la reindicizzazione globale del sito – che comunque rimane un “caso limite”, neanche troppo comune nella mia esperienza. Il più delle volte è meglio reindicizzare singole pagine importanti, ma questo soltanto se avete fatto modifiche di rilievo alla pagina o se la stessa sembra “invisibile” a Google.

La cosa davvero interessante che ho osservato, in questi casi, è che l’acquisizione nell’indice è in molti casi instantanea: questo permette di caricare la vostra pagina, ammesso che ci siano le condizioni per farlo, in modo diretto all’interno di Google e renderla immediatamente ricercabile.

3.69/5 (29)

Ti piace / Ti sembra utile?