Come forzare l’indicizzazione di un URL su Google

In questo articolo vedremo come sia possibile costringere Google a passare nuovamente su un URl a nostra scelta: il risultato sarà che i contenuti della pagina verranno reindicizzati (se ci sono le pre-condizioni perchè ciò possa avvenire). Andiamo per ordine e vediamo tutto, pertanto.

Come funziona normalmente l’indicizzazione dei siti

Quando pubblichiamo un nuovo sito web la prima cosa che vogliamo fare, ovviamente, è quello di farlo apparire nei risultati di ricerca di Google: per fare questo, in effetti, non serve fare tecnicamente nulla di particolare. La cosa essenziale è che il vostro sito sia ben fatto, privo di errori e che tutte le pagine più importanti da indicizzare siano ben collegate dalla struttura del sito (menù, link interni, widget, ecc.).

Perchè una pagina web sia indicizzabile devono verificarsi una delle seguenti condizioni:

  1. il sito non deve presentare un robots.txt con al suo interno una qualche direttiva che impedisca lo scaricamento della pagina in questione
  2. la pagina web non deve contenere un meta tag robots con valore NOINDEX
  3. la pagina web deve contenere un meta tag robots con valore INDEX o, al limite, non deve contenere affatto questo meta tag;
  4. la pagina deve restituire un codice server 200 OK

L’indicizzazione dei contenuti del nostro sito segue pertanto, di solito, un processo naturale: se il sito è ben fatto ed il server configurato a dovere, entro qualche ora, o al limite un giorno o due da quando abbiamo pubblicato il sito, ogni nuova pagina che pubblichiamo e che rispetti determinati requisiti (sia scansionabile, sia presente nel feed RSS e/o nella sitemap XML del sito) sarà automaticamente acquisita dai motori di ricerca.

Cosa blocca l’indicizzazione dei siti

Di fatto, quello che blocca seriamente l’indicizzazione del vostro sito la prima volta è legato alla presenza impropria di meta tag robots noindex e/o nofollow, delle direttive restrittive nel file robots.txt che impediscono a Google di scaricare la pagina o, ancora, pagine web che vengono caricate in modo parziale, in tempi molto lunghi per problemi sul server e così via.

Ci sono casi, tuttavia, in cui questo non accade: nella mia esperienza può capitare un ritardo di diversi giorni, per una sorta di effetto sandbox o, detta diversamente, un “rallentamento” dell’indicizzazione di alcune pagine. Questo, secondo alcuni (me incluso), avviene soprattutto per le chiavi di ricerca più concorrenziali, proprio al fine di evitare o limitare il fenomeno dello spamdexing (spam dei motori di ricerca). Questo avviene anche su siti web ben realizzati ed impeccabile tecnicamente, probabilmente come misura di analisi preventiva affinchè si eviti di indicizzare siti inutili di spam o keyword stuffing.

Richiedere la scansione di una pagina a Google

Nel caso in esame, tuttavia, le cose sono più semplici, e così cercheremo di mantenerle nel seguito: se (caso tipico) gli ultimi articoli del vostro blog non venissero indicizzati, potete tentare una indicizzazione “mirata” mediante Search Console. Ovviamente prima di farlo dovrete assicurarvi che il vostro sito funzioni, che non restituisca errori e che le pagine vengano caricate, in media, in meno di 1 o 2 secondi al massimo (limite orientativo pratico anche piuttosto permissivo: secondo Google il tempo medio di caricamento di una pagina dovebbe essere di soli 200 ms!)

Per verificare se una pagina o un sito è indicizzato, cerca su Google site:nometuosito.com oppure cerca direttamente l’URL che non ti sembra indicizzato correttamente nella casella di ricerca. In alternativa, leggi la guida contro le penalizzazioni per saperne di più.

Come chiedere a Google di indicizzare un sito (o una pagina)

Come prima cosa sarà necessario registrare il nostro sito sulla Search Console di Google, ovvero andremo ad inserire l’indirizzo del nostro sito web all’interno dei siti che controlliamo nella SC stessa. Dopo aver fatto questo ed aver validato il sito con file HTML fornito da Google, via DNS oppure con il meta tag HTML sempre fornito da Google, saremo pronti a cominciare la nostra avventura.

Apriamo la Search console (https://www.google.com/webmasters/tools), andiamo a scegliere l’indirizzo del sito che ci interessa indicizzare, ed apriamo la finestra Scansione, selezionando Visualizza come Google. Di seguito viene riportato un esempio della finestra di menù che sarà necessario cliccare.

Schermata 2016-04-29 alle 10.09.14Dentro la SC cliccando su Scansione e poi suVisualizza come Google dovremmo trovare un box di testo, come riportato di seguito in esso andremo ad inserire parte dell’URL che non viene indicizzato, e cliccheremo su Recupera. Dopo aver fatto il recupero, ammesso che la pagina sia restituita senza redirect 302/301 e senza errori (404, 500, ecc.), saremo pronti alla seconda fase del lavoro, ovvero inviare all’indice di Google la pagina in oggetto.

In pratica nell’applicazione della SC apparirà una nuova riga in basso, con un bel bottone in bella vista con su scritto “Invia all’indice“: Invia all’indice serve, per l’appunto,  ad inviare l’URL del sito a Google per informarlo che qualcosa è cambiato (la fase precedente serviva solo ad assicurarsi che il vostro sito sia interpretato correttamente e per intero da Google, in effetti).

Schermata 2016-04-29 alle 10.11.58

Clicchiamo pertanto sul bottone Invia all’indice.

Per confermare l’invio dell’URL, selezioniamo una delle due opzioni a seconda di quello che ci serve (solo la pagina in esame o anche quelle collegate da essa mediante link diretto), spuntiamo il Recaptcha e confermiamo col bottone Vai.

Schermata 2016-04-29 alle 10.13.16

Fate attenzione, inoltre, ad una cosa fondamentale: il numero di invii con questa tecnica è limitato, per cui non si tratta di uno strumento di cui abusare. Per indicizzare (o tentare di farlo) il numero massimo di pagine possibili, eseguitelo sulla home (non scrivete nulla nel box testo) e spuntate l’opzione “Esegui la scansione di questo URL e dei relativi link diretti“.

Se 1) il sito è ben strutturato come link interni e navigazionali, e 2) se non ci sono direttive noindex inserite in modo scorretto, dovreste riuscire a forzare la reindicizzazione globale del sito – che comunque rimane un “caso limite”, neanche troppo comune nella mia esperienza. Il più delle volte è meglio reindicizzare singole pagine importanti, ma questo soltanto se avete fatto modifiche di rilievo alla pagina o se la stessa sembra “invisibile” a Google.

La cosa davvero interessante che ho osservato, in questi casi, è che l’acquisizione nell’indice è in molti casi instantanea: questo permette di caricare la vostra pagina, ammesso che ci siano le condizioni per farlo, in modo diretto all’interno di Google e renderla immediatamente ricercabile.

Leggi anche
10 strategie SEO per portare traffico fresco al tu... Gli articoli che trattano l'argomento "aumentare le visite" sul proprio sito, di norma, di solito si concentrano sull'aspetto "contenutistico" puro: s...
Come usare i meta-tag ROBOTS Il meta tag ROBOTS presenta tipicamente un duplice attributo name e description, ed è un tag delle pagine utilizzabile per definire le politiche di in...
Il keyword stuffing ci inganna: è ora di cambiare ... In ambito SEO tutti dovremmo conoscere il keyword stuffing ed i problemi che può causare: su tutti, un prolificare di pagine web inutili per gli utent...
Il PageRank è morto per la 300 milionesima volta La barretta pubblica del PageRank, lo storico indice di Google nonchè il più frainteso e sopravvalutato indice SEO al mondo, sembra che sia stato uffi...
Le 10 discussioni più inutili in ambito SEO Sulla falsariga degli ultimi post, provo a proporvi la lista delle discussioni più inutili che ho sentito fino ad oggi in ambito SEO (di recente, alme...
I 12 miti SEO più pericolosi di sempre Non è arte, non è una scienza esatta e periodicamente ci fa disperare, divertire e lavorare duramente: nel mondo dell'ottimizzazione e della sua divul...