Google indicizza ciò che vuole?
Internet Saturday 8 March 2008 alle 14:33Questo articolo, stranamente, a differenza dei tanti già scritti, è una richiesta, una richiesta di informazioni a chi ha già affrontato l’argomento o si è trovato con questo strano dubbio e incomprensione sui come e perchè.
Prima di creare l’applicativo per l’analisi delle pagine web, stavo cercando di capire in base a quali criteri (oltre alla link popularity) Google, ormai insuperabile, indicizza i contenuti del web e li propone nelle proprie SERP. Avevo così creato un piccolo software che avrebbe dovuto ottenere rapidamente le informazioni da me cercate.

Il software, chiamato Google Search Analyzer, richiede a Google le prime 10 posizioni di una determinata ricerca in una particolare lingua, elabora i contenuti di quelle pagine e ne va a calcolare il numero di ripetizioni dei termini contenuti. Questo per cercare di comprendere quanto la keyword(s) cercata sia importante:
- nel titolo della pagina (title tag)
- nel meta keywords (ormai in disuso)
- nel contenuto della pagina (a livello di keyword density)
Questo piccolo e semplice software è sempre stato “nascosto” ai motori di ricerca, non ricevendo alcun link da pagine esterne. Vero è anche che non avevo in alcun modo bloccato tramite l’ausilio del file robots.txt nella root del dominio la cartella contente lo stesso. Eppure Google ci è arrivato. Come ha fatto!?

Il motivo con cui Google deve essere arrivato alla pagina può essere semplice: l’applicativo, come già detto, altro non fa che richiamare una pagina di Google con i risultati della ricerca per poi andare ad analizzare uno per uno gli stessi. Come un referral, Google ha recuperato l’indirizzo del mio sito e l’ha immagazzinato e poi…diritto in SERP.
Ho ripreso quel semplice software qualche giorno prima di partire, in modo da cercare di svilupparlo un po’ più nei dettagli e renderlo il più rapido possibile nell’elaborazione del codice della pagine. Per farlo ho dovuto chiaramente farne qualche test e il risultato è stato che…
Google lo ha indicizzato
Ma le sorprese non sono finite: Google NON ha indicizzato la pagina principale del motore, ma solo alcune ricerce fatte da qualcuno e, giuro, quel qualcuno non sono io!!! I miei test si sono limitati alla parola gatto, cane, cani. E riguardo a questo argomento mi torna in mente un articolo scritto da Marco Ziero sulle ricerche interne dei blog. Marco, se leggi questo articolo, ecco una risposta: non ho mai attivato in Analytics la funzione di analisi delle ricerche interne del blog, eppure, Google ci è arrivato!
Provvederò in questi prossimi minuti a fare un semplice aggiornamento alla pagina per renderla maggiormente SEO friendly, con la variazione del title tag e della description delle pagine.
Ho solo un timore, quello di vedere sparire il mio dominio dalle SERP di Google, ma non voglio comunque tirarmi indietro, voglio continuare a capire cosa succede e come Google e i suoi spider lavorano.
PS: se qualcuno ha voglia di suggerire funzioni o qualcosa di particolare da implementare nel tool Google Search Analyzer, mi scriva che provvederò quanto prima ad aggiungere le migliorie.
1 April 2008 alle 13:04
Ciao Simone, relativamente all’indicizzazione del tool, credo che tu abbia azzeccato il punto: vedendoti come referral ti ha individuato.
Circa il secondo punto, Simone Carletti mi aveva confermato che se n’era parlato tempo fa su qualche forum.
Google sembra compilare le form.
Ti confermo, inoltre, che continua a salvare tra le pagine indicizzate nel suo database le pagine del mio blog che nell’URL contengono una query di ricerca.
Le ho bloccate con il Robots.txt e dal Google Webmaster Tool vedo che continuano ad aumentare.
Mah?!?
1 April 2008 alle 13:27
Ciao Marco, un piacere trovarti a postare sul mio blog! Spero non sia un pesce d’aprile!!!
Avevo letto anch’io di Google che sembra compilare le form per cercare di verificare che le pagine mostrate agli utenti siano le stesse mostrate a lui.
Sicuramente ci toccherà aspettare ancora qualche tempo prima di avere informazioni dettagliate e nel frattempo…beh, continuiamo a farci domande!!!
29 April 2008 alle 1:16
[...] Marco Ziero, Simone Cabrino e nel forum html.it si era accorti del fenomeno e si aveva ipotizzato un ipotetico tentativo di [...]