• User Attivo

    Perchè google indicizza anche le pagine che non voglio ?

    Ho usato il robots.txt, però quando faccio site:miosito.com vedo che google ha indicizzato tra i risultati "omessi" anche tutte quelle pagine che non volevo far indicizzare...c'è qualche modo per evitare tutto ciò ?


  • ModSenior

    Inserisci questa riga nella sezione <head> delle tue pagine:

    <meta name="robots" content="noindex, nofollow">
    Dagli strumenti per webmaster di Google poi rimuovi gli url che non vuoi che siano presenti nei risultati.

    Valerio Notarfrancesco


  • User Attivo

    quindi robots.txt non basta ? In teoria gli ho già detto che non le voglio indicizzare. Ma se rimangono così come sono abbassano il valore del mio sito o robe simili ?


  • Moderatore

    Ciao Marcomail,

    è normale che le pagine bloccate da robots.txt siano presenti nell'indice: Google non le accede ma ne conosce comunque l'URL. Il comando impone di non leggere il documento, non di non indicizzarlo.

    Se poi hai bloccato le pagine quando già erano nella cache del motore di ricerca, è possibile che per un periodo vi restino (per velocizzare il processo di cancellazione utilizza pure gli Strumenti per Webmaster, come consigliatoti).

    Credo invece che sia completamente inutile, almeno per quanto riguarda Google, inserire il noindex in una pagina bloccata dal robots.txt: il crawler non accedendo non potrà mai leggere la direttiva.

    Se pensi che Google conosca il contenuto di una pagina creata o modificata dopo averla bloccata (lo puoi vedere ad esempio attraverso la copia cache), ti prego di segnalarla: si tratterebbe a mio avviso di un'anomalia.

    Spero di essere stato abbastanza chiaro, in caso contrario prova a segnalare qualche caso specifico (naturalmente senza inserire link attivi) e cercherò di spiegarmi meglio.

    Per il momento ti saluto e ti auguro buon lavoro.