• User Attivo

    Togliere pagine da cache di google

    Per togliere le pagine dalla cache di google oltre ad inserire il file robots con scritto
    User-agent: *
    Disallow: /
    cosa altro si può fare visto che alcune pagine rimangono ancora in cache?


  • Moderatore

    Ciao nandonando2,
    se tu inserisci

    User-agent: *
    Disallow: /
    

    Dici semplicemente a tutti gli spider di non indicizzare l'intero contenuto del tuo sito, se invece vuoi bloccare solo una cartella o un file devi inserire il nome di questi dopo "disallow" in questo modo:

    User-agent: *
    Disallow: /nome-cartella-da-eliminare/
    
    oppure
    
    User-agent: *
    Disallow: /nome-file-da-eliminare.estensione
    

    Puoi agire anche sulla pagina stessa inserendo il tag:

    <meta name="robots" content="noindex, nofollow" />
    

    In questo caso indichi allo spider di non indicizzare la pagina e non seguire i link al suo interno.

    Per eliminare una pagina già indicizzata prima la blocchi tramite il robots o il meta robots e poi la puoi eliminare dal GWT.

    Per non far memorizzare in cache la pagina si usa il tag meta robots "noarchive".

    Ciao
    Enea


  • User Attivo

    1)Allora metto in robots:User-agent: *
    Disallow: /(creado sia indispensabile)
    2)<meta name="robots" content="noindex, nofollow" />(è indispensabile questo? o ne posso fare a meno?)
    3)<meta name="robots" content="noarchive">(è indispensabile questo? o ne posso fare a meno?)
    4) GWT cosa è lo deo usare?

    Tutto premettendo che il sito in questione è già attivo è indicizzato e già presente nella cache di google?
    Grazie


  • ModSenior

    Attenzione nandonando2.
    Se vuoi usare quei meta tag non devi bloccare il passaggio del crawler di Google nel file robots.

    Discorso diverso se invece vuoi usare lo strumento di rimozione presente in GWT.

    Valerio Notarfrancesco


  • User Attivo

    Allora la mia richiesta è:
    le pagine devo sparire dall'indice di google quali sono le giuste operazioni?
    Sono un pò confuso tra posso fare e potrei anche fare.
    Esiste un metodo esatto e corretto?


  • Moderatore

    A questo indirizzo puoi trovare la guida ufficiale di google per bloccare o eliminare pagine dal suo indice e approfondire meglio l'argomento.

    In caso qualche passaggio del procedimento non sia chiaro chiedi pure e vedrò cosa posso fare per te 😄

    Ciao
    Enea


  • ModSenior

    @nandonando2 said:

    1. GWT cosa è lo deo usare?

    Mi sono accorto adesso di questa tua domanda, scusami per non aver risposto.

    Allora, GWT è una sigla acronimo di Google Webmaster Tool. In Italiano lo trovi come Strumenti per Webmaster di Google.
    E' un pannello informativo dove trovi diverse indicazioni utili per gestire il tuo sito, ad esempio trovi eventuali segnalazioni da parte di Google, puoi impostare la nazione alla quale si rivolge il tuo sito, puoi inviare la sitemap (un file con l'elenco delle pagine del tuo sito) e tante altre funzioni.

    L'iscrizione è gratuita e ti consiglio proprio di farla perché è l'unica forma di comunicazione tra chi gestisce il sito e Google.

    Venendo al tuo dubbio nandonando2, non esite un metodo esatto e corretto, esistono diversi metodi e l'uno piuttosto che un altro dipende dalle tue specifiche esigenze.

    Come ti ha consigliato overclokk, leggi la guida ufficiale e poi ne discutiamo qui volentieri.
    In questo modo avrai la padronanza della tecnica e potrai scegliere la soluzione migliore per questo progetto e per quelli futuri.

    Valerio Notarfrancesco


  • User Attivo

    Allora mettero i tag no archive, chiedero la rimozione e successivamente mettero nel file robots di non indicizzare le pagine, credo che questa sia la giusta procedura.


  • Moderatore

    Prima devi bloccare la pagina o le pagine tramite il robots.txt o eventualmente tramite il tag meta nella pagina stessa, poi richiedi la rimozione.

    Il tag noarchive si usa solo in detterminate situazioni.

    Ciao
    Enea


  • User Attivo

    OK e in che occasioni bisogna usare il tag noarchive?
    Il cliente mi ha chiamato e mi ha detto che deve sparire dagli indici
    non deve apparire questo sito, quindi credo che io debba usare anche il tag no archive.
    Tra le altre cose devo avere la certezza che tutto funzioni e che questo sito sparisca dagli indici perhè devo fargli anche un preventivo.


  • Moderatore

    Il tag noarchive si usa quando si vuole che venga indicizzata una pagina ma non si vuole che venga memorizzata in cache, di solito perchè la pagina viene spesso aggiornata e così non si rischia di avere contenuto obsoleto in cache.

    Ma quindi non ho capito, devi eliminare un intero sito o solo alcune pagine?


  • User Attivo

    Tutto il sito, non deve essere mai presente negli indici.


  • Moderatore

    Da come avevi scritto il primo messaggio pensavo volessi eliminare solo alcune pagine, in questo caso per eliminare l'intero sito lo blocchi con:

    User-agent: *
    Disallow: /
    

    come avevi scritto tu.

    Poi fai la richiesta di eliminazione tramite il pannello di controlo del GWT.

    Ciao
    Enea