• User

    GWT errori 404 per topics phpbb cancellati

    Sto riscontrando su un sito degli errori 404, tanti davvero, che riguardano il forum phpbb con mod seo.
    Praticamente ogni pagina di ogni topic cancellato mi da errore 404.
    Chi gestisce un Forum spesso può avere l'esigenza di cancellare delle pagine che sono state già indicizzate. Come bisogna comportarsi per evitare che ci siano questi errori?
    Le pagine di errore sono davvero tante, fare un redirect verso la home del forum nel .htaccess per ogni pagina è un lavoro da certosino.

    In più anche le relative sitemap risentono di questi errori sul Google Webmaster Tool.

    Avete qualche consiglio?


  • Moderatore

    Ciao nwa,
    di solito quando si vuole eliminare del contenuto su un sito lo si blocca tramite il file robots.txt o un meta tag robots sulla pagina e poi si procede all'eliminazione, con un po' di tempo e pazienza google lo eliminerà dall'indice, puoi velocizzare la procedura facendo direttamente nel pannello di controllo del GWT la richiesta di eliminazione della pagina.

    Se per caso quella pagina fosse linkata da qualche sito allora ti consiglio un redirect su un'altra pagina o chiedi al webmaster se può eliminare il link.

    Ciao
    Enea


  • User

    @overclokk said:

    ...

    Grazie innanzitutto,
    però immagina a cancellare 2 o 3 topics con centinaia di messaggi siddivisi ognuno in 15 o 20 pagine ... Cosa occorre fare? Inserire ogni singola pagina nel robots?
    Credo ci sia qualcosa di alternativo meno laboriosa. No?


  • Moderatore

    Non so se esiste una procedura più corta, quello che mi viene in mente è bloccare la url della discussione tramite robots ed in automatico dovrebbero bloccarsi anche le risposte alla discuzzione stessa, come per esempio questa discussione in cui la url è:

    giorgiotave.it/forum/google-webmaster-tool/181965-gwt-errori-404-per-topics-phpbb-cancellati.html
    

    Se la volessi bloccare scriverei:

    Disallow: /forum/google-webmaster-tool/181965-gwt-errori-404-per-topics-phpbb-cancellati
    

    In questo modo si bloccherebbe anche questa:

    giorgiotave.it/forum/google-webmaster-tool/181965-gwt-errori-404-per-topics-phpbb-cancellati.html#post962033
    

    Ecc.

    Poi con il tempo google la toglierebbe dal suo indice, (potrebbe impiegarci anche dei mesi).

    Ciao
    Enea


  • User

    Grazie Enea,
    ci proverò e Vi terrò aggiornati, ma se nel frattempo c'è qualcuno con una soluzione personalizzata per phpbb ... si faccia avanti.

    😉


  • User

    Ma se invece di avere questa struttura di link

    [HTML] /forum/google-webmaster-tool/181965-gwt-errori-404-per-topics-phpbb-cancellati[/HTML]

    avessi quest'altro tipo di struttura

    [HTML] /forum/google-webmaster-tool/181965-gwt-errori-404-per-topics-phpbb-cancellati-t4507.html[/HTML]

    in cui la seconda pagina diventa

    [HTML] /forum/google-webmaster-tool/181965-gwt-errori-404-per-topics-phpbb-cancellati-74507-2.html[/HTML]

    la terza

    [HTML] /forum/google-webmaster-tool/181965-gwt-errori-404-per-topics-phpbb-cancellati-74507-3.html[/HTML]

    ... non credo che mettendo il disallow solo a

    [HTML] /forum/google-webmaster-tool/181965-gwt-errori-404-per-topics-phpbb-cancellati-t4507.html[/HTML]
    possa bastare.
    Correggimi se sbaglio.


  • User

    Mi rispondo da solo ... uso l'*

    [HTML]
    disallow: /forum/google-webmaster-tool/181965-gwt-errori-404-per-topics-phpbb-cancellati-t4507.html
    disallow: /forum/google-webmaster-tool/181965-gwt-errori-404-per-topics-phpbb-cancellati-t4507*.html
    [/HTML]

    dovrebbe andare bene, no ?
    Il primo cancella la discussione base, il secondo, tutte le altre sottodiscussioni. Forze potrebbe bastare solo il secondo.


  • Moderatore

    L'asterisco non importa, se tu hai questa struttura:

    disallow: /forum/google-webmaster-tool/181965-gwt-errori-404-per-topics-phpbb-cancellati-t4507
    

    Semplicemente verranno bloccate tutte le pagine il cui url inizia per quella url, per esempio:

    
    disallow: /forum/google-webmaster-tool/181965-gwt-errori-404-per-topics-phpbb-cancellati-t4507a
    disallow: /forum/google-webmaster-tool/181965-gwt-errori-404-per-topics-phpbb-cancellati-t4507-1
    
    

    Così verranno bloccate tutte le pagine con qualsiasi desinenza.

    Ciao
    Enea


  • User

    Così verranno bloccate tutte le pagine con qualsiasi desinenza.

    Non capisco, cosa si va a bloccare con l' * ?


  • Moderatore

    L'* è più utile in questa situazione:

    disallow: /forum/google-webmaster-tool/*pagina-qualsiasi.html
    

    Poichè bloccherà tutte le pagine che hanno l'url che finisce con "pagina-qualsiasi.html"
    Messo alla fine è uguale a non metterlo:

    disallow: /forum/google-webmaster-tool/pagina-qualsiasi
    disallow: /forum/google-webmaster-tool/pagina-qualsiasi*
    

    Queste due regole hanno lo stesso significato quindi di solito si omette, in caso invece volessi bloccare solo le pagine html (per esempio) e non le htm allora l'* è utile inserirlo così:

    disallow: /forum/google-webmaster-tool/*pagina-qualsiasi*.html
    

    Spero sia più chiaro 🙂
    Ciao
    Enea