• User

    Deindicizzare pagine

    buongiorno, ho un problema con un sito dove è stato installato un plugin per la generazione di pagine automatiche e, non avendolo settato correttamente il plugin ha generato 2 sitemap con all'interno una sacco di url (5000 circa) che Google ha scansionato. Ora ho eliminato il plugin e ripulito il DB togliendo tutto quello che riconduceva a quel plugin. Rimane solo un problema, come faccio a deindicizzare tutte queste pagine che danno 404?


    sermatica giulio.marchesi 2 Risposte
  • Moderatore

    @thelast

    Ciao,
    le 5000 url circa erano o sono reali? Perchè se erano in 404 come ha fatto Google a indicizzarle?


    T 1 Risposta
  • User

    @sermatica erano della pagine bianche che dopo aver ripulito il DB sono andate in 404. Le abbiamo eliminate perché non potevamo comunque accederci e mettere mano a quelle pagine. Adesso che abbiamo eliminato tutto, come ripuliamo la search console?


    sermatica 1 Risposta
  • User Attivo

    @thelast se ho ben capito, la situazione sembra essere il prosieguo della tua discussione Sito da ripulire meglio 301 o 410?
    Comunque sia, questa generazione automatica di pagine mi sembra (stesso caso oppure simile) a WordPress + WooCommerce, plugin YITH WooCommerce Ajax Product Filter. Vai a creare tag e attributi, utili per la navigazione (filtri di ricerca dei prodotti), il problema è che se ti dimentichi di mettere un bel noindex a priori su ogni attributo, puoi trovare indicizzata questa "porcheria". Dico porcheria perché è un mare di contenuto duplicato, che confonde il crawler anche per l'indicizzazione, quando invece vorresti poco contenuto e di qualità ovvero vedere indicizzata e posizionata la categoria di prodotto, i vari prodotti, ecc. Non ha senso un'insieme di pagine che in pratica contengono l'insieme delle combinazioni dei filtri (pagina dei risultati selezionando attributo1+attributo2, ecc).

    Dato che saranno un'infinità di pagine (date dalle varie combinazioni possibili), quello che puoi fare ora è aggiungere un'istruzione al robots.txt, del tipo Disallow: /negozio?filter* (vedi tu la sintassi, secondo l'architettura del tuo sito, come vengono generate queste pagine ovvero da dove si generano i prametri URL dati dai filtri di ricerca, quindi ciò che segue il punto di domanda nell'URL).

    Tra l'altro in questo preciso momento (che volevo verificare una cosa) Google Search Console sembra avere un errore 500, andiamo bene!

    Comunque ti consiglio di seguire questa strada.


  • Moderatore

    @thelast ha detto in Deindicizzare pagine:

    come ripuliamo la search console?

    Si ripulisce da sola. Quale sezione vedi sporca?
    Potresti usare il Response Code 410 ma lo farei solo in caso di problemi evidenti e non sei in questo caso.

    @thelast se ho ben capito, la situazione sembra essere il prosieguo della tua discussione Sito da ripulire meglio 301 o 410?

    E' lo stesso problema o sono due situazioni diverse?

    Grazie