• User Attivo

    Indicizzazione pagine fantasma

    Salve ragazzi, ho bisogno di voi per risolvere un problema su cui sto :arrabbiato:
    Non so se posto nella categoria corretta, se non lo fosse mi scuso in anticipo.

    Ho preso in mano un sito in Wordpress e fatto il listato delle pagine indicizzate su google con site: ho trovato indicizzate pagine fantasma del tipo

    www . miosito . it / sim​ple​-ti​ps-​to-​wri​te-​stu​den​ts-​cas​e-s​tud​y-i​n-h​our​s-1​0/
    www . miosito . it / pro​spe​cts​-fo​r-s​mal​l-a​nd-​big​-su​ppl​ier​s-2​/

    e via dicendo una quarantina di queste pagine fantasma con atterraggio su pagina 404.

    OK bene sito hackerato.

    Non disponendo di backup sicuro ho ricaricato una installazione di wp pulita, ho reinstallato tema pulito e plugin puliti.

    Nulla da fare problema non risolto

    Ho aperto il Database e sono andato pazientemente alla ricerca di anomalie.. e ad occhio nulla di strano.
    Della vecchia installazione ho tenuto solo in config.php ma li non c'è nulla di anomalo.

    Ho fatto rimozione delle URL da Search Console e contemporaneamente le ho bloccate con il robots.txt

    Nulla Google le rimuove e dopo qualche giorno di nuovo nell'indice.

    CHE NE PENSATE? SUGGERIMENTI? A QUALCUNO STA SUCCEDENDO LA STESSA COSA?


  • Moderatore

    Ciao
    ho una brutta notizia, non è detto che il tuo sito sia stato hackerato e potresti aver lavorato per nulla. Potrebbero averti linkato quelle pagine e quindi google le ha indicizzate in qualche modo o quelle pagine potrebbero essere un segno di un vecchio hackeraggio oppure pagine demo cancellate. Che dati vede con il comando site:? Hai accesso a tutte e 4 le versioni della Search Console? Hai verificato tutti e 4 le versioni e relativi proprietari?


  • Super User

    Ciao,

    non è necessariamente un problema.

    Se le blocchi con robots.txt, Google non vedrà che restituiscono 404.

    Piuttosto, verifica cosa vede Google con il Fetch as Googlebot dalla Search Console. Se restituiscono 404, dimenticati del problema, e spariranno da sole.


  • Moderatore

    @must said:

    Ciao,

    non è necessariamente un problema.

    Se le blocchi con robots.txt, Google non vedrà che restituiscono 404.

    Ciao se si fa cos'ì le pagine rimarranno perennemente indicizzate visto che Google non può vederle e se linkate dall'esterno potrebbero tirare giù il sito o posizionarlo per Keyword Offtopic.


  • Super User

    @Sermatica said:

    Ciao se si fa cos'ì le pagine rimarranno perennemente indicizzate visto che Google non può vederle e se linkate dall'esterno potrebbero tirare giù il sito o posizionarlo per Keyword Offtopic.

    Ciao,
    non ho capito. Puoi spiegare meglio?

    Grazie, ciao.


  • Moderatore

    Ciao
    se hai pagine sul sito che vuoi deindicizzare da Google le mandi in 404 o meglio in 410 ma se prima di cancellarle gli blocchi l'accesso lui non può sapere che sono state cancellate.


  • Super User

    @Sermatica said:

    Ciao
    se hai pagine sul sito che vuoi deindicizzare da Google le mandi in 404 o meglio in 410 ma se prima di cancellarle gli blocchi l'accesso lui non può sapere che sono state cancellate.

    Corretto. Era quello che dicevo anche io; non mi ero spiegato bene evidentemente 🙂

    Donomassimo ha scritto "Ho fatto rimozione delle URL da Search Console e contemporaneamente le ho bloccate con il robots.txt", ed ovviamente non va bene. Le pagine restituiscono già 404, quindi il problema non si pone.