• User Attivo

    Cerco una stringa di testo del mio sito ed escono siti porno

    Salve a tutti, ho provato a cercare una stringa di testo presente nel mio sito ed ho notato che tra i risultati di ricerca, oltre al mio sito, compaiono diversi siti porno che ripropongono (almeno a vedere i risultati di ricerca) il testo in oggetto.

    Da cosa può dipendere, c'è da preoccuparsi?

    Grazie in anticipo.


    g.lanzi 1 Risposta
  • Moderatore

    @d-force
    Per stringa di testo intendi una semplice frase o intendi uno snippet di codice?


    D 1 Risposta
  • User Attivo

    @g-lanzi
    E' una semplice frase, questa:
    "Adagiato su una collina a circa 373 mt sul livello del mare che si affaccia sulla valle del fiume Elsa, Montaione ha tutto quello che potreste desiderare da un luogo dove passare una vacanza."

    Da cosa può dipendere?


  • Super User

    Mi è già capitato in passato su un cliente.

    Sono siti che copiano il contenuto di altri siti, inizialmente ottengono di apparire in SERP per le stesse query del sito copiato e poi lo infarciscono di contenuti spam a scopo sostanzialmente di truffa.

    In pratica sfruttano una vulnerabilità di Google nel meccanismo che determina la canonicalizzazione dei contenuti, che è sostanzialmente lento ed impreciso.

    Fanno questa cosa su larghissima scala e non è un attacco deliberato al TUO sito.

    Un meccanismo di difesa potrebbe essere quello di gestire correttamente i self canonical sulle pagine del sito.

    Ad esempio, la pagina è questa?

    https://www.bitn.it/node/1184

    Se è questa, vedo che manca completamente di un'istruzione rel canonical.

    Procederei con il sistemare questo dettaglio.


    D 1 Risposta
  • User Attivo

    @kal ha detto in Cerco una stringa di testo del mio sito ed escono siti porno:

    Mi è già capitato in passato su un cliente.

    Sono siti che copiano il contenuto di altri siti, inizialmente ottengono di apparire in SERP per le stesse query del sito copiato e poi lo infarciscono di contenuti spam a scopo sostanzialmente di truffa.

    In pratica sfruttano una vulnerabilità di Google nel meccanismo che determina la canonicalizzazione dei contenuti, che è sostanzialmente lento ed impreciso.

    Fanno questa cosa su larghissima scala e non è un attacco deliberato al TUO sito.

    Un meccanismo di difesa potrebbe essere quello di gestire correttamente i self canonical sulle pagine del sito.

    Ad esempio, la pagina è questa?

    https://www.bitn.it/node/1184

    Se è questa, vedo che manca completamente di un'istruzione rel canonical.

    Procederei con il sistemare questo dettaglio.

    Grazie Kal per la tua consulenza! Beh, almeno posso stare tranquillo.
    Il mio sito non è quello (https://www.bitn.it/node/1184) che tra l'altro, anche lui, ha rubato il testo dal mio.
    Il mio è questo https://www.visitmontaione.com/it/montaione-toscana-italia/ da dove è stato preso il testo.


    kal 1 Risposta
  • Super User

    @d-force mi sa che c'è qualche problema di canonicalizzazione anche sul tuo sito 🙂

    Manca il rel canonical, lo aggiusterei. Questo ti mette al sicuro da tutti gli scraper "stupidi" che rubano il tuo sorgente HTML e lo pubblicano su altro dominio. In questo modo Google capisce che è copiato e non pubblica in serp il sito pirata.

    Inoltre, per la frase che hai citato sopra:

    "Adagiato su una collina a circa 373 mt sul livello del mare che si affaccia sulla valle del fiume Elsa, Montaione ha tutto quello che potreste desiderare da un luogo dove passare una vacanza."

    In SERP appare una pagina che però restituisce 404... probabilmente è la prima versione che hai pubblicato, ad un URL differente rispetto all'attuale.

    Dovresti a far bene fare un redirect 301 dalla vecchia URL verso la nuova.

    Insomma: consolida i segnali di canonicalizzazione e non corri rischi.


    D 1 Risposta
  • User Attivo

    @kal

    Si, per quella frase, esce una url https://www.visitmontaione.com/it/2-alla-scoperta-di-montaione/
    Che credo sia stata generata dinamicamente quando il sito era su Joomla, perchè di fatto non ho mai costruito una pagina con quella url.
    Poi a febbraio ho fatto la migrazione da joomla a Wordpress, e qui sono cominciati i problemi.

    Purtroppo mi sono accorto tardi che Wordpress (almeno nelle funzioni standard) non inserisce il suffisso .html alle pagine (e non puoi farlo nemmeno dalle impostazioni permalink), ed in più per un problema di conflitto tra Yoast seo e un mio plugin, tutte le pagine avevano un link rel=canonical che puntava alla home page.

    Tutto questa ha letteralmente "azzerato" l''indicizzazione di quasi tutte le pagine.

    Il 1 problema è stato risolto con un redirect di tutte le pagine con .html a quelle senza .html.
    Il 2 problema è stato risolto dai fornitori del plug-in togliendo la stringa rel=canonical che andando in conflitto con yoast seo causava il puntamento di tutte le pagine alla home.

    Dovrei sentire se possono modificare questo plugin in modo che punti alla pagina giusta...


    marcopuccetti 1 Risposta
  • Moderatore

    Ciao @d-force, dipende semplicemente dalle parole utilizzate all’interno delle pagine. Molto probabilmente hanno una densità maggiore su quei siti per le parole che stai ricercando.

    Marco



Descrizione: