• User

    Non indicizzare una porzione di testo

    Ciao a tutti,

    se si ha l'esigenza di non indicizzare porzioni di contenuto di una pagina (es. recapiti, indirizzi telefono presenti nell'header in tutte le pagina del sito),
    è possible/corretto inserire le istruzioni <meta name="robots" content="noindex, follow"> all'interno di un <div> o <span>?
    Di seguito un es.

    <body>
    ...
    <div class="header-top-left">
    <a href="mailto:[email protected]">[email protected]</a>  <a href="tel:">+39 555 44456</a>
    </div>
    ...
    </body>

    Grazie in anticipo


  • User

    Ciao, non capisco dall'esempio che hai fatto, dove sta il meta robots? Ad ogni modo non è corretto mettere quest'ultimo nei div e span.


  • User

    Ciao Andrea,

    in effetti nella fretta ho sbagliato, il mio esempio voleva essere il seguente:

    <body>
    ...
    <div class="header-top-left">
    <META NAME="ROBOTS" CONTENT="NOINDEX, NOFOLLOW">
    <a href="mailto:[email protected]">[email protected]</a>  <a href="tel:">+39 555 44456</a>
    </div>
    ...
    </body>

    Quindi se come dici tu è errato inserire il meta robots come indicato sopra, come bisogna fare per non indicizzare una porzione di testo? (sempre se sia possibile)


  • User

    Prova ad inserire il seguente tag prima del testo che non vuoi sia indicizzato:
    <!--googleoff: all-->
    e poi
    <!--googleon: all-->
    Per finire la zona no index.
    Premetto che non l'ho mai usato e non so se funziona... :bho:


  • Moderatore

    Ciao a entrambi,

    @Andrea Rinaldi said:

    Prova ad inserire il seguente tag prima del testo che non vuoi sia indicizzato:
    <!--googleoff: all-->
    e poi
    <!--googleon: all-->
    Per finire la zona no index.
    Premetto che non l'ho mai usato e non so se funziona... :bho:
    Purtroppo tag di commento googleoff/googleon funzionano solo per la Google Search Appliance, non hanno alcun effetto per la normale web search (sfortunatamente, perché sarebbe utile).
    Yahoo in passato aveva introdotto un metodo per sortire l'effetto aggiugendo una class="robots-nocontent", ma si tratta di Yahoo, e non sono nemmeno sicuro funzioni ancora.

    @Lorenz3 said:

    in effetti nella fretta ho sbagliato, il mio esempio voleva essere il seguente:

    <body>
    ...
    <div class="header-top-left">
    <META NAME="ROBOTS" CONTENT="NOINDEX, NOFOLLOW">
    <a href="mailto:[email protected]">[email protected]</a>  <a href="tel:">+39 555 44456</a>
    </div>
    ...
    </body>

    Quindi se come dici tu è errato inserire il meta robots come indicato sopra, come bisogna fare per non indicizzare una porzione di testo? (sempre se sia possibile)
    Il meta tag robots ha effetto a livello di pagina.
    Andrebbe nella sezione HEAD dell'html, ma se la metti fuori è probabile (l'ultima volta controllai era così) che Google te la trovi lo stesso, e ti metta a noindex tutta la pagina, decisamente non l'effetto desiderato!

    @Lorenz3 said:

    se si ha l'esigenza di non indicizzare porzioni di contenuto di una pagina (es. recapiti, indirizzi telefono presenti nell'header in tutte le pagina del sito),
    è possible/corretto inserire le istruzioni <meta name="robots" content="noindex, follow"> all'interno di un <div> o <span>?
    E' una richiesta molto comune, e né Google né Bing forniscono un mezzo diretto per farlo.
    I webmaster adottano in generale due approcci differenti:

    • o mettono il tutto come testo stampato in un'immagine (quindi i due link non sarebbero più attivi),
    • o mettono un iframe con il contenuto, e la pagina con lo snippet la tengono a noindex.

    Il secondo approccio sembrerebbe quello più adatto perché preserverebbe i link; non sono sicuro di come si presenterebbe su mobile, sicuramente è di tuo interesse usando tu il protocollo "tel:".

    La domanda da porre è però:
    Perché desideri che e-mail e telefono non siano indicizzati?
    Google e gli altri motori di ricerca sono molto bravi a distinguere un contenuto in un header ripetuto per tutte le pagine, non sarebbe un problema, e presentarsi come un'attività "reale" in genere è un segnale positivo, comunica maggiore fiducia e affidabilità rispetto a un sito dove non è chiaro un contatto.
    Qual è la tua motivazione?

    Spero d'esserti stato utile


  • User

    Ciao Federico,
    sei stato utilissimo. Per rispondere alla tua domanda, la mia motivazione era la ricerca di un modo per evitare di far indicizzare ai motori di ricerca un contenuto identico in tutte le pagine, però se come dici tu Google & Co. distinguono un contenuto in un header ripetuto per tutte le pagine, allora direi che sono a posto :smile5:

    Grazie mille,
    Lorenz


  • User Attivo

    ciao ragazzi, avrei bisogno di fare la stessa cosa perchè google mi trova nella sezione GWT "parole chiave per la rete di contenuti" tutte le parole del modulo dell'accettazione dei cookie (nelle prime 8 parole), e la prima parola utile del sito me la ritrovo al nono posto. Ovviamente questo penalizza molto il seo del sito su cui sto lavorando. Pensate sia un problema di progettazione del modulo installato (sito in joomla 2.5) oppure cosa ??? grazie per eventuali risposte


  • Moderatore

    Ciao Ago_,

    @Ago_ said:

    ciao ragazzi, avrei bisogno di fare la stessa cosa perchè google mi trova nella sezione GWT "parole chiave per la rete di contenuti" tutte le parole del modulo dell'accettazione dei cookie (nelle prime 8 parole), e la prima parola utile del sito me la ritrovo al nono posto. Ovviamente questo penalizza molto il seo del sito su cui sto lavorando. Pensate sia un problema di progettazione del modulo installato (sito in joomla 2.5) oppure cosa ??? grazie per eventuali risposte
    Quel report ha poco o nulla a che vedere con il posizionamento per parole chiave nella SERP di Google, è un mero contatore di parole trovate nei contenuti del sito.

    Il suo scopo è mettere in evidenza parole sospette, per esempio se vedi tra le prime parole della lista "viagra" e "cialis", e non sei un sito di argomenti farmaceutici dedicato ai problemi erettili, puoi capire il sito è stato crack-ato ed è il caso di metterlo a posto.

    Il testo dell'informativa è ripetuto per tutte le pagine viste da googlebot, è normale. Meglio non sia la parte più preponderante del testo, ma non è il caso di preoccuparsi se è solo per quello.

    Spero d'esserti stato utile


  • User Attivo

    grazie mille. Quindi non mi preoccupo più di tanto...anche se è un po insolita come cosa...