• Super User

    Link Canonical, Sitemap ed indicizzazione.

    Una domanda: se utilizzo il tag canonical nel caso di gallerie di fotografie, gif animate o altro che generi pagine duplicate per mancanza di testo che le differenzi, devo inserire lo stesso tali pagine nella sitemap per Google?
    In questo caso i link presenti vengono seguiti o non essendo indicizzate non essendo canonical i link è come se fossero nofollow?


  • Moderatore

    Ciao cassiopea,
    ho preferito creare questa nuova discussione perché nella precedente avevamo già divagato abbastanza. Provo a risponderti.

    Le pagine duplicate non dovrebbero finire nella Sitemap, a prescindere dalla presenza del link canonical: anzi, sarebbe buona norma cercare di non farle indicizzare affatto.
    Se invece vuoi che la pagina venga indicizzata perché deve ricevere visite dai motori di ricerca (ad esempio, hai una gallerie di gif che speri possa attirare traffico), allora devi sforzarti di differenziare gli attributi alt di ogni immagine e aggiungere del testo per rendere comunque i contenuti unici. In questo caso la url va in Sitemap ed è sbagliato inserire il canonical.

    In generale è utile considerare questo elemento HTML come "ultima risorsa" del webmaster per notificare ai motori che quella pagina è sostanzialmente una copia di un'altra.

    Riguardo la seconda domanda: non mi è molto chiaro cosa tu intenda per "nofollow", ma provo lo stesso ad aiutarti.
    Considera che concettualmente Google tenta di trattare il canonical alla stregua di un redirect 301: se il crawler capita su di una pagina mai indicizzata prima avente il link verso un'altra url, allora non la dovrebbe indicizzare. Al contrario del redirect, però, sul quale il motore di ricerca non può tecnicamente intervenire (la redirezione avviene lato server), sui canonical Google si propone di salvaguardare comunque l'esperienza dell'utente dove ne sia riscontrato un uso "scorretto" (decidendo ad esempio di indicizzare la pagina).

    Qualche utente ha avuto esperienze in merito?

    Spero di averti tolto qualche dubbio sul link canonical e che tu voglia postare nuovamente qualora te ne siano rimasti.

    Buon lavoro!


  • User

    Salve, approfitto della discussione per chiedere un aiuto in proposito.
    Io ho scelto il non www come preferito su google webmaster, utilizzando un programma di analisi mi viene riferito che il sito non è stato reindirizzatto correttamente (anche se quando digito il sito con www va in automatico nel non www). Ecco cosa dice l'analisi:

    Il sito NON è correttamente ridiretto.

    Cos’è una ridirezione? Con la ridirezione è possibile inoltrare un visitatore di una pagina web verso un'altra, senza che l'utente se ne accorga.

    Questo punto si riferisce alla ridirezione da miosito.it a miosito.it
    Perché è importante questo? Perché per un motore di ricerca come Google miosito.it è totalmente un altro sito rispetto a miosito.it.
    Ciò può portare a problemi di contenuto duplicato e problemi di statistica. E’ per questo consigliabile effettuare questa ridirezione.

    Ho inserito vari codici sul file htaccess senza risolvere nulla. Anche tramite plugin redirect non ho risolto.

    Qualcuno mi può aiutare? ( Mio sito presente qui sopra sono tutti e quattro senza www, non capisco perché dovrei fare il reindirizzamento dal non www sempre al non www).


  • User

    nessuno disponibile?


  • Moderatore

    Ciao nir7771,
    riesci a scriverci il dominio in questione senza www o http iniziali (es. "giorgiotave.it")?

    Magari si tratta di un errore dello strumento di test che stai utilizzando. Puoi dirci come si chiama?

    Restiamo in attesa e ti auguriamo buon lavoro,
    Marco.


  • User

    Il sito di analisi è www punto checktheweb punto it/strumenti-ottimizzazione/site-check-up/demo/ mentre il mio sito è estrattore--di--succo punto it ( due trattini prima e dopo la parola di ), ho provato ad analizzare altri siti e non si riscontra il problema.


  • Moderatore

    Ciao nir7771, il sito esegue correttamente il redirect.

    Google lo recepisce correttamente non indicizzando contenuti con il www (link) e indicizzando quelli senza (link).

    Molto probabilmente il tool che hai usato non gestisce il caso nel quale il sito non sia in www. Ho provato anche con bit.ly e ************ che fanno dei redirect il loro core business e mi da il solito errore.

    Buon lavoro e a presto,
    Marco.


  • User

    Ti ringrazio tanto dell'aiuto 🙂 almeno so che è tutto apposto.
    A presto