• User Attivo

    Nuovo tag LINK con rel="CANONICAL": alcune domande

    Visto che questo tag è abbastanza nuovo in rete, e non si trova molto in rete, chiedo qui, nella speranza che qualcuno abbia fatto qualche esperimento. 🙂

    1. se in una pagina "a.html" specifico un canonical che punti alla pagina stessa, può essere in qualche modo "dannoso", o i motori di ricerca semplicemente lo ignoreranno?

    Mi spiego meglio: una piattaforma che uso crea tantissimi contenuti duplicati della pagina "a.html", del tipo "a.html?var=1", a.html?var=2", "a.html?var=n".

    L'ideale sarebbe inserire in tutte le pagine col parametro "var" il seguente codice:

    <link rel=?canonical? href=?a.html? />
    

    Purtroppo, a causa dei limiti della piattaforma in uso non riesco a distinguere, in maniera automatica, la pagina originale, "a.html", dalle pagine con parametri... quindi ho dovuto insere lo stesso codice pure nella pagina originale.

    Leggendo dalle FAQ ufficiali, sembra che Google ignori semplicemente il tag canonical in caso di loop... quindi riuscirei nel mio scopo di far sparire dall'indice tutti i contenuti duplicati, e passare il loro page rank alla pagina originale. Ma, secondo voi, questo loop può in realtà rappresentare un problema?

    1. Quando google avrà capito che una pagina è duplicata, tramite il tag canonical, essa sarà più visibile tramite il comando site:a.html?var=n ?

    Vi ringrazio in anticipo per le risposte 🙂


  • Community Manager

    Ciao Notorius,

    in questo articolo trovi delle affermazioni di Matt Cutts e qui c'è l'articolo di Matt in Inglese 😉

    Inoltre puoi leggere l'articolo di Yahoo, Live e Ask 😉

    Fammi sapere se ti tornano utili 🙂


  • User Attivo

    @notorious said:

    Visto che questo tag è abbastanza nuovo in rete, e non si trova molto in rete, chiedo qui, nella speranza che qualcuno abbia fatto qualche esperimento. [cut]
    Leggendo dalle FAQ ufficiali, sembra che Google ignori semplicemente il tag canonical in caso di loop...

    Invece che i motori si adattino a noi, siamo noi a doverci adattare ai motori. Ennesima prova di quanto appena detto.
    Insomma, spendiamo noi risorse per rendere più facile il loro lavoro.
    Capisco che essere un SEO significa far di tutto per interagire bene con Google and co., però...
    Mi domando cosa facevano i motori di ricerca solo 5 anni fa, quando per esempio impazzavano le pagine con i collegamenti fatti in javascript. E se la sono sempre cavata bene, mi sembra che Google fosse già sufficientemente competitivo.
    Tra un po' inventeranno il tag rel=nogoogle
    o rel=followmegoogleplease :bigsmile:
    Comunque sono contro la proliferazione dei tag.


  • User Attivo

    @Giorgio: rileggendo gli annunci ufficiali, a me sembra di aver capito che il tag aiuta anche a consolidare la link popularity, al contrario di quanto scritto su Antezeta:

    Q: What's the difference between this and a 301/perm redirect?
    A: They are very similar, but sometimes you don't have the easy ability to generate 301/permanent HTTP redirects
    (dalle slide di Matt Cutts)

    It also helps to make sure that properties such as link popularity are consolidated to your preferred version.(da googlewebmastercentral.blogspot.com/2009/02/specify-your-canonical.html )

    Ammetto però di avere grosse lacune sulla comprensione dell'inglese parlato, :D, quindi se questo viene smentito dal video sul blog di Matt Cutts chiedo umilmente scusa :D:D
    (dal testo di Webmaster Central si potrebbe anche intendere: "i contenuti duplicati vengono nascosti in SERP, ed è questo che aiuta a non prendere più link in ingresso su di essi (ma per i link presi prima dell'applicazione del rel canonical, non c'è niente da fare)")

    @valent purtroppo in questo caso siamo in una di quelle situazioni "disperate" di cui parlava Matt Cutts: i blog di blogger/blogspot. Quindi:

    1. nessuna possibilità di modificare il robots.txt;
    2. impossibilità di applicare il redirect 301

    Il problema dei contenuti duplicati di cui parlo è quello relativo ai permalink dei commenti con ?showComment . Sul mio sito io stesso avevo indicato una soluzione parziale (correggere i permalink dei commenti sul template di blogspot). Così si limita il passaggio di eventuale page rank, ma i contenuti duplicati continuano a venire indicizzati (per colpa, penso, del feed dei commenti).

    Il problema, come ho scritto sopra, è che non si riesce, tramite un IF, a distinguere le url con ?showComment da quelle "pulite". Si sarebbe potuto risolvere con un redirect dei poveri (implementabile nella sezione head del template), ma avrei ottenuto un loop di redirect.

    Ecco perché il rel canonical farebbe al caso mio: sempre di loop di tratta, ma il visitatore non si accorge di niente. E, stando sempre alle slide di Matt Cutts, sembra che un loop non dia grossi problemi (anche se è stato messo nella slide dal titolo "non incrociate i flussi"). 😄

    Comunque, ho deciso comunque di testarlo sul mio blog personale (dove eventuali problemi non farebbero grossi danni). Certo, se non dovesse avvenire (come scrive Antezeta) il trasferimento di PR al contenuto originale, sarebbe un peccato (visto che ogni tanto i duplicati saltano fuori in SERP: google.it/search?q=ostra+is+burning&ie=utf-8&oe=utf-8&aq=t&rls=org.mozilla🇮🇹official&client=firefox-a )

    PS: ovviamente questo problema dovrebbe risolverlo Google, visto che Blogger è suo...) 😉

    Aggiornamento: il post che ho pubblicato per fare il test (contenente il rel canonical verso sé stesso, il "loop" di cui parlavo prima), oltre ad essere stato indicizzato sembra essersi posizionato bene (è il risultato proveniente da notoriousxl.blogspot.com😞

    google.it/search?q=rel+canonical

    Inoltre, il contenuto duplicato generato dal commento (che ho linkato all'interno del post, per passargli page rank) non sembra essere stato indicizzato:

    google.it/search?q=inurl%3Ahttp%3A%2F%2Fnotoriousxl.blogspot.com%2F2009%2F03%2Ftag-link-rel-per-i-contenuti-duplicati.html%3FshowComment%3D1237928340000


  • Moderatore

    All in One Seo (per wp) aggiunge il tag canonical, dall'ultimo release.

    Nella pagina a.html viene aggiunto il canonical verso a.html, così come ovviamente viene aggiunto ai vari duplicati a.html#par=1, a.html#par=2 etc etc.

    Il test che hai fatto è molto interessante.


  • User Attivo

    @WWW said:

    Nella pagina a.html viene aggiunto il canonical verso a.html
    Così anche il plugin abbastanza famoso per Wordpress inserisce un loop... non dovrebbe creare problemi, quindi.

    Pubblico altri risultati. Prima dell'applicazione del canonical, col comando site: risultavano 120 contenuti duplicati. Ora (sempre che sia vero che vengono deindicizzati) il numero sta oscillando tra 107 e 95... e spero che questo trend in discesa continui:

    google.it/search?q=site:notoriousxl.blogspot.com+inurl:showcomment%3D&hl=it&client=firefox-a&rls=org.mozilla🇮🇹official&hs=PTk&start=90&sa=N&filter=0

    Googlebot aggiorna comunque molto lentamente i duplicati (probabilmente perché hanno poco trust), quindi il test potrebbe durare molto a lungo. Qui una ricerca in cui avevo notato un duplicato comparire (e ancora è presente):

    google.it/search?q=ostra+is+burning&ie=utf-8&oe=utf-8&aq=t&rls=org.mozilla🇮🇹official&client=firefox-a

    Ovviamente, questo problema dovrebbe risolverlo lo staff di Google/Blogspot: combattono contro i contenuti duplicati, poi ne generano loro stessi più di 5 milioni:

    google.com/search?hl=en&q=inurl%3Ashowcomment+inurl%3Ablogspot.com&btnG=Google+Search&aq=f&oq=

    😉


  • User Attivo

    Ciao a tutti,
    ieri ho provveduto anch'io a inserire una modifica per il canonical .. se può servire a chi usa csm in genere o siti fatti a mano in php sotto linux come il mio .. la riga di codice da inserire nell'header per la generazione dinamica è questa:

    <link rel="canonical" href="http : //w w w.website.com<?php echo $_SERVER['PHP_SELF']?>"/>

    Sono curioso di vedere cosa accade alla home page visto che stando a quello che ho capito il PR è diviso tra:

    http :\miosito.xx
    http :\w w w.miosito.xx
    http :\miosito.xx\index.html
    http :\w w w.miosito.xx\index.html

    in merito ai tempi di Big G per rimuovere i contenuti duplicati a me sono serviti 4 mesi per ridurre al minino i contenuti duplicati generati dalle variabili inserite.

    bye bye mimmo


  • Super User

    @mimmob32 said:

    Sono curioso di vedere cosa accade alla home page visto che stando a quello che ho capito il PR è diviso tra:

    http :\miosito.xx
    http :\w w w.miosito.xx
    http :\miosito.xx\index.html
    http :\w w w.miosito.xx\index.html
    Per i casi come il tuo personalmente continuerei ad utilizzare il buon vecchio
    redirect 301.

    :ciauz:


  • User Attivo

    @notorious said:

    1. se in una pagina "a.html" specifico un canonical che punti alla pagina stessa, può essere in qualche modo "dannoso", o i motori di ricerca semplicemente lo ignoreranno

    salve a tutti , riesumo questa discussione perché , pur avendola letta per intero , non ho mica capito se esiste una risposta certa e definitiva alla domanda in questione.. :mmm:


  • Super User

    A mio avviso il canonical va usato con estrema cautela, e come penultima spiaggia prima del robots.txt.

    Facendo finta che non esistono, pensandoci spesso si trova una soluzione alternativa più efficiente, in grado di evitare duplicati, preservare tutto il link juice, e concentrarlo là dove serve.