• User

    url duplicati con #! finale

    Salve a tutti, facendo uno scan con visual seo studio ho notato che tutti gli url del mio sito duplicati in modo strano.
    Ad esempio ho:

    /corsi/corso-milano-20-ottobre-2015

    e

    /corsi/corso-milano-20-ottobre-2015#!

    io non ho route definite in quel modo e non capisco cosa possa generarle.

    Qualcuno può suggerirmi qualche verifica da fare?

    Grazie


  • User Attivo

    Codesto non te lo so dire nemmeno io, in ogni modo spulciando nel pannello di GWT trovi anche lo strumento per indicare al crawler di google di non tenere in considerazione quelli con finale #! , oppure metti un canonical che risolvi.


  • User

    si avevo pensato anche io di specificare il canonical in automatico. Volevo comunque indagarne le cause e trovare una soluzione pulita ma per quello devo debuggare un pò. Cmq ok proverò con il canonical in caso di speranze perse. grazie


  • Moderatore

    Ciao ocrama,

    @ocrama said:

    si avevo pensato anche io di specificare il canonical in automatico. Volevo comunque indagarne le cause e trovare una soluzione pulita ma per quello devo debuggare un pò. Cmq ok proverò con il canonical in caso di speranze perse. grazie
    La parte !# - chiamata hashbang - è normalmente usata in siti ajax che seguono le specifiche di Google per rendere i siti ajax "crawl-abili" (ossia esplorabili da un bot).

    Tutta la parte dell'URL che fa parte dell'hash - dal simbolo # in po - non è trasmessa al web server via HTTP, il "trucco" è che sotto il cofano in maniera trasparente all'utente #! è sostituito con ?_unescaped_fragment=...

    Laddove entrambe le versioni sia con che senza #! sono raggiungibili, normalmente è prassi fare sì che quella senza sia quella si desidera indicizzata, e quella con hashbang abbia il canonical che punti alla prima, tuttavia senza conoscere il caso specifico e la piattaforma usata non è possibile dare una risposta definitiva. Una volta rispettate le specifiche, non esistono regole fisse e ogni piattaforma potrebbe adottare politiche differenti.

    Nota: in Visual SEO Studio un URL che punti via canonical link a un altro è evidenziato con colore verde, e il dettaglio visibile nella finestra Proprietà.

    Visual SEO Studio è in grado di esplorare senza impostazioni aggiuntive siti ajax che seguano le specifiche. Consiglio di testare anche in seguito alle modifiche fatte se gli URL trovati siano quanti effettivamente ci si aspetta; un canonical errato può compromettere l'indicizzabilità del sito.

    Spero d'esserti stato utile


  • User

    Ciao Federico, grazie mille sei stato utilissimo. Io sviluppo con Laravel e inserendo un post all'interno del loro forum ho scoperto che si trattava di hashbang/shebang. Non mi risulta che di default laravel generi questo tipo di url (ma devo/voglio approfondire a questo punto).

    In ogni caso le domande a questo punto sono:

    • ok posso fare in modo di mettere il canonical su tutte le pagine ma non mi sembra una soluzione pulitissima. se non lo faccio per google però quello dovrebbe essere contenuto duplicato? oppure "capisce da solo" che si tratta di link di un certo tipo?

    • Ho fatto le modifiche impostando alcune pagine con url canonical e difatti visual seo studio me le da in verde. Ma mi chiedo se fosse comunque meglio risolvere questo problema a livello di routing della piattaforma.

    p.s. uso materialize e jquery come javascritp. Nei relativi forum/chat mi hanno detto di non conoscere bug per cui questi possano generare hashbang


  • Moderatore

    Ciao ocrama,

    Purtroppo non conosco Laravel, no so aiutarti.
    Mettere dei canonical errati è peggio che non metterli. Cercherei di approfondire cosa offre la piattaforma senza forzarla, se possibile.


  • User Attivo

    io torno a ridirti di guardare nel GWT....


  • User

    Ciao Slad_Five, puoi essere più specifico? posso usare delle espressioni regolari? mettermi a indicare al crawler link per link è troppo oneroso


  • User Attivo

    GWT -->parametri url e lo metti come NON rappresentativo per il crawler e per sicurezza metti il canonical e se proprio hai qualche cruccio ne disabiliti la scansione nel htaccess.


  • User

    Ok, questo è sicuramente a livello operativo la cosa più veloce da fare. Lo farò dopo aver indagato meglio se la piattaforma non ha intrinseco qualche meccanismo interno di generazione di questi url.
    Grazie mille