• Moderatore

    Quando dici "ho degli url che terminano con esempio ?id=63 ... " e " joomla continua a tenere quelli dinamici" intendi che li hai trovati indicizzati oppure che si presentano durante la navigazione del sito seguendo i vari link creati da Joomla?

    Mettendo solo il *disallow *non risolvi il problema e in ogni caso sarebbe una pezza per coprire un errore e non la sua risoluzione.

    Se vuoi bloccare tutti i link del tipo tuosito.com/qualcosa?id... puoi usare una regex per intercettare questo url e stampare nell'head della pagina un'istruzione meta robots noindex ed eventualmente una canonical. Ad essere sincero però non mi convince e per sicurezza chiederei nella sezione seo e tecnologie: giorgiotave.it/forum/seo-e-tecnologie/ .

    Se vuoi provarci devi intercettare anche il codice che ti stampa il meta name robots, perché non puoi stampare due istruzioni. Non so poi se tu abbia estensioni SEO/SEF.
    Il file responsabile dell'head è head.php e si trova qui: libraries/joomla/document/html/renderer/ .

    F.


  • User Attivo

    Ciao Francesco, la soluzione che mi suggerisci è tecnicamente un po' complicata, quegli url ?id= ho scoperto che li crea perchè avevo associato queste pagine a voci di menu, poi ho rimosso quest'associazione ed è rimasta questa roba li, per cui adesso sto cancellando tutto e rifacendo le pagine per non creare mai quest'associazione. Rimangono però gli url dimanici di joomla, quelli con il "content" all'interno che google vede benissimo...quelli non so come "farli fuori"...


  • Moderatore

    Puoi riportare qualche esempio di url da non indicizzare?
    Gli esempi devono essere significativi dei tipi di url da non indicizzare.
    Senza link attivo (puoi mettere un dominio iniziale fittizio come miosito.com/)
    F.


  • User Attivo

    tra i vari tipi di url da dover cancellare, piu che non indicizzare ci sono questi:

    www(punto)miodominio(punto)it/ chi-siamo.html?id=47

    generato probabilmente perchè pagina prima associata a un menù e poi rimossa.....perchè deve essere una pagina non legata a voci di menù
    come faccio a rimuovere questa rumenta? ovviamente quella è una versione duplicata della pagina con url statico


  • User Attivo

    tra l'altro ho anche provato a cancellare una di queste pagine che produce quegli url li e.... continua a vedersi la pagina su tutti i suoi URL!!! (ho pulito la cache e il cestino)


  • Moderatore

    Ciao RomeoBlu, ciao FDA
    le soluzioni che ti suggerisce FDA sono tecnicamente avanzate e se hai modo dovresti intervenire così.

    Puoi anche utilizzare il "Disallow: /*?", il problema è che il Disallow non ti da nessuna garanzia, è sufficente il pulsante +1 sulla pagina e ne perdi i benefici.

    Il problema dei duplicati sembrerebbe essere approcciato in maniera diversa ora da Google, che è sempre stato in grado di riconoscerle e oggi sollecita i webmaster a lasciargli indicizzare comunque tutte le pagine, il caso delle query (le URL con i punti interrogativi), potrebbe essere proprio uno di quei casi in cui è perfettamente in grado di fare la cernita da solo.

    Maurizio ZioPal


  • User Attivo

    se fosse in grado di fare una cernita m'aspetterei poi che metta solo le url buone in serp, cosa che adesso non fa....per cui una cosa è quello che google dichiara e una cosa è quello che poi riesce effettivamente a implementare direi 🙂

    riguardo il suggerimento tecnico, l'ho capito concettualmente, ma non ho capito come fare.

    in pratica posso inserire un tag noindex nofollow in una qualsiasi pagina raggiungibile da browser del mio sito?
    se si come posso farlo nel dettaglio?

    grazie


  • Moderatore

    Ciao RomeoBlu,
    che google faccia quello che gli pare è arcinoto, ma è sicuro che difficilmente mette in SERP duplicati dallo stesso sito, quindi per lui le pagine rilevanti del tuo sito sono quelle. Dovresti gestirle con il Rel canonical.
    *
    Maurizio ZioPal*


  • User Attivo

    c'è un plugin per inserirlo o si può fare da sistema?


  • Moderatore

    Ciao RomeoBlu.
    Quoto Dexter al 101%! 🙂

    Puoi trovare qualche buona dritta in questa Guida SEO Joomla, incluse estensioni per il rel=canonical:
    giorgiotave.it/guide-webmaster/guida-seo-joomla/


  • Moderatore

    Gli interventi di RomeoBlu e Dexter mi hanno stuzzicato. 😄
    In tema di contenuti duplicati, mi sovviene una domanda che giro a tutti gli utilizzatori di Joomla e a chi si occupa di SEO:
    volendo costruire un plugin per Joomla! 2.5 che inserisca il rel=canonical dove opportuno, quali sono le condizioni e le opzioni da considerare per il suo inserimento?

    Sappiamo che la pagina canonica di un url:
    sito. com/categoria/articolo?parametro=valore
    è:
    sito. com/categoria/articolo

    Se è attiva la riscrittura URL SEF non dovrebbero esserci url di questo tipo (esempio di un articolo):
    sito. com/index . php?option=com_content&view=category&layout=blog&id=7&Itemid=109

    Anche con la riscrittura, tuttavia, sono potenzialmente infinite le pagine con contenuto duplicato, senza considerare che ci sono componenti che potrebbero crearne altre. Ad esempio la versione stampabile di una pagina ha un url come questo:
    sito. com/categoria/alias?tmpl=component&print=1&layout=default&page=

    Ciò detto, ho pensato di procedere così:

    • per ogni url che include ?parametro=valore e non include com_content -> inserisco nell'head il rel=canonical con href alla parte dell'url prima del punto interrogativo (es. a sito. com/categoria/articolo);
    • per ogni url che include com_content -> inserisco nell'head un meta robots noindex, follow.

    Il mio ragionamento è corretto?
    Esistono eccezioni che non ho considerato?
    Inserireste la possibilità di escludere alcune pagine e se sì quali?
    Senza dovere realizzare una complicatissima estensione SEO/SEF (ce ne sono di ottime e non è il mio intento), inserireste opzioni per trattare a dovere la paginazione (che in Joomla si presenta nella visualizzazione blog con *?start=numeroarticolo *in coda all'url)?

    Grazie a tutti quanti parteciperanno con suggerimenti e osservazioni. 🙂

    Francesco


  • Moderatore

    Personalmente, per due anni circa, ho lavorato su Joomla ed effettivamente sul CMS ho notato che la gestione degli URL SEF poteva essere migliorata. Ora è un po' che non lo tratto, ma da quello che vedo scritto qui è rimasto un problema. Per carità lungi da me fare critiche, anzi si deve solo ringraziare la community che fa un grosso lavoro, ma la considerazione che fa FDA è corretta. Non capisco perché non si migliori un aspetto così essenziale come le URL duplicate inserendo URL canonical da codice, invece di dover utilizzare componenti esterni. Io non sono ancora in grado di poter modificare il core in quel modo, ma concettualmente credo che la soluzione di FDA sia applicabile.


  • Moderatore

    Ciao Giorgio Sanna.
    Per la verità anche la soluzione da codice nasconde insidie, soprattutto per gli aggiornamenti e la manutenibilità.
    Fortunatamente l'attuale Joomla 3.2 (e poi la 3.5 che verrà di lungo periodo) gestiscono i rel =canonical già nel core.
    Continua a seguirci, spero che avremo modo di approfondire l'argomento. 🙂


  • Moderatore

    Proverò le nuove versioni in locale magari così mi renderò conto delle novità. Grazie.


  • User Attivo

    Comunque non credo che avere i rel canonical sia la stessa cosa di avere una sola versione, pulita, di ogni pagina del sito con un solo indirizzo. Con wordpress tutto questo non esiste, il tutto è gestito bene e in maniera più che semeplice. Credo che sia abbastanza ridicolo che si sia arrivati quasi al 2014 senza aver risolto questo problema su una piattaforma così diffusa....


  • Moderatore

    Ciao RomeoBlu.
    Sicuramente Joomla ha creato in passato qualche malumore per i tanti URL creati e la difficoltà nel gestirli, ma la 2.5 si comporta abbastanza bene.
    Considera che i "tanti URL" di cui parliamo sono di tipi differenti e alcuni sono utili mentre altri sarebbero inevitabili su qualunque altro sito.
    In pratica non sempre abbiamo più URL perché la versione è "sporca", mentre qualche volta la versione è "sporcata" con URL sbagliate per cattiva configurazione /manutenzione / gestione. Però si può intervenire e migliorare le cose.:)

    Esempio: url utile.
    Un componente che genera una vista/un layout particolare per quella che in alternativa è la classica visualizzazione blog (ad esempio visualizza tutti gli articoli in una griglia "infinita"), ha un URL diverso e questo è normale. Ciò che conta è inserire il rel = canonical sia in questa pagina che in quella che visualizza la classica categoria come blog.

    Esempio: url inevitabile 1.
    La gestione dei contenuti duplicati non è semplice. Pensa alle landing page: spesso presentano le stesse informazioni di altre pagine ma in maniera differente, in modo da massimizzare le conversioni con riferimento a una singola campagna/target. Queste pagine in molti casi non sono raggiungibili dal sito tramite link pubblico e non vengono indicizzate.

    Esempio: url inevitabile 2.
    La versione stampabile dell'articolo è un esempio di contenuto duplicato da non indicizzare (Joomla 2.5 inserisce il noindex).

    Esempio: url inevitabile 3.
    Tutti gli URL friendly possono divenire query e potenzialmente contenuti duplicati, basta aggiungere alla fine ?parametro=valore. Queste query sono in numero illimitato. Il vero limite di Joomla versioni 2.5.x e precedenti è non presentare già nel core la gestione del rel=canonical, problema che pare non si presenterà nella 3.5 (staremo a vedere).

    Ricordo infine che alcuni blogger risolvono taluni problemi di WordPress con plugin come Yoast.
    Come si diceva qui - giorgiotave.it/forum/joomla/214429-perche-passare-da-wordpress-joomla.html - la grande diffusione di WordPress tra i blogger ha indotto molti sviluppatori a produrre plugin che semplificassero la vita a persone che di mestiere non fanno i programmatori/webmaster.
    Ma per fortuna anche Joomla ha tante estensioni e forse alcune potenzialità diverse.


  • Moderatore

    Ciao FDA,
    avevo perso metà discussione e avevo letto male un punto chiave della precedente non male. 🙂

    @FDA said:

    Ciò detto, ho pensato di procedere così:

    • per ogni url che include ?parametro=valore e non include com_content -> inserisco nell'head il rel=canonical con href alla parte dell'url prima del punto interrogativo (es. a sito. com/categoria/articolo);
    • per ogni url che include com_content -> inserisco nell'head un meta robots noindex, follow.

    Credo sia giusto, per un attimo avevo pensato che volessi aggiungere il NoIndex alle pagine dove avevi inserito il canonical, cosa che la settimana scorsa al convegno GT Enrico Altavilla ha marcato come pericolosa. Se ti posso suggerire come confronto/ispirazione l'unico componente che secondo me ha risolto il problema Metageneretor, purtroppo per stessa ammissione dello sviluppatore funziona solo con il core di joomla.

    Una piccola risposta la devo anche a RomeoBlu
    @RomeoBlu said:

    Comunque non credo che avere i rel canonical sia la stessa cosa di avere una sola versione, pulita, di ogni pagina del sito con un solo indirizzo. Con wordpress tutto questo non esiste, il tutto è gestito bene e in maniera più che semplice. Credo che sia abbastanza ridicolo che si sia arrivati quasi al 2014 senza aver risolto questo problema su una piattaforma così diffusa....

    Magari io sono un po' di parte, però trovo un po' ridicolo che ci sia sempre qualcuno pronto a dire che la SEO con WP è meglio.

    Wordpress risolve il problema dei duplicati con il Rel Canonical e con componenti SEO tipo Yoast. Se ti fai un giro su questo forum nella sezione penalizzazioni scopri che una delle penalizzazioni più diffusa in assoluto è quella data dai tag di Wordpress che per anni non sono stati in grado di risolvere. Il problema è che molti improvvisano, e su Wordpress questo si sembra più facile, salvo trovarsi nei casini quando si fa sul serio.

    Maurizio ZioPal


  • Moderatore

    Ciao Dexter.
    Purtroppo ero assente al Convegno GT, ma ci sarà occasione di rifarmi. :smile5:

    Dovrei essere a posto sulla questione di noindex e canonical, ma adesso che mi ci hai fatto pensare l'annoto e domani controllo tutto per sicurezza.
    Tra l'altro l'indicazione è doppiamente utile, perché forse l'utente che sceglie un'opzione diversa dovrebbe quanto meno ricevere un avviso da backend.

    MetaGenerator lo reinstallo, perché non ricordo come lavora (e per fortuna è pure GPL). :wink3:

    Francesco


  • Moderatore

    Dexter, una cosa non mi è chiara:
    Ipotizziamo che sia index la url: tuosito.com/categoria/articolo

    Una qualsiasi url come tuosito.com/categoria/articolo?idqualcosa=quellochevuoi è contenuto duplicato. Ci faccio stampare di default noindex senza rel canonical all'altra?


  • Moderatore

    @FDA said:

    Ipotizziamo che sia index la url: tuosito.com/categoria/articolo

    Una qualsiasi url come tuosito.com/categoria/articolo?idqualcosa=quellochevuoi è contenuto duplicato. Ci faccio stampare di default noindex senza rel canonical all'altra?

    Si, anche se sempre nello stesso intervento Enrico Altavilla (che il signore ce lo conservi), diceva che oggi google non ha nessuna difficoltà a comprendere la natura del duplicato e quindi situazioni come quella che hai ipotizzato non dovrebbero essere più tanto penalizzanti, anzi sembrerebbe che google chieda di lasciargli indicizzare più pagine possibili, quindi meglio il canonical al NoIndex.

    Maurizio ZioPal