- Home
- Categorie
- Coding e Sistemistica
- Joomla!
- joomla url duplicati e contenuti duplicati cosa consigliate
-
Ciao p_il_musicante,
ti consiglio di leggere queste discussioni (ma sul forum ne trovi altre dello stesso tenore):
http://www.giorgiotave.it/forum/joomla/216299-risolto-problema-paginazione-blog-joomla.html
http://www.giorgiotave.it/forum/title-description-e-struttura/216762-pagination-rel-next-e-rel-prev-e-canonical-tag-ce-conflitto.htmlPer quanto riguarda la paginazione, verifica che Joomla usi il rel prev e next correttamente e se puoi indirizza il canonical verso la "prima pagina", cioè quella senza la query string ?limit... .
Al momento non ricordo se le ultime release di Joomla facciano il tutto senza bisogno di altre estensioni, né quali estensioni si comportino bene. Prendo nota e ti faccio sapere (grazie del suggerimento, controllo i miei siti se dopo l'aggiornamento sono a posto senza modifiche "a mano").
-
Grazie per l'ottimo suggerimento
secondo me la cosa migliore e pendere il canonical del link della pagina articolo senza i parametri
tipo qualccsoa del genere
$pag_1 = explode ("?start",$currenturl); $pag_2 = explode ("?limit",$currenturl);
che ne pensi si può realizzare?
poichè a me è solo per la pagina articolo si vrifica questo fenomeno
-
Verifica dove inserisci questo codice perché deve sostituire l'attuale rel canonical (ce ne deve essere soltanto uno) e potresti dovere fare una regex oppure un'interrogazione a db per stabilire quando applicare quest'istruzione.
Nota che ottieni un vettore del quale devi prendere soltanto il primo elemento, cioè $pag_1[0] oppure $pag_2[0].
Comunque esistono altre funzioni php per tagliare la query string, cerca su php.net. Attento alle funzioni che individuano le regex, rallentano di molto il sistema.
-
ti ringrazio
tu hai qualche suggerimento su come implementare questa funzionalità?
io lo metterei nel file default.php del com_content del template
-
che ne dici del codice di seguito
$doc_data = $document->getHeadData(); $url = JURI::root(); $sch = parse_url($url, PHP_URL_SCHEME); $server = parse_url($url, PHP_URL_HOST); $canonical = $this->escape($_SERVER['REQUEST_URI']); $str_start = strpos($canonical, '?start'); if($str_start!==FALSE) { $canonical = substr($canonical,0,$str_start); } $str_limit = strpos($canonical, '?limit'); if($str_limit!==FALSE) { $canonical = substr($canonical,0,$str_limit); } $newtag = '<link rel="canonical" href="'.$sch.'://'.$server.$canonical.'"/>' ; $replaced = false; foreach ($doc_data['custom'] as $key=>$c) { if (strpos($c, 'rel="canonical"')!==FALSE) { $doc_data['custom'][$key] = $newtag; $replaced = true; } } if (!$replaced) { $doc_data['custom'][] = $newtag; } $document->setHeadData($doc_data);
-
Ciao,
lo dovrei provare. Codice a parte, però, assicurati che non vada in conflitto con l'html generato da Joomla e da altre estensioni come il sef plugin.io lo metterei nel file default.php del com_content del template
La cosa migliore è fare un plugin che ti faccia stampare l'html soltanto nelle pagine dove serve. Per la paginazione, ad esempio, abbiamo codice:- nel singolo articolo se o stesso si dispone su più pagine
- nelle categorie per la paginazione degli articoli su più pagine (ne vengono mostrati un numero fisso per pagina)
- nei vari componenti che gestiscono portfolio, contatti, ... se gli elementi si dispongono su più pagine
Nulla vieta di inserire il codice php in un "file generico" a patto che il codice stampi l'html solo quando serve e, come già detto, che non vi siano altre estensioni e il core di Joomla a stampare codice dello stesso tipo (es. in modo da non avere due canonical).
-
Grazie per il sempre pronto intervento
un plugin sarebbe l'ideale così sarebbe disponibile per tutti
io non ho molta esperienza utile a costruire un plug in
se sei daccordo potremmo provarci
o altrimeti testiamo il codice che ho postato sopra e lo miglioriamo
ti ringrazio
-
Di nulla.
-
ciao
hai testo il codice?
io l'ho provato ed inserisce il canonical giusto
ma non toglie quello già creato
una soluzione potrebbe essere la seguente
// toglie il tag canonical $doc = JFactory::getDocument(); foreach ( $doc->_links as $k => $array ) { if ( $array['relation'] == 'canonical' ) { unset($doc->_links[$k]); } } //inserisce il nuovo tag $document = JFactory::getDocument(); $doc_data = $document->getHeadData(); $url = JURI::root(); $sch = parse_url($url, PHP_URL_SCHEME); $server = parse_url($url, PHP_URL_HOST); $uri = JFactory::getURI(); $absolute_url = $uri->toString(); $canonical = $this->escape($_SERVER['REQUEST_URI']); //$canonical = $absolute_url; $str_start = strpos($canonical, '?start'); if($str_start!==FALSE) { $canonical = substr($canonical,0,$str_start); } $str_limit = strpos($canonical, '?limit'); if($str_limit!==FALSE) { $canonical = substr($canonical,0,$str_limit); } $newtag = '<link rel="canonical" href="'.$sch.'://'.$server.$canonical.'"/>' ; //$newtag = '<link rel="canonical" href="'.$canonical.'"/>' ; $replaced = false; foreach ($doc_data['custom'] as $key=>$c) { if (strpos($c, 'rel="canonical"')!==FALSE) { $doc_data['custom'][$key] = $newtag; $replaced = true; } } if (!$replaced) { $doc_data['custom'][] = $newtag; } $document->setHeadData($doc_data);
tu hai qualche altro suggerimento?
-
Ciao, non ancora, provo direttamente questo nuovo.
-
Ciao
sei iruscito a testarlo?
poichè io ho un dubbio sul fatto che effeettivamnte lo crei ogni volta il canonical
per il momentto ho inserio come workaround queste righe nel file robots
block the pagination
Disallow: /?limit=
Disallow: /?start=le vorrei togliere ma devo prima trovare una valida alternativa al problema dei meta tag duplicati
-
Ho testato un altro metodo forse più efficace
bisogna modificare il file /plugins/system/sef/sef.php
if ($uri !== $link) { **$pag_1 = explode ("?start",$uri); $pag_2 = explode ("?limit",$uri); if($uri !== $pag_1[0]) { $link = $pag_1[0]; } if($uri !== $pag_2[0]) { $link = $pag_2[0]; }** $doc->addHeadLink(htmlspecialchars($link), 'canonical'); }
inserie le righe di codice in grassetto
che ne pensi?
-
Ciao
hai testato?
chiedo anche agli altri utenti del forum
-
Ciao p_il_musicante,
intanto perdona i tempi biblici.
Rileggendo mi sono accorto di avere indicato la strada sbagliata in merito al rel=canonical con rel=next e rel=prev.La risposta si trova in questa pagina: support.google.com/webmasters/answer/1663744?hl=it
Si legge:[INDENT=2]rel="next" e rel="prev" sono concetti ortogonali a rel="canonical". Puoi inserire entrambe le dichiarazioni. Ad esempio, http:// www . example.com/article?story=abc&page=2&sessionid=123 può contenere:
<link rel="canonical" href="http: //www.example .com/article?story=abc&page=2"/><link rel="prev" href="http:// www . example.com/article?story=abc&page=1&sessionid=123" />
<link rel="next" href="http:// www . example.com/article?story=abc&page=3&sessionid=123" />[/INDENT]
Ricapitolando, in caso di paginazione:
-
vanno usati rel=next e rel=prev
-
il rel=canonical può essere usato in due modi:
-
può puntare a una pagina che include tutto (es. articolo diviso in più pagine con versione completa: in questo caso Google suggerisce di scegliere come canonica la versione integrale)
-
può puntare alla pagina stessa
Guida per implementare next e prev: http://www.giorgiotave.it/forum/joomla/216299-risolto-problema-paginazione-blog-joomla.html#post1108193
Per il *canonical *il problema con le ultime release di Joomla! 3 non si pone perché è già previsto questo comportamento.
Testa e facci sapere com'è andata.
-
-
Salve
ritorno con un nuovo problema
ho notato su web master tool che google ha trovato dei contenuti duplicati
/it/ home. html ? catid=0 & id=4
che mi restiruisce un'articolo del mio sito
potreste aiutarmi
come potrei risolvere?
-
Ciao, puoi indicare i due urls?
-
@FDA said:
Ciao, puoi indicare i due urls?
la prima è (quella corretta)
w w w .miosito. com / it / categoria / sottocategoria / alias-articolo
la seconda
w w w .miosito. com / it / home. html ? catid=0 & id=4
non ho capito come google abbia trovato la seconda
-
Un url friendly può essere vista come la trasformazione di un url con parametri e quest'ultima è inevitabile. Potenzialmente di url con parametri in grado di generare contenuti dupicati ce ne sono a bizzeffe:
miosito.com/it/?option=com_content&view=article&id=4:alias&catid=0&Itemid=50 // articolo:alias, categoria, menu miosito.com/it/?option=com_content&view=article&id=4:alias&catid=0 // articolo:alias, categoria miosito.com/it/?option=com_content&view=article&id=4:alias // articolo:alias miosito.com/it/?option=com_content&view=article&id=4 // articolo
Per proteggersi da queste situazioni servono:
- implementazione corretta dei menu
- implementazione del rel canonical
- prevenire link a questi url (per quanto possibile, ovviamente non puoi avere il controllo ma almeno non essere tu a inserirli).
Il tuo è un caso particolare. Non avendo accesso al sito devo fare delle ipotesi:
- homepage con alias home
- url rewriting attivo
- url con suffisso html
Se le mie ipotesi sono giuste queste url conducono allo stesso contenuto:
miosito.com/it/ miosito.com/it/home.html miosito.com/it/?colore=rosaantico miosito.com/it/home.html?colore=verdepetrolio
Domanda: i due url conducono alla homepage? Per condurre a categorie e articoli dovrebbe esserci il riferimento al componente (com_content).
-
le tue ipotesi sono corrette
io ho la seguente struttura
più menù
- menù principale dove ho tutte le voci delle varie categorie configurate in lingua italiano tranne la home che è per tutte le lingue ed ha l'alias home
- ho un menù italiano con la sola voce home in lingua italiano ed alias home
- poi ci sono dei footer menu che sono configurati come alias di voce di menù delle cateogrie del munù pricipale in lingua italiano
la cosa strana è che le due url
la prima è (quella corretta)
w w w .miosito. com / it / categoria / sottocategoria / alias-articolo
la seconda
w w w .miosito. com / it / home. html ? catid=0 & id=4
portano all'articolo
ma la seconda rimane nella home e alla fine della home c'è l'articolo
per il resto ho
-
- url rewriting attivo
- url senza suffisso html
infatti se provo
w w w .miosito. com / it / home. html ho la apginna errore 404invece se provo w w w .miosito. com / it / home mi va alla home
e se provo w w w .miosito. com / it / ?cat=0 mi va alla home
e se provo w w w .miosito. com / it? mi va alla homeforse si deve configurare diversamente qualcosa?
-
dovrei cambiare gli alias delle home?
i menu configurati coem ho esposto sono nella forma corretta?
riepilogomenu princiaple con la voce Home -> lingua -> tutte , alias -> home , altre voci categoria -> lingua IT
menu italiano una sola voce Home -> lingua -> IT , alias -> home
menu nel footer -> alias voce di menu delle voci del menu pricinpale -> lingua -> ITtemplate predefinito per tutte le lingue
moduli menu
menu principiale -> puccliato su tutte le pagine -> lingua -> tutte
menu italiano -> puccliato su tutte le pagine -> lingua -> IT
footer menu -> puccliato su tutte le pagine -> lingua -> tutteè corretto come confgurazione?