- Home
- Categorie
- La Community Connect.gt
- Tutto sulla Community
- Google: description duplicata per www.sito.it e www.sito.it/index.html
-
Scusate se torno sull'argomento, ma vorrei venirne a capo. In questi giorni ho cercato di approfondire il motivo per il quale Google consideri 'doppioni' www.ipoteticosito.com e www.ipoteticosito.com/default.html (o index.html).
Ho analizzato diversi siti, sia realizzati da me che presi a caso.
Tra i miei (una quarantina), negli Strumenti per webmaster di GG, non c'è nessun problema di duplicazione tranne, appunto, che per uno (quello oggetto di questo thread).
Hanno tutti l'identica struttura con link interni relativi (la differenza con gli assoluti non esiste, stando a questa dotta disquisizione http://www.giorgiotave.it/forum/posizionamento-nei-motori-di-ricerca/126-i-link-meglio-assoluti-o-relativi.html), eppure solo per quell'UNICO sito si!
Il sito in questione è, come gli altri,- nelle primissime posizioni
- ha buoni BL
- ha un PR 4 sia per www.ipoteticosito.com che per www.ipoteticosito.com/default.html
- Google gli ha assegnato 8 Site Link stabili nel tempo.
Non posso fare il redirect 301, come gentilmente consigliatomi da Giorgio, ma anche applicando ```
<meta http-equiv="refresh" content="0;URL=http://www.ipoteticosito.com">@deborahdc said: > Nel codice della pagina dove volevo fare il redirect ho inserito **SOLO** questa stringa <meta http-equiv="refresh" content="0;URL=http://NOMENUOVAPAGINA"> niente altro: non ho inserito title o html solo questa. Sarei tentato di cambiare solo i link interni alla default.html (o index.html), da relativi ad assoluti, inserendo http://www.ipoteticosito.com, ma non mi spaventa tanto doverlo fare su oltre 800, quanto che il risultato alla fine non cambi. Grazie e scusate per la lungaggine.
-
se la stessa pagina viene presentata sia all'indirizzo www.miosito.it che www.miosito.it/default.html ed entrambe le versioni ricevono link è normale che lo spider le visiti, le memorizzi e vengano riconosciute come pagine diverse dal motore di ricerca.
dal punto di vista del motore si tratta infatti di due indirizzi ben diversi, quindi due pagine diverse. al più potrebbe scattare il filtro per i contenuti duplicati ma le pagine sono comunque considerate diverse.
il comportamento è normale quindi, probabilmente gli altri siti che hai considerato non ricevono nessun link alla pagina default.htmlquando il sito è stato creato sarebbe stato infatti più corretto linkare e far linkare la sola versione www.miosito.it e non utilizzare mai www.miosito.it/default.html
in questo modo l'esistenza della seconda versione non sarebbe mai stata nota al motore e il problema non si sarebbe presentato.ciò che puoi fare al momento è prima di tutto sistemare i tuoi link interni in modo da puntare al solo dominio www.miosito.it senza richiamare default.html e quindi applicare il redirect.
se puoi avere la certezza che nessun sito esterno ha link a www.miosito.it/default.html potresti anche pensare di escludere l'URL dall'indicizzazione (tramite robots.txt) in modo da eliminare la pagina doppia. va però valutata bene la situazione dei link da siti esterni, c'è infatti il rischio di perdere gli eventuali link che diventerebbero non più validi
-
Grazie per aver risposto apusoft.
-
La pagina default.html, non riceve alcun link esterno, solo interni
-
Come dicevo su, il sito ha una struttura...
...con link interni relativi (la differenza con gli assoluti non esiste, stando a questa dotta disquisizione [URL="http://www.giorgiotave.it/forum/posi...-relativi.html)"]http://www.giorgiotave.it/forum/posi...-relativi.html)
-
D'accordissimo nel provare a sistemare i link interni sostituendo http://www.ipoteticosito.com a default.html, benchè davvero non riesca a comprendere come Google possa avere da ridire su due pagine che in realtà sono una sola pagina!
-
Non avendo link esterni a default.html, potrei anche immettere quest'url nel robots.txt ma, come dicevo, spero basti modificare i link interni.
Attenderò di vedere cosa succede dopo tale modifica ma, ribadisco, Google spesso è incomprensibile.
A nessun altro è capitata la stessa cosa?
Grazie ancora.
-
-
se ci pensi il comportamento di Google non è poi così strano. vedendo due pagine con diverso indirizzo, è inevitabile per il motore considerarle appunto come due pagine, due pagine distinte.
il fatto che il contenuto sia identico farà poi scattare il filtro dei contenuti duplicati, ma le pagine sono comunque memorizzate entrambe.
-
Allora sono duro di comprendonio io, per cui abbiate pietà:x
-Si deve o no creare una pagina denominata default o index?
(un'altra pagina semplicemente denominata www.ipoteticosito.com, non l'ho mai creta...ovviamente)
-Si devono o no indirizzare i link interni a quella pagina (relativi o assoluti, ripeto, non fa differenza) e viceversa?
Oppure mi sfugge quelcosa?
Grazie ancora.
-
il nome della pagina che viene caricata digitando il solo dominio www.miosito.it dipende dalle impostazioni del server.
nel tuo caso, se entrando da www.miosito.it vedi il contenuto di default.html significa che è questo il file che viene utilizzato.quindi tu crei e carichi la pagina default.html ma poi vi accederai usando l'indirizzo nella forma www.miosito.it (e lo stesso farai nei link interni).
-
Il server è Aruba. Se digito www.miosito.com sulla finestra degli indirizzi, vien fuori http://www.miosito.com e non http://www.miosito.com/default.html. Se, invece, torno alla Home da una pagina interna del sito, si apre http://www.miosito.com/default.html, proprio perchè i link delle pagine interne alla Home, sono relativi e non assoluti. Ma siamo al punto di partenza, in quanto milioni di siti hanno link relativi alla HP...e io vorrei uscirmene da questa impasse.
Comunque grazie di cuore per la tua squisita disponibilità.
-
non è questione di url relativi o assoluti, si tratta del fatto che da quanto capisco nei tuoi link alla home page richiami il file default.html, mentre dovresti puntare solamente al dominio (per la home page).
devi avere quindi codice html del tipo <a href="/">home page</a> (o se preferisci <a href="http://www.miosito.it/">home page</a>).
per i link ad altre pagine non ci sono problemi, ma quelli verso la home page li devi fare così.se usi link del tipo <a href="default.html">home page</a> i motori di ricerca si trovano a "scoprire" il file default.html a cui invece non dovrebbero avere accesso (visto che dovrebbero trovare il contenuto di quel file solamente nella root del dominio).
p.s. non so se aruba accetti default.html come pagina associata alla home page, in ogni caso ti consiglierei di rinominare quel file in index.html che è il nome standard. il discorso fatto qui sopra su come fare i link rimangono validi comunque
-
Bene, dunque è come già era stato detto:
- D'accordissimo nel provare a sistemare i link interni sostituendo http://www.ipoteticosito.com a default.html
Non sapevo che solo la default o l'index avessero bisogno di percorsi assoluti.
In ogni caso, l'attuale stringa è<li><a href="/default.html" title="HOME"><span>HOME</span></a></li>
che modificherò in
<li><a href=http://www.miosito.it/ title="HOME"><span>HOME</span></a></li>
Quanto ad Aruba chiederò e ti farò sapere, ma credo non ci siano problemi.
Grazie infinite.
-
bene, ora ci siamo.
solo una precisazione: non è una questione di url assoluti o relativi, ma del url che viene proposta allo spider.
come dicevamo, www.miosito.it e www.miosito.it/default.html sono necessariamente due pagine diverse, poiché i due url sono diversi.andrebbe infatti benissimo anche il link relativo
[HTML]<li><a href="/" title="HOME"><span>HOME</span></a></li>[/HTML]
che lo spider leggerebbe allo stesso modo, l'importante è che non ci sia il nome del file
-
Si, tutto chiaro apusoft.
p.s. non so se aruba accetti default.html come pagina associata alla home page
Nessun problema per Aruba. Riporto qui l'elenco delle pagine da associare alla home page, nell'Hosting Windows (magari può servire a qualcun altro):Come nominare l?Homepage su Hosting Windows
Di seguito i nomi con cui dovrà essere chiamata l?Homepage, in ordine di priorità:
**Index.htm **
**Index.html **
**Index.asp **
**Index.php **
**Index.shtm **
**Index.wml **
**Index.aspx **
**Default.asp **
**Default.php **
**Default.html **
**Default.htm **
**Default.shtm **
**Default.wml **
**Default.aspx **
Se è presente index.htm non sarà visibile in automatico index.html (è successiva nella lista) e così via. Una volta scelto il nome della home page, è necessario controllare che non siano quindi presenti files con uno degli altri nomi.Sempre nell'ottica di chiarire definitivamente ogni dubbio mio e di altri, questa stringa
<li><a href=http://www.miosito.it/ title="HOME"><span>HOME</span></a></li>
equivale a questa? (Senza lo slash finale)
<li><a href=http://www.miosito.it title="HOME"><span>HOME</span></a></li>Ultima cosa. Utilizzerò il tuo suggerimento
<li><a href="/" title="HOME"><span>HOME</span></a></li>
per modificare i link all'HP, ma vorrei chiederti la differenza con
<li><a href="./" title="HOME"><span>HOME</span></a></li> ``` (il punto prima dello slash). Lo chiedo in quanto, 'sfruculiando' nell'html di dotti siti quali http://validator.w3.org, ho notato che i link all'HP contengono il punto:
<ul class="navbar" id="menu"><li><a href="./" accesskey="1" title=...ecc...
Ti ringrazio per la pazienza e la disponibilità.