• User Attivo

    Google: description duplicata per www.sito.it e www.sito.it/index.html

    Ben ritrovati.
    Ho cercato per molto tempo nei vari thread, ma non ho trovato risposte ('corrigitemi' se sbaglio:giggle:).
    Per uno dei siti che gestisco, negli strumenti per webmaster di GG, oltre alle solite indicazioni di meta descrizioni duplicate (indicazioni errate in quanto ho corretto da mesi gli errori), da qualche giorno compare:
    www.miosito.com
    e
    www.miosito.com/default.html

    In pratica mi da come duplicata la Home Page!
    Sapreste illuminarmi?

    Grazie.


  • Community Manager

    Ciao webmasterTV,

    fai un bel 301 da default al sito 🙂


  • User Attivo

    Ciao Giorgio e grazie per aver risposto.
    (Devo scusarmi se ho usato per l'esempio "miosito", ma non sapevo che esistesse davvero:-( Utilizzerò www.ipoteticosito.com che non esiste...ho controllato)
    Se ho ben capito intendi un redirect 301 da www.ipoteticosito.com/default.html a www.ipoteticosito.com
    Purtroppo non mi è possibile in quanto il sito è su hosting windows con Aruba, dunque dovrei utilizzare:
    <meta http-equiv="refresh" content="0;URL=http://www.ipoteticosito.com"> nella pagina www.ipoteticosito.com/default.html
    A parte la ben nota (credo), inaffidabilità di tale comando, quello che non riesco a spiegarmi è il motivo per cui Google faccia questa distinzione e perchè se ne ricorda adesso, dopo 5 anni di situazione invariat!
    Mah!

    Grazie ancora.


  • User Attivo

    Scusate se torno sull'argomento, ma vorrei venirne a capo. In questi giorni ho cercato di approfondire il motivo per il quale Google consideri 'doppioni' www.ipoteticosito.com e www.ipoteticosito.com/default.html (o index.html).
    Ho analizzato diversi siti, sia realizzati da me che presi a caso.
    Tra i miei (una quarantina), negli Strumenti per webmaster di GG, non c'è nessun problema di duplicazione tranne, appunto, che per uno (quello oggetto di questo thread).
    Hanno tutti l'identica struttura con link interni relativi (la differenza con gli assoluti non esiste, stando a questa dotta disquisizione http://www.giorgiotave.it/forum/posizionamento-nei-motori-di-ricerca/126-i-link-meglio-assoluti-o-relativi.html), eppure solo per quell'UNICO sito si!
    Il sito in questione è, come gli altri,

    1. nelle primissime posizioni
    2. ha buoni BL
    3. ha un PR 4 sia per www.ipoteticosito.com che per www.ipoteticosito.com/default.html
    4. Google gli ha assegnato 8 Site Link stabili nel tempo.

    Non posso fare il redirect 301, come gentilmente consigliatomi da Giorgio, ma anche applicando ```
    <meta http-equiv="refresh" content="0;URL=http://www.ipoteticosito.com">

    @deborahdc said:
    > Nel codice della pagina dove volevo fare il redirect ho inserito **SOLO** questa stringa
     
    <meta http-equiv="refresh" content="0;URL=http://NOMENUOVAPAGINA">
     
    niente altro: non ho inserito title o html
    solo questa.
     
    Sarei tentato di cambiare solo i link interni alla default.html (o index.html), da relativi ad assoluti, inserendo http://www.ipoteticosito.com, ma non mi spaventa tanto doverlo fare su oltre 800, quanto che il risultato alla fine non cambi.
     
    Grazie e scusate per la lungaggine.

  • User Attivo

    se la stessa pagina viene presentata sia all'indirizzo www.miosito.it che www.miosito.it/default.html ed entrambe le versioni ricevono link è normale che lo spider le visiti, le memorizzi e vengano riconosciute come pagine diverse dal motore di ricerca.
    dal punto di vista del motore si tratta infatti di due indirizzi ben diversi, quindi due pagine diverse. al più potrebbe scattare il filtro per i contenuti duplicati ma le pagine sono comunque considerate diverse.
    il comportamento è normale quindi, probabilmente gli altri siti che hai considerato non ricevono nessun link alla pagina default.html

    quando il sito è stato creato sarebbe stato infatti più corretto linkare e far linkare la sola versione www.miosito.it e non utilizzare mai www.miosito.it/default.html
    in questo modo l'esistenza della seconda versione non sarebbe mai stata nota al motore e il problema non si sarebbe presentato.

    ciò che puoi fare al momento è prima di tutto sistemare i tuoi link interni in modo da puntare al solo dominio www.miosito.it senza richiamare default.html e quindi applicare il redirect.

    se puoi avere la certezza che nessun sito esterno ha link a www.miosito.it/default.html potresti anche pensare di escludere l'URL dall'indicizzazione (tramite robots.txt) in modo da eliminare la pagina doppia. va però valutata bene la situazione dei link da siti esterni, c'è infatti il rischio di perdere gli eventuali link che diventerebbero non più validi


  • User Attivo

    Grazie per aver risposto apusoft.

    1. La pagina default.html, non riceve alcun link esterno, solo interni

    2. Come dicevo su, il sito ha una struttura...

    ...con link interni relativi (la differenza con gli assoluti non esiste, stando a questa dotta disquisizione [URL="http://www.giorgiotave.it/forum/posi...-relativi.html)"]http://www.giorgiotave.it/forum/posi...-relativi.html)

    1. D'accordissimo nel provare a sistemare i link interni sostituendo http://www.ipoteticosito.com a default.html, benchè davvero non riesca a comprendere come Google possa avere da ridire su due pagine che in realtà sono una sola pagina!

    2. Non avendo link esterni a default.html, potrei anche immettere quest'url nel robots.txt ma, come dicevo, spero basti modificare i link interni.
      Attenderò di vedere cosa succede dopo tale modifica ma, ribadisco, Google spesso è incomprensibile.

    A nessun altro è capitata la stessa cosa?

    Grazie ancora.


  • User Attivo

    se ci pensi il comportamento di Google non è poi così strano. vedendo due pagine con diverso indirizzo, è inevitabile per il motore considerarle appunto come due pagine, due pagine distinte.
    il fatto che il contenuto sia identico farà poi scattare il filtro dei contenuti duplicati, ma le pagine sono comunque memorizzate entrambe.


  • User Attivo

    Allora sono duro di comprendonio io, per cui abbiate pietà:x
    -Si deve o no creare una pagina denominata default o index?
    (un'altra pagina semplicemente denominata www.ipoteticosito.com, non l'ho mai creta...ovviamente)
    -Si devono o no indirizzare i link interni a quella pagina (relativi o assoluti, ripeto, non fa differenza) e viceversa?
    Oppure mi sfugge quelcosa?
    Grazie ancora.


  • User Attivo

    il nome della pagina che viene caricata digitando il solo dominio www.miosito.it dipende dalle impostazioni del server.
    nel tuo caso, se entrando da www.miosito.it vedi il contenuto di default.html significa che è questo il file che viene utilizzato.

    quindi tu crei e carichi la pagina default.html ma poi vi accederai usando l'indirizzo nella forma www.miosito.it (e lo stesso farai nei link interni).


  • User Attivo

    Il server è Aruba. Se digito www.miosito.com sulla finestra degli indirizzi, vien fuori http://www.miosito.com e non http://www.miosito.com/default.html. Se, invece, torno alla Home da una pagina interna del sito, si apre http://www.miosito.com/default.html, proprio perchè i link delle pagine interne alla Home, sono relativi e non assoluti. Ma siamo al punto di partenza, in quanto milioni di siti hanno link relativi alla HP...e io vorrei uscirmene da questa impasse.
    Comunque grazie di cuore per la tua squisita disponibilità.


  • User Attivo

    non è questione di url relativi o assoluti, si tratta del fatto che da quanto capisco nei tuoi link alla home page richiami il file default.html, mentre dovresti puntare solamente al dominio (per la home page).

    devi avere quindi codice html del tipo <a href="/">home page</a> (o se preferisci <a href="http://www.miosito.it/">home page</a>).
    per i link ad altre pagine non ci sono problemi, ma quelli verso la home page li devi fare così.

    se usi link del tipo <a href="default.html">home page</a> i motori di ricerca si trovano a "scoprire" il file default.html a cui invece non dovrebbero avere accesso (visto che dovrebbero trovare il contenuto di quel file solamente nella root del dominio).

    p.s. non so se aruba accetti default.html come pagina associata alla home page, in ogni caso ti consiglierei di rinominare quel file in index.html che è il nome standard. il discorso fatto qui sopra su come fare i link rimangono validi comunque


  • User Attivo

    Bene, dunque è come già era stato detto:

    1. D'accordissimo nel provare a sistemare i link interni sostituendo http://www.ipoteticosito.com a default.html

    Non sapevo che solo la default o l'index avessero bisogno di percorsi assoluti.
    In ogni caso, l'attuale stringa è

    <li><a href="/default.html" title="HOME"><span>HOME</span></a></li>
    

    che modificherò in

    <li><a href=http://www.miosito.it/ title="HOME"><span>HOME</span></a></li>
    

    Quanto ad Aruba chiederò e ti farò sapere, ma credo non ci siano problemi.

    Grazie infinite.


  • User Attivo

    bene, ora ci siamo.

    solo una precisazione: non è una questione di url assoluti o relativi, ma del url che viene proposta allo spider.
    come dicevamo, www.miosito.it e www.miosito.it/default.html sono necessariamente due pagine diverse, poiché i due url sono diversi.

    andrebbe infatti benissimo anche il link relativo
    [HTML]<li><a href="/" title="HOME"><span>HOME</span></a></li>[/HTML]
    che lo spider leggerebbe allo stesso modo, l'importante è che non ci sia il nome del file


  • User Attivo

    Si, tutto chiaro apusoft.

    p.s. non so se aruba accetti default.html come pagina associata alla home page
    Nessun problema per Aruba. Riporto qui l'elenco delle pagine da associare alla home page, nell'Hosting Windows (magari può servire a qualcun altro):

    Come nominare l?Homepage su Hosting Windows

    Di seguito i nomi con cui dovrà essere chiamata l?Homepage, in ordine di priorità:
    **Index.htm **
    **Index.html **
    **Index.asp **
    **Index.php **
    **Index.shtm **
    **Index.wml **
    **Index.aspx **
    **Default.asp **
    **Default.php **
    **Default.html **
    **Default.htm **
    **Default.shtm **
    **Default.wml **
    **Default.aspx **
    Se è presente index.htm non sarà visibile in automatico index.html (è successiva nella lista) e così via. Una volta scelto il nome della home page, è necessario controllare che non siano quindi presenti files con uno degli altri nomi.

    Sempre nell'ottica di chiarire definitivamente ogni dubbio mio e di altri, questa stringa

     
    <li><a href=http://www.miosito.it/ title="HOME"><span>HOME</span></a></li>
    
    

    equivale a questa? (Senza lo slash finale)
    <li><a href=http://www.miosito.it title="HOME"><span>HOME</span></a></li>

    Ultima cosa. Utilizzerò il tuo suggerimento

    
    <li><a href="/" title="HOME"><span>HOME</span></a></li>
    
    

    per modificare i link all'HP, ma vorrei chiederti la differenza con

    <li><a href="./" title="HOME"><span>HOME</span></a></li>
    ``` (il punto prima dello slash).
    Lo chiedo in quanto, 'sfruculiando' nell'html di dotti siti quali http://validator.w3.org, ho notato che i link all'HP contengono il punto:
    

    <ul class="navbar" id="menu"><li><a href="./" accesskey="1" title=...ecc...

    
    Ti ringrazio per la pazienza e la disponibilità.