- Home
- Categorie
- La Community Connect.gt
- Tutto sulla Community
- Nomi dei file e contenuto duplicato
-
Nomi dei file e contenuto duplicato
Salve a tutti, è la prima volta che scrivo anche se vi seguo quotidianamente!
*Ecco la mia situazione*: alcuni mesi fa avevo ottimizzato un sito ed è andato sempre molto bene. Adesso il codice di questo sito è stato rifatto (non da me), ma la grafica, la struttura di navigazione ed i contenuti sono rimasti identici. Ho scoperto che chi ha fatto il restyling del codice ha modificato il nome ai file e la suddivisione in cartelle. Il sito è in tre lingue, prima tutti i file erano inseriti in una generica cartella "html" e, per la distinzione della lingua era stato applicato un "eng" o "ted" al nome del file: ad esempio, "html/azienda.html" individuava la pagina in italiano, "html/aziendaeng.html" e "html/aziendated.html" individuavano rispettivamente la pagina in inglese e quella in tedesco. Adesso la situazione è questa: "azienda.html" si riferisce alla pagina in italiano, ma per la distinzione delle pagine nelle altre due lingue sono state create due cartelle distinte, perciò il nuovo percorso per le pagine in inglese e tedesco è "eng/azienda.html" e "ted/azienda.html". Sostituendo la vecchia struttura con quella nuova, rendo inesistenti le vecchie pagine in tutte e tre le lingue e questo crea problemi su due fronti: da una parte le vecchie pagine indicizzate, una volta trovate e cliccate dagli utenti, rimanderanno a pagine che non ci sono più e questo comporterà una perdita di traffico; dall'altra, le pagine perderanno il loro posizionamento.
Una soluzione potrebbe essere quella di mantenere la vecchia cartella html, in modo che gli utenti trovino comunque le vecchie pagine e l'indicizzazione non venga persa, però così ho un buon numero di pagine con contenuto duplicato e questo mi fa temere per il ban.
Ecco le mie domande: se mantengo anche la vecchia cartella e rinuncio ad ottimizzare le nuove pagine, rischio comunque il ban, vero, dato che i testi delle pagine sono identici? Cosa mi consigliate di fare?
-
La soluzione per te è: redirect 301
-
Per le pagine in html, ho trovato questo script per il redirect 301:
<META HTTP-EQUIV=Refresh CONTENT="0; URL=http://www.nuovosito.com">
Non c'è il rischio che questo venga interpretato in modo negativo dai motori per il fatto che la durata del redirect è così bassa?
-
Ciao,
non è l'ideale ma è accettabile, il meta-refresh è un po' il 301 dei poveri.
L'ideale con le pagine statiche è avere la possibilità di inserire dei redirect 301 in un file .htaccess di Apache (chiedi al sistemista di fiducia).
-
Ovunque tu abbia trovato scritto che quel meta refresh corrisponde ad un 301, scordati di essere nel giusto.
Fintanto che una pagina statica esiste e viene restituita al client, il suo http-status sarà sempre di 200 ovvero OK.
l'http status è qualcosa che tu puoi modificare solo ed esclusivamente lato server o con delle pagine dinamiche che ti permettono di alterare il codice di ritorno verso il client, impostandolo per l'appunto su 301, ovvero risorsa spostata altrove.
-
@moroandrea said:
Ovunque tu abbia trovato scritto che quel meta refresh corrisponde ad un 301, scordati di essere nel giusto.
In mancanza di meglio (soluzione descritta precedentemente) il meta-refresh fa un po' le veci del 301, viene seguito dagli spider e lentamente la vecchia pagina viene dimenticata.
Provato sul campo
-
Non ho mai avuto modo di usare il 301 se non recentemente per il mio sito e in quel caso gestendomi direttamente i server sono andato nel pannello IIS e ho fatto le cose come si devono.
Ma mi fido della tua esperienza, anche se mi domando perchè accidenti per certe cose i motori siano intransigenti e per altre ci passino sopra.
-
@moroandrea said:
mi domando perchè accidenti per certe cose i motori siano intransigenti e per altre ci passino sopra.
Siccome il meta-refresh viene interpretato e seguito non inganna lo spider e quindi non c'è nulla di male, quindi in questo caso non c'è bisogno di intransigenza.
-
Da quanto ne sò i meta refresh a timer 0 sono mal visti, perchè alcuni motori li interpretavano come una "sorta" di cloacking, quindi mi sono sempre posto il problema di evitare di rinominare i file, cambiare struttura cercando di fare tutto con un certo senno del poi sin da subito. Poi sul fatto che viene segutio, non ci sono dubbi si tratta pur sempre di una risorsa disponibile, co come lo deve essere il file spostato che per avere il meta refresh deve comunque esistere sebbene completamente vuoto (refresh a parte). Al massimo ad essere penalizzata sarà la pagina che fa il refresh, ma del resto lo scopo è quello di spostare la risorsa. Non vorrei però che questa micro penalizzazione nel lungo periodo penalizzi anche il resto.
-
Grazie a tutti! Credo di essere riuscita a capire come impostare il file .htaccess, perciò userò questo sistema, che mi sembra più sicuro del meta refresh.
@moroandrea said:
Ovunque tu abbia trovato scritto che quel meta refresh corrisponde ad un 301, scordati di essere nel giusto.
Ehm, non vorrei mettere in discussione l'autorità della fonte, ma l'ho trovato nella WikiGT...
-
Non ho letto il WikiGT ... ma sono abbastanza convinto che delle micropenalizzazioni ci siano.
Passo la parola a chi ha scritto il wiki. Magari ha dei casi reali per dimostrare il contrario.
-
@moroandrea said:
Non ho letto il WikiGT ... ma sono abbastanza convinto che delle micropenalizzazioni ci siano.
Beh di solito quando sono micro rischiano di confondersi con le "sensazioni"
Comunque a parte gli scherzi...meglio il 301 ma il meta-refresh è una soluzione innocente e del tutto tollerata.