- Home
- Categorie
- La Community Connect.gt
- Tutto sulla Community
- Rimozione pagine obsolete e http status 410
-
Si lo avevo letto quel post ed era riferito a quello che dicevo che il 410 sembra piu appropriato ed efficace.
Comunque grazie il mio dubbio era propio se restituendo un 410 potevo fare un redirect lato server ma come tu mi dici devo personalizzare la pagina offerta dal server oppure usare gli strumenti per Web Master di GOOGLE (però in quel caso restituire un 404 altrimenti non funziona presumo)
Ma in quel caso usando il 410 con .htaccess sarà quindi...
ErrorDocument 410 /tua_pagina_410.htm ..... GIUSTO?
-
Sì sì, scusami, la direttiva corretta è ```
ErrorDocument 410 /not-found.html
-
Mi interessa molto questa cosa , anche perchè non ne so molto.
Se risolvi, saresti gentile da postare un resoconto?Grazie.
-
Massimo, ripensandoci in pausa pranzo mi vien il dubbio di aver creato un po' di confusione. Riassumo un attimo quello che intendevo dire...
La direttiva ErrorDocument permette di informare Apache sulla pagina da mostrare nel caso si verifichi l'errore a cui è associata. Quindi usando ErrorDocument 410 /pagina.htm il server mosterà pagina.htm quando rileva un errore 410. L'errore quindi deve essere rilevato dal server e non gestito dalle intestazioni che generi tu con php. Tra l'altro è probabile che il server restituirà l'errore 404 invece che il 410.
Le intestazioni generate con php le puoi invece gestire tu ed in questo caso puoi usare a piacere il 404 o il 410. Non è necessario il redirect perchè il server mostrerà il contenuto della pagina stessa che genera l'intestazione di errore.
Per fare un esempio concreto, nel caso volessi usare lo script di Google la pagina sarebbe nel formato ```
<?php header("HTTP/1.1 410 Gone"); ?>
....
<body>
<script ... >// lo script di Google per la pagina di errore personalizzata</script>
</body>...
-
Ok grazie della delucidazione...nel frattempo anche io sto leggendo qua e la e voglio fare una prova pratica.
Quindi dici di:
1)Far restituire un header 410 alla pagina dinamica indicizzata da GOOGLE il cui contenuto viene rimosso.
- Personalizzare contattando il servizio di hosting la pagina di errore con lo script fornito da google.
A questo punto mi dovrei trovare gli url delle pagine rimosse tra quelli non trovati di google nei WMT (e qui mi sorge il dubbio..non riporta solo quelli che restituiscono 404?) e a quel punto decidere se attendere la rimozione di google o accelerare la cosa rimuovendoli con lo strumento per la rimozione...giusto?
Max
-
I due punti che hai riportato sono corretti ma non sono legati fra loro. Come ti dicevo nel mio ultimo intervento, l'header 410 (o 404) che restituisci tu con php non è quello generato da Apache a cui si applica la pagina indicata da ErrorDocument
Cerco di essere più chiaro:
- ErrorDocument informa Apache relativamente alla pagina da mostrare in caso di un certo tipo di errore
- il server genera l'errore 404 (410) se rileva che effettivamente un file non è presente sul server; in questo caso lo status 404 (o 410) viene gestito direttamente dal server e non c'è motivo di inviarlo da php
- se invece un URL diventa non più esistente ma non si tratta di un mancato riferimento ad un file reale (uso di CMS, url rewrite....) allora lo status 404 (o 410) dovrà essere inviato da php. In questo caso la pagina che genera l'header di errore conterrà anche il contenuto da mostrare (tuo messaggio o script di Google).
Si tratta insomma di due cose diverse; l'effetto mostrato al visitatore è lo stesso ma il motivo (e quindi il metodo) di generazione dell'header è diverso.
Riguardo all'ultima domanda sul WMT, mi spiace ma non ho dati per rispondere. E' comunque una questione interessante, che potresti riproporre in un'altra discussione a parte.
-
Ah ok...quindi nel mio caso poichè il mio problema è gestire le pagine dinamiche generate a partire da un DB, se rimuovo un contenuto che generava una pagina che veniva indicizzata da GOOGLE devo gestire dallo script che generava la pagina l'invio dello status 410 o 404 e la pagina di errore personalizzata tipo in PHP:
if(contenuto esiste)
{
genera la pagina che viene anche indicizzata
}
else
{
header("HTTP/1.1 410 Gone");
print(pagina di errore con script di google);
}Forse sta volta ci siamo eh...:-)
-
Perfetto Massimo, è esattamente quello che devi fare; ti posso garantire che una struttura di questo tipo darà i risultati più corretti.
-
Ok ho già modificato lo script php ora ti aggiornerò su indicizzazione e come reagisce GOOGLE negli strumenti per web master.
Grazie del prezioso aiuto.
Massimo
-
Ciao,
come procede la cosa? Ci sono stati risultati in questi ultimi giorni?
Te lo chiedo perchè anche io ho lo stesso tuo problema.Ciao
-
procede bene direi...
Nei Webmaster Tools di G trovi gli errori http (li segnala come errori
4xx error ) relativi alle pagine dinamiche dei contenuti rimossi e man mano G li rimuove dall'indice.Pare funzioni bene isomma..
Max