• User Attivo

    Sì sì, scusami, la direttiva corretta è ```
    ErrorDocument 410 /not-found.html


  • User

    Mi interessa molto questa cosa , anche perchè non ne so molto.
    Se risolvi, saresti gentile da postare un resoconto?

    Grazie.


  • User Attivo

    Massimo, ripensandoci in pausa pranzo mi vien il dubbio di aver creato un po' di confusione. Riassumo un attimo quello che intendevo dire...

    La direttiva ErrorDocument permette di informare Apache sulla pagina da mostrare nel caso si verifichi l'errore a cui è associata. Quindi usando ErrorDocument 410 /pagina.htm il server mosterà pagina.htm quando rileva un errore 410. L'errore quindi deve essere rilevato dal server e non gestito dalle intestazioni che generi tu con php. Tra l'altro è probabile che il server restituirà l'errore 404 invece che il 410.

    Le intestazioni generate con php le puoi invece gestire tu ed in questo caso puoi usare a piacere il 404 o il 410. Non è necessario il redirect perchè il server mostrerà il contenuto della pagina stessa che genera l'intestazione di errore.

    Per fare un esempio concreto, nel caso volessi usare lo script di Google la pagina sarebbe nel formato ```
    <?php header("HTTP/1.1 410 Gone"); ?>
    ....
    <body>
    <script ... >// lo script di Google per la pagina di errore personalizzata</script>
    </body>...


  • User

    Ok grazie della delucidazione...nel frattempo anche io sto leggendo qua e la e voglio fare una prova pratica.

    Quindi dici di:

    1)Far restituire un header 410 alla pagina dinamica indicizzata da GOOGLE il cui contenuto viene rimosso.

    1. Personalizzare contattando il servizio di hosting la pagina di errore con lo script fornito da google.

    A questo punto mi dovrei trovare gli url delle pagine rimosse tra quelli non trovati di google nei WMT (e qui mi sorge il dubbio..non riporta solo quelli che restituiscono 404?) e a quel punto decidere se attendere la rimozione di google o accelerare la cosa rimuovendoli con lo strumento per la rimozione...giusto?

    Max


  • User Attivo

    I due punti che hai riportato sono corretti ma non sono legati fra loro. Come ti dicevo nel mio ultimo intervento, l'header 410 (o 404) che restituisci tu con php non è quello generato da Apache a cui si applica la pagina indicata da ErrorDocument

    Cerco di essere più chiaro:

    • ErrorDocument informa Apache relativamente alla pagina da mostrare in caso di un certo tipo di errore
    • il server genera l'errore 404 (410) se rileva che effettivamente un file non è presente sul server; in questo caso lo status 404 (o 410) viene gestito direttamente dal server e non c'è motivo di inviarlo da php
    • se invece un URL diventa non più esistente ma non si tratta di un mancato riferimento ad un file reale (uso di CMS, url rewrite....) allora lo status 404 (o 410) dovrà essere inviato da php. In questo caso la pagina che genera l'header di errore conterrà anche il contenuto da mostrare (tuo messaggio o script di Google).

    Si tratta insomma di due cose diverse; l'effetto mostrato al visitatore è lo stesso ma il motivo (e quindi il metodo) di generazione dell'header è diverso.

    Riguardo all'ultima domanda sul WMT, mi spiace ma non ho dati per rispondere. E' comunque una questione interessante, che potresti riproporre in un'altra discussione a parte.


  • User

    Ah ok...quindi nel mio caso poichè il mio problema è gestire le pagine dinamiche generate a partire da un DB, se rimuovo un contenuto che generava una pagina che veniva indicizzata da GOOGLE devo gestire dallo script che generava la pagina l'invio dello status 410 o 404 e la pagina di errore personalizzata tipo in PHP:

    if(contenuto esiste)
    {
    genera la pagina che viene anche indicizzata
    }
    else
    {
    header("HTTP/1.1 410 Gone");
    print(pagina di errore con script di google);
    }

    Forse sta volta ci siamo eh...:-)


  • User Attivo

    Perfetto Massimo, è esattamente quello che devi fare; ti posso garantire che una struttura di questo tipo darà i risultati più corretti.


  • User

    Ok ho già modificato lo script php ora ti aggiornerò su indicizzazione e come reagisce GOOGLE negli strumenti per web master.

    Grazie del prezioso aiuto.

    Massimo


  • User Attivo

    Ciao,
    come procede la cosa? Ci sono stati risultati in questi ultimi giorni?
    Te lo chiedo perchè anche io ho lo stesso tuo problema.

    Ciao


  • User

    procede bene direi...
    Nei Webmaster Tools di G trovi gli errori http (li segnala come errori
    4xx error ) relativi alle pagine dinamiche dei contenuti rimossi e man mano G li rimuove dall'indice.

    Pare funzioni bene isomma..

    Max