• User Attivo

    Aggiornamenti copia di cache

    Salve sto facendo da poco un test sull'aggiornamento della copia di cache e mi risulta che se scarico una pagina dal server e la ricarico su senza modificarla il giorno dopo la copia di cache viene aggiornata.

    Facendo questa operazione a google la pagina risulta modificata come fanno a rilevare la data di caricamento che viene vista come modifica?


  • Super User

    Ciao vocalis, si comporta nello stesso modo in genere usato dai browser, è molto tecnica la questione, cerco di semplificartela (e tra parentesi metto i termini tecnici per chi vuole approfondire).

    Giorno 1

    Google: dammi la pagina A.HTM
    Server: eccoti la pagina A.HTM, come data ultima modifica ha 2 gennario 2011 (Last-Modified: Sun, 02 Jan 2011 00:00:00 GMT)

    Giorno 2

    Google: dammi la pagina A.HTM se l'hai modificata dopo il 2 gennaio
    (If-Modified-Since: Sun, 02 Jan 2011 00:00:00 GMT)
    Server: non ti do niente, perché non è stata modificata, e così entrambi risparmiamo banda e tempo
    (HTTP/1.1 304 Not Modified)

    In genere questo accade di default con i file e le pagine statiche (gif, html, jpg ecc.), e non con quelle dinamiche (php, asp, ecc.), ma si può fare pure con queste ultime, io lo faccio per esempio.

    Ora cosa accade se tu la ricarichi sul server?

    Che sovrascrivendo il file html che hai sul server, il server FTP di default (comportamento modificabile nelle impostazioni) va a sovrascrivere pure la data ultima modifica con quella attuale.

    Ed è proprio questa che il webserver usa quella per stabilire se è cambiato il documento rispetto alla data che gli comunica Google.

    Spero di essermi spiegato, non è facile.

    EDIT:

    Preciso che ho risposto alla domanda "come fanno a rilevare la data di caricamento".

    Però io non mai notato questa corrispondenza fra data copia cache e data ultima modifica, le vedo sempre diverse.
    Potresti dirmi la URL della pagina di test così approfondisco?