• User

    Strano comportamento della copia cache

    Ciao a tutti,
    premetto che ho notato che la pagina cache del mo sito risale ancora al 12 maggio nonostante settimanalmente apporti dei cambiamenti.

    Detto ciò, volevo verificare la posizione del sito con i termini "corsi di informatica" e purtroppo risiedo negli abissi intorno alla 90 posizione più o meno ma quello che mi ha incuriosito è stato che SOLO sul mio sito i termini evidenziati da Google sono tutti sbagliati!!

    Mi spiego, apro altri siti in cache ed effettivamente Google ha evidenziato con diversi colori le 3 parole "corsi di informatica" mentre sul mio sito quelle evidenziate sono cose tipo "ica del " , "ica son" " ica, p". A cosa è dovuto questo strano comportamento? Può ciò influenzarne il piazzamento ?

    Grazie.


  • Moderatore

    Ciao max_bt.

    Non ricordo di aver mai notato comportamenti simili a quello da te descritto.

    Incuriosito ho cercato di aprire la pagina con un browser testuale ed ho notato che vi sono dei caratteri nascosti all'inizio del testo. Poi per curiosità ho verificato anche la validazione del tuo sito e mi è venuta un'idea.

    A generare l'errore potrebbe essere la codifica UTF-8 o meglio qualche carattere che essa mette ad inizio documento.
    Nel tuo caso, utilizzando browser come lynx si trova questo "  " (che poi è uno dei Byte Order Mark (BOM) dello standard Unicode male interpretato).
    Il consiglio è quello di rivedere il codice che genera il sito o molto più radicalmente di cambiare codifica.

    Prima di risponderti ho fatto alcuni (5) tentativi in siti con codifica UTF-8: dove ho letto i caratteri senza senso la cache di Google non si colorava o si colorava in maniera sbagliata. Ovviamente è poco per affermare con certezza che sia la soluzione esatta, ma penso sia abbastanza per fare qualche tentativo.
    Se gli utenti del Forum, incuriositi, volessero portare la loro esperienza sarebbero come sempre utilissimi.

    Per quanto riguarda il posizionamento, non mi preoccuperei affatto: è evidente che Google percepisca perfettamente tutto il testo (oltre a quei tre caratteri di troppo).

    Spero di esserti stato d'aiuto e che tu voglia eventualmente condividere con noi la soluzione al tuo problema.

    Per il momento, buon lavoro!


  • User

    Grazie LaBussola !
    effettivamente controllando la validazione w3c risultava un warning in merito alla presenza di un BOM, impostando il charset=iso-8859-1 il warning è scomparso ora non resta che attendere il refresh della cache e fare la verifica se il comportamento anomalo era dovuto proprio alla codifica utf-8.