• User Attivo

    Come fa Google a indicizzare pagine che Lynx non vede?

    Ciao, un paio di giorni fa stavo analizzando un sito.

    Ne guardavo sia il codice html, che l'indicizzazione di alcune keyword su Google, che come si comportava con un browser testuale, Lynx.

    Bene, in questo sito c'è un elenco di prodotti, e da questo elenco si entra nella scheda di ogni prodotto cliccando sulla relativa foto/nome. Se navigato con Lynx, però, è impossibile entrare nella scheda prodotto, perchè il link è incluso all'interno di uno script.

    Però, cercando esattamente il nome del prodotto su Google, la pagina è correttamente indicizzata, al primo posto (il sito è grosso e importante nel settore).

    La pagina in questione sembra non avere backlink noti.

    Come mai Google riesce a indicizzare la scheda prodotto, se un browser testuale non la vede?

    Se posso inserire il nome del sito forse si capisce meglio...


  • User Attivo

    Credo che si stia dando per scontato che gli spider di Google funzionino esattamente come Lynx. Il che probabilmente non è vero.


  • User Attivo

    È vero, Lynx non è esattamente come lo spider di Google, però è un browser testuale che gli si avvicina molto, almeno secondo le indicazioni ufficiali di Google stesso.
    In effetti anche la funzione "visualizza come Google" presente in analytics/gwt era praticamente una visualizzazione lynx...

    Se a questo si aggiunge che il link alla scheda prodotto è all'interno di uno script, la cosa mi lascia abbastanza stupefatto, sul piano strettamente teorico...

    Che ne pensi?


  • Super User

    Ciao, l'uso di una semplice sitemap passata a Google, no?


  • User Attivo

    Molto probabile che sia quello, non so se sia stata inviata ma credo sia quasi certo...


  • Moderatore

    Non posso giudicare il caso singolo, l'indicizzazione può essere dovuta a un link esterno non riportato dal GWT, o una sitemap; va però fatto notare che in un certa misura Google è in grado di seguire anche link realizzati in Javascript, almeno nei casi più semplici.


  • User Attivo

    Mi piacerebbe riuscire a determinare in modo abbastanza preciso quel "nei casi più semplici": hai esperienza diretta in proposito per caso?


  • Moderatore

    @akd said:

    Mi piacerebbe riuscire a determinare in modo abbastanza preciso quel "nei casi più semplici": hai esperienza diretta in proposito per caso?Non esperienza diretta.

    • Da parte di Google, ricordo dichiarazioni ufficiali da parte di suoi rappresentanti (non trovo link, almeno in uno dei suoi tanti video di Matt Cutts lo dichiarò
    • Da parte di osservatori esterni, se non erro un po' di sperimentazione l'aveva fatta SeoMofo, dimostrando quanto limitata - almento all'epoca - fosse la capacità di G nel seguirli.

    Per intendersi, p.es.:
    [HTML]<a href="javascript:window.location.href = 'accatìtìtpìduepuntislàscslàscwwwectetera'; ">anchor text</a>
    [/HTML]è un "caso semplice", si riconosce con un semplice pattern matching.

    Questi invece sono casi "non semplici":
    [HTML]<a href="javascript:myLink();">anchor text</a>
    <a href="#" onclick="myLink();return false;">anchor text</a>
    [/HTML]"non semplici", perché l'informazione non è presente in linea, e la funzione myLink che effettua la "window.location.href=..." è definita da altre parti, magari in file js esterni, e può essere una funzione anche complessa, non fa parte del compito del motore di ricerca analizzarla.

    Spero d'essermi spiegato.
    Ciao!


  • User Attivo

    Ciao, sì sei stato molto esaustivo, includendo anche del codice che chiarisse cosa intendevi per "semplice" o "non semplice".

    Grazie mille!