• User

    Lo spider di Google si ferma a 100 KB?

    Salve ragazzi, ho letto che lo spider di G. cessa la scansione della pagina quando raggiunge i 100 kb scansionati.....spero sia una fesseria perchè è facile superare i 100 kb!

    Voi che pensate?

    Un altro dubbio: riguardo alla buona accessibilità....allo spider fa piacere la presenza di un motore di ricerca interno? Il sito viene visto più navigabile, quindi visto meglio da G.?


  • User Attivo

    Questa pagina ha 353.3 kB.


  • User

    So benissimo che la stragrande maggioranza delle pagine in tutto il web supera di gran lunga i 100kb..... l'ho chiesto solo per sapere se lo spider è in grado di scansionare TUTTA la pagina, quali sono i limiti...


  • User Attivo

    La pagina è indicizzata senza problemi: goo.gl/OYc2R

    Più che discutere di *dimensioni *della pagina, sarebbe più coretto discutere dei tempi di caricamento della pagina.
    :ciauz:


  • User

    Oh...forse ho fatto confusione.... Che la pagina è TUTTA indicizzata non lo metto in dubbio. Il problema riguarda la scansione. Cioè se una pagina ha 3000 kb e lo spider scansiona solo i primi 100kb, la pagina ovviamente sarà indicizzata TUTTA, ma forse lo spider tiene in considerazione i primi kb utili per determinare l'argomento trattato dalla pagina.....quindi il testo, le keywords,ecc

    non so se mi spiego


  • User Attivo

    Ovviamente non è così. Ripeto, quello che conta sono i tempi di caricamento.


  • User

    Uhm...ok quindi la pagina può contenere anche 10 mb....lo spider li scansiona tutti solo se ci mette poco, quindi è più un problema del server che ospita la pagina! Lo so che è una domanda inutile, è solo per sapere meglio come funziona lo spider!

    Grazie tante Cesar!

    Però vorrei capire se un motore di ricerca interno è utile (per gli utenti ovviamente si) anche per gli spider..... per definire il sito più accessibile...?


  • Moderatore

    @edward said:

    ... ho letto che lo spider di G. cessa la scansione della pagina quando raggiunge i 100 kb scansionati....
    Era così agli albori di Google, probabilmente hai letto una fonte molto vecchia

    @edward said:

    Un altro dubbio: riguardo alla buona accessibilità....allo spider fa piacere la presenza di un motore di ricerca interno? Il sito viene visto più navigabile, quindi visto meglio da G.?Le linee guida di Google chiedono di segnalare come da non indicizzare pagine con risultati di ricerca interni; dal punto di vista di Google non è bello per l'utente saltare dalla SERP di Google alla SERP di un sito.
    G preferisce potere navigare da solo agli URL di destinazione, tuttavia perché accada serve che questi siano raggiungibili tramite link interni.

    Ciao


  • User

    @Federico Sasso said:

    Era così agli albori di Google, probabilmente hai letto una fonte molto vecchia

    Meno male....non ho letto una fesseria, ma solo una info vecchia :tongueout:

    @Federico Sasso said:

    Le linee guida di Google chiedono di segnalare come da non indicizzare pagine con risultati di ricerca interni; dal punto di vista di Google non è bello per l'utente saltare dalla SERP di Google alla SERP di un sito.
    G preferisce potere navigare da solo agli URL di destinazione, tuttavia perché accada serve che questi siano raggiungibili tramite link interni.

    Ciao

    Cioè vuoi dire che è meglio non far comparire, tra i risultati di G, le pagine di ricerca interna del sito?
    Se ho capito bene, questo lo penso anch'io. Non avrebbe senso far comparire la pagina (contenente i risultati di ricerca interna) tra i risultati di ricerca di G. Se no cosa ci sta a fare G? :bho:
    Quindi nel caso in cui voglio mettere un motore interno devo anche proteggere la pagina di destinazione delle ricerche interne (presumo sarà in php) dall'indicizzazione e/o scansione tramite il robot o tag noindex?

    Se poi mi dici che è meglio non avere un motore interno per risparmiare codice e peso della pagina e per far navigare all'utente TUTTE le pagine, probabilmente non lo metterò!


  • Moderatore

    @edward said:

    Quindi nel caso in cui voglio mettere un motore interno devo anche proteggere la pagina di destinazione delle ricerche interne (presumo sarà in php) dall'indicizzazione e/o scansione tramite il robot o tag noindex?Esatto 🙂

    @edward said:

    Se poi mi dici che è meglio non avere un motore interno per risparmiare codice e peso della pagina e per far navigare all'utente TUTTE le pagine, probabilmente non lo metterò!Non te lo dico!
    Se ritieni un motore di ricerca interno sia un servizio utile ai tuoi utenti, mettilo.

    Se ben implementato, può essere un ottimo strumento per migliorare l'usabilità di siti complessi. In più ha il notevole vantaggio di permetterti di tracciare le query di ricerca dei tuoi utenti, non male in un periodo di [not provided]
    Se usi Google Analytics, puoi anche integrarlo con la sua reportistica (e consultala regolarmente, e verifica la bonta dei risultati offerti, intervenendo se è il caso).

    Il problema dei motori di ricerca interni di solito è che non rispondono alle aspettative degli utenti, troppo ben abituati dai motori di ricerca web:
    o sono lenti, o non tirano fuori i risultati corretti, o non li sanno ordinare per pertinenza, o sovraccaricano il database con query pesanti... farlo è semplice, farlo bene è una bella sfida per un programmatore.


  • User

    Grazie per il chiarimento! 🙂

    @Federico Sasso said:

    Esatto 🙂
    Se ben implementato, può essere un ottimo strumento per migliorare l'usabilità di siti complessi. In più ha il notevole vantaggio di permetterti di tracciare le query di ricerca dei tuoi utenti, non male in un periodo di [not provided]

    Non male in un periodo di......? :lipssealed:


  • Moderatore

    Scusa, non mi sono spiegato.

    "(not provided)" è il termine usato da Google Analytics per indicare nei propri report la chiave di ricerca usata per arrivare al tuo sito da ricerca organica, quando l'informazione non è disponibile.

    Fino a tempi relativamente recenti da Google Analytics era possibile vedere la quasi totalità delle chiavi usate su Google per giungere al tuo sito, ma poi per motivi di "supposto rispetto" della privacy, le visite con link dalle SERP di G non forniscono più l'informazione in moltissimi casi.
    All'inizio doveva essere una percentuale di visite piuttosto bassa, ma ormai è così per più del 75% delle visite organiche.

    Ho detto "supposto rispetto" della privacy, perché l'informazione non è mai mascherata per le visite AdWords (a pagamento).
    Ciao


  • User

    @Federico Sasso said:

    Scusa, non mi sono spiegato.

    "(not provided)" è il termine usato da Google Analytics per indicare nei propri report la chiave di ricerca usata per arrivare al tuo sito da ricerca organica, quando l'informazione non è disponibile.

    Fino a tempi relativamente recenti da Google Analytics era possibile vedere la quasi totalità delle chiavi usate su Google per giungere al tuo sito, ma poi per motivi di "supposto rispetto" della privacy, le visite con link dalle SERP di G non forniscono più l'informazione in moltissimi casi.
    All'inizio doveva essere una percentuale di visite piuttosto bassa, ma ormai è così per più del 75% delle visite organiche.

    Ho detto "supposto rispetto" della privacy, perché l'informazione non è mai mascherata per le visite AdWords (a pagamento).
    Ciao

    Chiarissimo, Grazie 1000 :gthi: