• Super User

    spider revisit after? (fanno un po' come gli pare...)

    dunque... assodato ormai che il meta revisit-after non viene pressochè minimamente calcolato, almeno da Google, volevo sapere se qualcuno ha un'idea sul come si muovano gli spider...

    nel mio blog passano, ma a voler stare largo, un giorno si e uno no. la conferma ce l'ho guardando i referrer, che dal giorno dopo inziano ad arrivare con key appena inserite e dal feed RSS su link:mioblog su blogsearch.google.com

    sul sito che gestisco sono ormai 8 giorni che non indicizza un tubazzo, eppure viene aggiornato spesso e con contenuti buoni e originali (che per fortuna non sono prodotti da me 😉 )

    ergo...??


  • Super User

    Se aggiorni spesso lo spider dovrebbe passare spesso, come se hai molti link in entrata. Poi ho notato che se hai un sito che ha le caratteristiche di un weblog (che non ti so indicare esattamente, però penso tipo se hai scritto "powered by Wordpress" e altre cose simili") passa spesso i primi tempi, poi se non aggiorni non passa spesso.


  • User

    visto che qui si parla di spider.... avevo una domanda da farvi:

    Ho un sito dove il google bot ha fatto inm questo mese 34536 accessi.

    più ho 46 accessi al file robot.txt/robots.txt

    La mia domanda è quei 46 accessi al file robot vogliono dire che il bot è passato 46 volte e ad ogni passaggio ha 750 accessi ogni volta che è arrivato sul sito in questione??

    Spero di essermi spiegato bene :fumato:


  • Super User

    @Tambu said:

    sul sito che gestisco sono ormai 8 giorni che non indicizza un tubazzo, eppure viene aggiornato spesso e con contenuti buoni e originali (che per fortuna non sono prodotti da me )

    Dipende da tante cose... se il sito è nuovo non è detto che google scenda in profondità immediatamente.

    @Tambu said:

    contenuti buoni e originali (che per fortuna non sono prodotti da me ) ()

    @Vins said:

    Ho un sito dove il google bot ha fatto inm questo mese 34536 accessi.

    più ho 46 accessi al file robot.txt/robots.txt

    La mia domanda è quei 46 accessi al file robot vogliono dire che il bot è passato 46 volte e ad ogni passaggio ha 750 accessi ogni volta che è arrivato sul sito in questione??

    Tu dici, se ogni volta che passa richiama il robots.txt facendo una divisione tra pagine totali e numero di volte che è passato (cioè che ha preso il robots.txt) sai quante pagine in media prende per volta...
    Il discorso sembra filare... Però è difficile fare considerazioni di questo genere.
    Mica l'ha preso solo google il file robots.txt, l'avranno richiamato anche altri spider...


  • User

    i numeri che ho messo si riferiscono solo al googlebot le fantastiche statistiche di awstat (free) mi dicono nome e cognome dello spider numero di accessi e banda usata.

    la cosa che mi chiedevo è che se quei 46 accessi al robot.txt voglia dire che il bot è arrivato da un altro sito o cosa.


  • Super User

    il sito è online da Luglio, tanto nuovo non è. I contenuti... li scrive una persona che sa scrivere, questo intendevo 🙂


  • Super User

    @lukas said:

    Se aggiorni spesso lo spider dovrebbe passare spesso, come se hai molti link in entrata. Poi ho notato che se hai un sito che ha le caratteristiche di un weblog (che non ti so indicare esattamente, però penso tipo se hai scritto "powered by Wordpress" e altre cose simili") passa spesso i primi tempi, poi se non aggiorni non passa spesso.

    cmq ci ho riflettuto e mi pare semplicistico... un weblog non è molto più (o meno) di un sito... ha i contenuti in colonna (ma non è detto) divisi per data e/o categorie... a volte nemmeno i commenti...

    bastasse quello potrei fare tanti paragrafi datati con una finta scritta "commenti" e poi piazzare "powered by wordpress" in fondo al sito e copiare i meta di WP... tralasciando il fatto che potrei anche fare direttamente il sito in WP. Per non parlare poi del fatto che ci sono anche altri sistemi di blog CMS, e piattaforme gratuite.

    potrei azzardare qualcosa come "se sei un qualche directory di blog ALLORA sei un blog?" tipo technorati, tanto per dirne una...