• Super User

    @Serp said:

    La pagina cache non necessariamente deve corrispondere alla versione indicizzata.
    Sì, hai ragione. Però, se non ricordo male, avevo anche verificato che i contenuti mancanti nella copia cache (nella quale il documento HTML appariva troncato) non erano stati indicizzati.

    Ad ogni modo, è un test piuttosto facile da ripetere: basta trovare una pagina molto grande indicizzata su Google e fare qualche verifica. Vedo se riesco.


  • Super User

    Come non detto: ho appena trovato una [url=http://216.239.59.104/search?q=cache:K9lZtaJvj-wJ:caml.inria.fr/distrib/ocaml-3.07/ocaml-3.07-refman.html+inanchor:%22huge+html+page%22&hl=it&gl=it&ct=clnk&cd=1]pagina di 881 KB nella cache di google. Forse qualcosa è cambiato dal mio ultimo test. :lol:

    <added>Ho aperto un [url=http://www.giorgiotave.it/forum/viewtopic.php?t=11351]topic.</added>


  • User Attivo

    A volte prende a metà anche pagina inferiori ai 100kb...il motivo non l'ho ancora capito.


  • Super User

    @delargester said:

    Cioè, è normale che il bot di google passi così spesso ma non mi indicizzi?

    Sì, è normale. Continua ad acquisire backlink di qualità e pian piano Googlebot sarà disposto ad indicizzare anche le altre pagine del tuo sito.


  • User

    I backlink di qualità per un sito amatoriale sono merce rara...comunque per "indicizza parzialmente" intendo dire che google non salva la mia pagina nel database ma tra i siti da indicizzare, in una sorta di lista d'attesa. Infatti se provo a cercare site:dominio lo trova. Però non mi dà nè info sulla pagina nè ha preso le key della stessa. Se infatti cerco soul of the cave staccato non trova nulla. Ma è possibile che ci metta tutto questo tempo? O ho sbagliato qualcosa io? Non avendo pagine in html ma bensì in php mi è + difficile capire cosa possa essere di aiuto per l'indicizzazione. Le key e la descrizione nell'output html si vedono...abbiate pazienza, sono un webmaster alle prime armi e quesiti stupidi come questi per me sono ostacoli non da poco in questo momento...e se non ci fossero forum e utenti disponibili come voi sarebbe assai improbabile che le persone per solo diletto si avvicinino al mondo del web dal lato server! Se avete tempo comunque il sito è souTOGLIEREloftTOGLIEREhecave.com. Grazie comunque.


  • Super User

    @delargester said:

    Però non mi dà nè info sulla pagina nè ha preso le key della stessa.

    Significa che ha trovato uno o più link che puntano al tuo sito, ma che a) non ha ancora inviato lo spider a scaricare la home oppure b) ha scaricato la home ma non ha ancora inserito i suoi contenuti nel suo indice.

    Se ci troviamo di fronte al caso a), non puoi fare altro che incrementare i backlink ed attendere.

    Se si trattasse del caso b), allora dovresti vedere indicizzata la home entro 48 ore.

    Ma è possibile che ci metta tutto questo tempo?

    Sì. Google non indicizza quello che vuoi tu, indicizza quello che ritiene gli convenga di più. E per decidere quello che gli conviene e quello che non gli conviene, si basa sulla qualità dei backlink che il sito riceve.

    Il New York Times parla del tuo sito e pubblica un link? Indicizzazione veloce.

    Gli unici link che hai sono scambi link e qualche directory minore? Ci vuole più tempo.

    O ho sbagliato qualcosa io?

    Non hai sbagliato nulla. Ci sono semplicemente 75.000 nuovi blog che nascono ogni santissimo giorno ([url=http://technorati.com/weblog/2006/04/96.html]fonte: Technorati), e bisogna dare a Google un buon motivo per indicizzare il tuo prima degli altri.


  • Super User

    @LowLevel said:

    ... bisogna dare a Google un buon motivo per indicizzare il tuo prima degli altri.

    Concordo. Tuttavia credo che il problema sia da ricondurre al problema che si è manifestato in questo ultimo tempo nelle infrastrutture tecniche: penuria di memorie di massa, problemi di personale, nuovi DC consegnati in ritardo.


  • User

    Ho controllato bene e posso dire che non mi trovo nè nella condizione a), infatti lo spider di google è passato e continua a passare pur senza seguire i link, nè nella b) perchè sono passate ben + di 48 ore e spesso è capitato che mi toglievano dalla cache per poi rimettermici dopo qualche ora. Spero di avere presto buone nuove dal grande G...

    Edit: nella cache è presente una pagina da 1kb vuota! Questo sarà un indizio?


  • Super User

    @Serp said:

    problema che si è manifestato in questo ultimo tempo nelle infrastrutture tecniche: penuria di memorie di massa, problemi di personale, nuovi DC consegnati in ritardo.
    Fonte?


  • User Attivo

    @delargester said:

    Ho controllato bene e posso dire che non mi trovo nè nella condizione a), infatti lo spider di google è passato e continua a passare pur senza seguire i link, nè nella b) perchè sono passate ben + di 48 ore e spesso è capitato che mi toglievano dalla cache per poi rimettermici dopo qualche ora. Spero di avere presto buone nuove dal grande G...

    Edit: nella cache è presente una pagina da 1kb vuota! Questo sarà un indizio?

    Per capire quando passa lo spider di google dove devo andare a vedere? ()
    Hmm... sì devo andare alla Google Sitemap mi sa... :sbav:


  • Super User

    ArkaneFactors: Fonte?

    :pipi:


  • Super User

    @Serp said:

    ArkaneFactors: Fonte?

    :pipi:
    Come dobbiamo interpretare la simpatica faccina?

    • no comment (sono fatti miei).
    • me l'ha confidato il mio amico Vermut.
    • l'ho letto sul blog di Jeremy Zawodny.
    • ... [diccci tu]

  • Super User

    ArkaneFactors:* Come dobbiamo interpretare la simpatica faccina? ...*

    La seconda che hai detto (credevo che fosse scontato)
    :ciauz:


  • Super User

    Sì. Google non indicizza quello che vuoi tu, indicizza quello che ritiene gli convenga di più. E per decidere quello che gli conviene e quello che non gli conviene, si basa sulla qualità dei backlink che il sito riceve.

    Il New York Times parla del tuo sito e pubblica un link? Indicizzazione veloce.

    Gli unici link che hai sono scambi link e qualche directory minore? Ci vuole più tempo. Quoto Low.

    Il lavoro che gli spider devono fare è immane, probabilmente anche per le enormi risorse di cui dispone Google.

    E' ovvio che gli algoritmi di crawling stabiliscono delle priorità in base all'"importanza" da essi assegnata ai documenti ed anche alla frequenza con la quale questi ultimi vengono aggiornati.

    Fattori che concorrono a determinare l'importanza di un documento possono essere, a mio modo di vedere la quantità e la qualità dei backlink ed il traffico generato...


  • User

    Finalmente! Dopo 46 accessi al mio sito da parte di googlebot, il grande G mi ha indicizzato! Solo che ci sono due problemini: la descrizione della pagina è inerente a un post nel blog inutile, non è nè il primo nè l'ultimo...il secondo problema è che se cerco soul of the cave staccato (il nome del gruppo) non mi trova nemmeno nelle prime 1000 posizioni e credo che non mi trovi proprio...eppure le key e le description le prende dal titolo e nella barra del browser si vede correttamente il nome del gruppo. Ho sbagliato/non tenuto conto di qualcosa? Se faccio una ricerca specifica non dovrei avere un risultato specifico? Non dovrebbe entrarci il discorso del page rank. Non è che cerco "computer"! Cerco una frase specifica...sono confuso... :fumato:


  • User Attivo

    E benvenuto nell'universo misterioso delle parole chiavi... :sbonk:
    Per quanto riguarda la chiave "soul of the cave" io al momento ti vedo al primo posto, quindi il problema sembra non ci sia per il momento.
    Comunque da novellino che sono ti consiglio di non adagiarti sugli allori di questa prima posizione perchè potrebbe anche durare poco (non voglio portarti sfiga eh 😄 ).
    Pensa che il mio sito www.furious.altervista.org è stato primo per 2 giorni per la chiave "furious altervista" e poi improvvisamente è scomparso dalle SERP, manco fosse in un settore dove nascono centinaia di siti al giorno (come poteva magari essere "hotel" ....).
    Da quel che ho capito occorre lavorare sui backlink, se se ne trovano di qualità allora è facile che rimarrai in vetta o cmq riuscirai a spingere il sito per altri chiavi, altrimenti mi pare dura contare solo sull'html e altri stratagemmi... (se hai dei backlink di qualità è un pò come essere raccomandati alla TV da Pippo Baudo
    :quote: )
    Questo detto da un principiante del posizionamento!