- Home
- Categorie
- La Community Connect.gt
- Tutto sulla Community
- Googlebot passa ma non indicizza niente...
-
@webbs said:
Cosa intendi con "Indicizza PARZIALMENTE la prima pagina" ?
Forse vuole dire che lo spider non carica tutta la pagina dal server, ma solo un "pezzetto". Comunque, guardando i log sul server, capità spesso di vedere questo tipo di attività (confronta la quantità prelevata con l'effetiva grandezza in byte del documento)
-
L'ultima volta che mi è capitato di fare un test con una pagina di grandi dimensioni, ho rilevato che Google aveva indicizzato solo i primi 100 Kbyte del documento HTML. Come l'ho capito? Semplicissimo: basta prendere la copia cache della pagina (togliendo l'header aggiunto da Google) e salvarla in locale. Ricordo che erano 100 KB esatti.
-
ArkaneFactors: ...basta prendere la copia cache della pagina ...
La pagina cache non necessariamente deve corrispondere alla versione indicizzata. Però da l'idea di questo tipo di attività. Forse un insegnamento può essere quello di creare pagine più leggere, o per lo meno di portare i "contenuti strategici" nel top.
-
@Serp said:
La pagina cache non necessariamente deve corrispondere alla versione indicizzata.
Sì, hai ragione. Però, se non ricordo male, avevo anche verificato che i contenuti mancanti nella copia cache (nella quale il documento HTML appariva troncato) non erano stati indicizzati.Ad ogni modo, è un test piuttosto facile da ripetere: basta trovare una pagina molto grande indicizzata su Google e fare qualche verifica. Vedo se riesco.
-
Come non detto: ho appena trovato una [url=http://216.239.59.104/search?q=cache:K9lZtaJvj-wJ:caml.inria.fr/distrib/ocaml-3.07/ocaml-3.07-refman.html+inanchor:%22huge+html+page%22&hl=it&gl=it&ct=clnk&cd=1]pagina di 881 KB nella cache di google. Forse qualcosa è cambiato dal mio ultimo test.
<added>Ho aperto un [url=http://www.giorgiotave.it/forum/viewtopic.php?t=11351]topic.</added>
-
A volte prende a metà anche pagina inferiori ai 100kb...il motivo non l'ho ancora capito.
-
@delargester said:
Cioè, è normale che il bot di google passi così spesso ma non mi indicizzi?
Sì, è normale. Continua ad acquisire backlink di qualità e pian piano Googlebot sarà disposto ad indicizzare anche le altre pagine del tuo sito.
-
I backlink di qualità per un sito amatoriale sono merce rara...comunque per "indicizza parzialmente" intendo dire che google non salva la mia pagina nel database ma tra i siti da indicizzare, in una sorta di lista d'attesa. Infatti se provo a cercare site:dominio lo trova. Però non mi dà nè info sulla pagina nè ha preso le key della stessa. Se infatti cerco soul of the cave staccato non trova nulla. Ma è possibile che ci metta tutto questo tempo? O ho sbagliato qualcosa io? Non avendo pagine in html ma bensì in php mi è + difficile capire cosa possa essere di aiuto per l'indicizzazione. Le key e la descrizione nell'output html si vedono...abbiate pazienza, sono un webmaster alle prime armi e quesiti stupidi come questi per me sono ostacoli non da poco in questo momento...e se non ci fossero forum e utenti disponibili come voi sarebbe assai improbabile che le persone per solo diletto si avvicinino al mondo del web dal lato server! Se avete tempo comunque il sito è souTOGLIEREloftTOGLIEREhecave.com. Grazie comunque.
-
@delargester said:
Però non mi dà nè info sulla pagina nè ha preso le key della stessa.
Significa che ha trovato uno o più link che puntano al tuo sito, ma che a) non ha ancora inviato lo spider a scaricare la home oppure b) ha scaricato la home ma non ha ancora inserito i suoi contenuti nel suo indice.
Se ci troviamo di fronte al caso a), non puoi fare altro che incrementare i backlink ed attendere.
Se si trattasse del caso b), allora dovresti vedere indicizzata la home entro 48 ore.
Ma è possibile che ci metta tutto questo tempo?
Sì. Google non indicizza quello che vuoi tu, indicizza quello che ritiene gli convenga di più. E per decidere quello che gli conviene e quello che non gli conviene, si basa sulla qualità dei backlink che il sito riceve.
Il New York Times parla del tuo sito e pubblica un link? Indicizzazione veloce.
Gli unici link che hai sono scambi link e qualche directory minore? Ci vuole più tempo.
O ho sbagliato qualcosa io?
Non hai sbagliato nulla. Ci sono semplicemente 75.000 nuovi blog che nascono ogni santissimo giorno ([url=http://technorati.com/weblog/2006/04/96.html]fonte: Technorati), e bisogna dare a Google un buon motivo per indicizzare il tuo prima degli altri.
-
@LowLevel said:
... bisogna dare a Google un buon motivo per indicizzare il tuo prima degli altri.
Concordo. Tuttavia credo che il problema sia da ricondurre al problema che si è manifestato in questo ultimo tempo nelle infrastrutture tecniche: penuria di memorie di massa, problemi di personale, nuovi DC consegnati in ritardo.
-
Ho controllato bene e posso dire che non mi trovo nè nella condizione a), infatti lo spider di google è passato e continua a passare pur senza seguire i link, nè nella b) perchè sono passate ben + di 48 ore e spesso è capitato che mi toglievano dalla cache per poi rimettermici dopo qualche ora. Spero di avere presto buone nuove dal grande G...
Edit: nella cache è presente una pagina da 1kb vuota! Questo sarà un indizio?
-
@Serp said:
problema che si è manifestato in questo ultimo tempo nelle infrastrutture tecniche: penuria di memorie di massa, problemi di personale, nuovi DC consegnati in ritardo.
Fonte?
-
@delargester said:
Ho controllato bene e posso dire che non mi trovo nè nella condizione a), infatti lo spider di google è passato e continua a passare pur senza seguire i link, nè nella b) perchè sono passate ben + di 48 ore e spesso è capitato che mi toglievano dalla cache per poi rimettermici dopo qualche ora. Spero di avere presto buone nuove dal grande G...
Edit: nella cache è presente una pagina da 1kb vuota! Questo sarà un indizio?
Per capire quando passa lo spider di google dove devo andare a vedere? ()
Hmm... sì devo andare alla Google Sitemap mi sa...
-
ArkaneFactors: Fonte?
:pipi:
-
@Serp said:
ArkaneFactors: Fonte?
:pipi:
Come dobbiamo interpretare la simpatica faccina?- no comment (sono fatti miei).
- me l'ha confidato il mio amico Vermut.
- l'ho letto sul blog di Jeremy Zawodny.
- ... [diccci tu]
-
ArkaneFactors:* Come dobbiamo interpretare la simpatica faccina? ...*
La seconda che hai detto (credevo che fosse scontato)
-
Sì. Google non indicizza quello che vuoi tu, indicizza quello che ritiene gli convenga di più. E per decidere quello che gli conviene e quello che non gli conviene, si basa sulla qualità dei backlink che il sito riceve.
Il New York Times parla del tuo sito e pubblica un link? Indicizzazione veloce.
Gli unici link che hai sono scambi link e qualche directory minore? Ci vuole più tempo. Quoto Low.
Il lavoro che gli spider devono fare è immane, probabilmente anche per le enormi risorse di cui dispone Google.
E' ovvio che gli algoritmi di crawling stabiliscono delle priorità in base all'"importanza" da essi assegnata ai documenti ed anche alla frequenza con la quale questi ultimi vengono aggiornati.
Fattori che concorrono a determinare l'importanza di un documento possono essere, a mio modo di vedere la quantità e la qualità dei backlink ed il traffico generato...
-
Finalmente! Dopo 46 accessi al mio sito da parte di googlebot, il grande G mi ha indicizzato! Solo che ci sono due problemini: la descrizione della pagina è inerente a un post nel blog inutile, non è nè il primo nè l'ultimo...il secondo problema è che se cerco soul of the cave staccato (il nome del gruppo) non mi trova nemmeno nelle prime 1000 posizioni e credo che non mi trovi proprio...eppure le key e le description le prende dal titolo e nella barra del browser si vede correttamente il nome del gruppo. Ho sbagliato/non tenuto conto di qualcosa? Se faccio una ricerca specifica non dovrei avere un risultato specifico? Non dovrebbe entrarci il discorso del page rank. Non è che cerco "computer"! Cerco una frase specifica...sono confuso...
-
E benvenuto nell'universo misterioso delle parole chiavi...
Per quanto riguarda la chiave "soul of the cave" io al momento ti vedo al primo posto, quindi il problema sembra non ci sia per il momento.
Comunque da novellino che sono ti consiglio di non adagiarti sugli allori di questa prima posizione perchè potrebbe anche durare poco (non voglio portarti sfiga eh ).
Pensa che il mio sito www.furious.altervista.org è stato primo per 2 giorni per la chiave "furious altervista" e poi improvvisamente è scomparso dalle SERP, manco fosse in un settore dove nascono centinaia di siti al giorno (come poteva magari essere "hotel" ....).
Da quel che ho capito occorre lavorare sui backlink, se se ne trovano di qualità allora è facile che rimarrai in vetta o cmq riuscirai a spingere il sito per altri chiavi, altrimenti mi pare dura contare solo sull'html e altri stratagemmi... (se hai dei backlink di qualità è un pò come essere raccomandati alla TV da Pippo Baudo
)
Questo detto da un principiante del posizionamento!