- Home
- Categorie
- La Community Connect.gt
- Tutto sulla Community
- Principiante: passaggio google bot
-
Ciao e Benvenuto,
per vedere il passaggio dello spider guardando i file log devi prima conoscere il nome degli spidern
qua una lista di spider
http://www.robotstxt.org/wc/active/html/index.html
Altrimenti usi alcuni programmi come phpstats ultima versione che individua gli spider sulle pagine php.
Leggere i log è il miglior metodo.
Per vedere se la pagina è in cache basta andare su google e cercare la pagine
-
@cracci said:
mi spieghi quali file log si debbano vedere se lo spider passa... I file di log sono di solito accedibili in una cartella esterna ed allo stesso livello di quella in cui pubblichi i file del sito con l'FTP. Ovviamente è il tuo fornitore di spazio web che deve metterteli a disposizione, per cui la cosa più semplice è che tu lo contatti e chieda informazioni precise.
@cracci said:
e come si fa a sapere se google ha caricato le pagine in cache...??Il modo più semplice è usare l'istruzione di Google
site:www.tuosito.est
per fare visualizzare a Google tutte le pagine del tuo sito inserite nel suo database, e poi per verificare la cache di quelle che ti interessano cliccare sul link "copia cache", presente per ciascuna pagina dopo dopo la descrizione.
-
per fare visualizzare a Google tutte le pagine del tuo sito inserite nel suo database
Ho visto che ha nella cache solo l'homepage. E' da poco che ho uploadato il mio sito ed ho provveduto a registrarlo nelle directory specificate nella guida e chiaramente non sarà ancora stato aggiunto. E' preoccupante che ci sia solo l'homepage in cache?
-
No, inizia sempre da quella, poi, con tempi variabili dipendenti soprattutto dalla quantità e dalla qualità dei link che puntano al sito inserisce nal DB anche le altre pagine.
Ovviamente nella home page devono esserci dei link che lo spider possa seguire.
Se avessi accesso ai file di log con delle applicazioni apposite potresti monitorare il passaggo dello spider dalla home e dalle altre pagine. Io mi sono fatto un programmino apposito... mi sa che prima o poi lo metto scaricabile sulla mia guida al posizionamento, è un pò rudimentale ma funzia.
-
Grazie per l'esauriente risposta. Però ho un dubbio. Nel mio sito, soprattutto nella pagina delle categorie delle ricette ci sono link del tipo: http://www.ricettenostrane.it/viewricetta.php?id_fls=88
come puoi vedere c'è il '?' che non posso eliminare tramite il rewrite perchè non ho accesso al file httaccess... credi sia un problema per G accedere a quelle pagine? Lo chiedo perchè quelle pagine che corrispondono alle ricette dovrebbero aumentare giorno dopo giorno e conterrebbero sempre molto testo e termini nuovi che potrebbero essere facilmente indicizzabili.Grazie
-
No, avere uno o anche due parametri passati in querystring non rappresenta più un problema per l'indicizzazione delle pagine, l'importane è che ogni pagina sia linkata esplicitamente e non soltanto attraverso risultati di ricerche o simili.
-
in ogni caso è preferibile (anche se non necessario) che le pagine dinamiche vengano linkate da pagine statiche
per esempio puoi fare così anche se è grezzo:
nel tuo sito aggiungi un blocco con dentro tutte le lettere dell'alfabeto. la lettera a la linki ad a.php...la b a b.php eccetera.
poi su a.php inserisci una pagina con tutti i link a ricette che cominciano con la a...su b.php tutte quelle con la b ecceteraè molto grezzo e ti consiglierei di farlo in cloaking oppure di mettere il blocco nel footer
-
in ogni caso è preferibile (anche se non necessario) che le pagine dinamiche vengano linkate da pagine staticheQuindi tu dici di creare una pagina con estensione html con tutte le lettere dell'alfabeto che puntano alle relative pagine dinamiche delle ricette che iniziano con quella lettera?! In questo modo lo script per il cloaking lo dovrei mettere in homepage in modo da indirizzare solo lo spider verso la pagina statica... giusto?
Altrimenti, perdona la mia ignoranza... cosa intendi per metterlo nel footer?? (forse intendi sotto il tag html??)
-
io ti direi di mettere tutte le lettere dell'alfabeto in home nel footer (ovvero in fondo alla pagina) ... magari fai in modo che vengano visualizzate solo se passa uno spider
ti faccio presente un unico inconveniente...la pagine tipo a.php b.php eccetera verranno indicizzate dai motori...quindi per risolvere il problema metti un bel cloaking pure lì: ai motori mostri le pagine normali piene di link e gli utenti che arrivano su a.php eccetera li reindirizzi sulla home
-
Scusa se faccio tutte queste domande ma, nelle pagine a.php, ecc... mi basterà scrivere due righe di codice in php e vedere se è lo spider che passa oppure no e dopodichè se è lo spider non eseguo nulla mentre se non è lo spider eseguo il redirect in javascript all'homepage. Ma per quanto riguarda la statiticità della pagina che linka... quale sarebbe la pagina statica? L'homepage è dinamica, le pagine tipo a.php sono dinamiche...quindi!?!?!? Avrò forse esagerato... ???? eheheheh
-
Ciao a tutti,
ho trovato molto interessante questo post, ma il link postato da Giorgio sembra essere rotto (robotstxt.org/wc/active/html/index.html)
Qualcuno sa fornirmene uno alternativo?
Grazie, ciao.