• Community Manager

    Ciao e Benvenuto,

    per vedere il passaggio dello spider guardando i file log devi prima conoscere il nome degli spidern

    qua una lista di spider

    http://www.robotstxt.org/wc/active/html/index.html

    Altrimenti usi alcuni programmi come phpstats ultima versione che individua gli spider sulle pagine php.

    Leggere i log è il miglior metodo.

    Per vedere se la pagina è in cache basta andare su google e cercare la pagine 🙂


  • Super User

    @cracci said:

    mi spieghi quali file log si debbano vedere se lo spider passa... I file di log sono di solito accedibili in una cartella esterna ed allo stesso livello di quella in cui pubblichi i file del sito con l'FTP. Ovviamente è il tuo fornitore di spazio web che deve metterteli a disposizione, per cui la cosa più semplice è che tu lo contatti e chieda informazioni precise.

    @cracci said:

    e come si fa a sapere se google ha caricato le pagine in cache...??Il modo più semplice è usare l'istruzione di Google

    site:www.tuosito.est

    per fare visualizzare a Google tutte le pagine del tuo sito inserite nel suo database, e poi per verificare la cache di quelle che ti interessano cliccare sul link "copia cache", presente per ciascuna pagina dopo dopo la descrizione.


  • User

    per fare visualizzare a Google tutte le pagine del tuo sito inserite nel suo database
    Ho visto che ha nella cache solo l'homepage. E' da poco che ho uploadato il mio sito ed ho provveduto a registrarlo nelle directory specificate nella guida e chiaramente non sarà ancora stato aggiunto. E' preoccupante che ci sia solo l'homepage in cache? 😞


  • Super User

    No, inizia sempre da quella, poi, con tempi variabili dipendenti soprattutto dalla quantità e dalla qualità dei link che puntano al sito inserisce nal DB anche le altre pagine.

    Ovviamente nella home page devono esserci dei link che lo spider possa seguire.

    Se avessi accesso ai file di log con delle applicazioni apposite potresti monitorare il passaggo dello spider dalla home e dalle altre pagine. Io mi sono fatto un programmino apposito... mi sa che prima o poi lo metto scaricabile sulla mia guida al posizionamento, è un pò rudimentale ma funzia.


  • User

    Grazie per l'esauriente risposta. Però ho un dubbio. Nel mio sito, soprattutto nella pagina delle categorie delle ricette ci sono link del tipo: http://www.ricettenostrane.it/viewricetta.php?id_fls=88
    come puoi vedere c'è il '?' che non posso eliminare tramite il rewrite perchè non ho accesso al file httaccess... credi sia un problema per G accedere a quelle pagine? Lo chiedo perchè quelle pagine che corrispondono alle ricette dovrebbero aumentare giorno dopo giorno e conterrebbero sempre molto testo e termini nuovi che potrebbero essere facilmente indicizzabili.

    Grazie


  • Super User

    No, avere uno o anche due parametri passati in querystring non rappresenta più un problema per l'indicizzazione delle pagine, l'importane è che ogni pagina sia linkata esplicitamente e non soltanto attraverso risultati di ricerche o simili.


  • Super User

    in ogni caso è preferibile (anche se non necessario) che le pagine dinamiche vengano linkate da pagine statiche

    per esempio puoi fare così anche se è grezzo:

    nel tuo sito aggiungi un blocco con dentro tutte le lettere dell'alfabeto. la lettera a la linki ad a.php...la b a b.php eccetera.
    poi su a.php inserisci una pagina con tutti i link a ricette che cominciano con la a...su b.php tutte quelle con la b eccetera 🙂

    è molto grezzo e ti consiglierei di farlo in cloaking oppure di mettere il blocco nel footer 🙂


  • User

    in ogni caso è preferibile (anche se non necessario) che le pagine dinamiche vengano linkate da pagine staticheQuindi tu dici di creare una pagina con estensione html con tutte le lettere dell'alfabeto che puntano alle relative pagine dinamiche delle ricette che iniziano con quella lettera?! In questo modo lo script per il cloaking lo dovrei mettere in homepage in modo da indirizzare solo lo spider verso la pagina statica... giusto? :sbav:
    Altrimenti, perdona la mia ignoranza... cosa intendi per metterlo nel footer?? (forse intendi sotto il tag html??)


  • Super User

    io ti direi di mettere tutte le lettere dell'alfabeto in home nel footer (ovvero in fondo alla pagina) ... magari fai in modo che vengano visualizzate solo se passa uno spider :fumato:

    ti faccio presente un unico inconveniente...la pagine tipo a.php b.php eccetera verranno indicizzate dai motori...quindi per risolvere il problema metti un bel cloaking pure lì: ai motori mostri le pagine normali piene di link e gli utenti che arrivano su a.php eccetera li reindirizzi sulla home 😄


  • User

    Scusa se faccio tutte queste domande ma, nelle pagine a.php, ecc... mi basterà scrivere due righe di codice in php e vedere se è lo spider che passa oppure no e dopodichè se è lo spider non eseguo nulla mentre se non è lo spider eseguo il redirect in javascript all'homepage. Ma per quanto riguarda la statiticità della pagina che linka... quale sarebbe la pagina statica? L'homepage è dinamica, le pagine tipo a.php sono dinamiche...quindi!?!?!? Avrò forse esagerato... :fumato: ???? eheheheh


  • User

    Ciao a tutti,

    ho trovato molto interessante questo post, ma il link postato da Giorgio sembra essere rotto (robotstxt.org/wc/active/html/index.html)
    Qualcuno sa fornirmene uno alternativo?
    Grazie, ciao.