Ciao mergesort,
@mergesort said:
è possibile che lo spider di google abbia indicizzato una serie di pagine del mio sito che non sono linkate internamente da nessuna parte?
forse la cosa che non mi è chiara è se lo spider procede seguendo link dalla home e così via oppure scansiona tutto quello che trova anche se sono url non linkati da nessuna parte?
Lo spider procede seguendo link dalla home, o da altri siti, e così via.
Non mi è molto chiaro cosa intendi con 'scansiona tutto quello che trova'. Per trovare qualcosa dovrebbe comunque potervi accedere, e per quanto ne so Apache (per esempio) consente l'accesso alla pagina web solo con l'url esatto, altrimenti restituisce pagina non trovata o forbidden (almeno in assenza di direttive specifiche).
Pertanto mi pare che, anche scansionando tutto quello che trova, se una pagina non è linkata internamente (e neppure dall'esterno) lo spider non dovrebbe avere modo di trovarla.
Ti è possibile indicare il nome del sito (senza www) e della pagina in questione?
@mergesort said:
c'è un limite alla quantità di pagine che possono venir indicizzate? in questo caso in base a quale criterio vengono escluse determinate pagine?
No, non mi risulta che ci siano limiti prefissati.