• User Newbie

    Certi URL della sitemap sono più visitati da Googlebot che altri

    Buongiorno a tutti,

    Ultimamente strane cose succedono nella mia sitemap e volevo chiedervi se qualcuno di voi ha un'idea del perché.

    Ecco le informazioni che servono per capire il problema:

    • Si parla di un sito che è un aggregatore di annunci la cui sitemap è stata correttamente indicizzata.
    • La lista di URL contenuti nella sitemap è rigenerata ogni giorno quindi potrebbero esserci alcuni URL che vi restano più giorni e altri che dopo un giorno vengono sostituiti.
    • Negli URL è contenuto il nome del "prodotto" di cui parla la pagina. Così, per esempio, abbiamo un ww. blablabla/....../fiat e un ww. blablabla/....../fiat+panda.it

    Ecco il problema: ci sono alcuni URL che sono nella sitemap da, per esempio, 10 giorni e che Googlebot ha visitato 10 volte e ce ne sono altri che sono là da 10 giorni ma Googlebot ha visitato solo 2 o 3 volte.
    Guardando meglio ho notato che praticamente tutti gli URL del tipo ......./fiat sono visitati regolarmente mentre quelli del tipo ......../fiat+panda sono visitati molto raramente.
    Questo comportamento è regolare.

    Ipotesi: io ne ho fatte alcune ma ho difficoltà a verificarle. Se vi interessano sono queste:

    • i "+" negli URL fanno pensare a Google che si tratti di un indirizzo dinamico.
    • visto che nella pagina ..../fiat ci sono molti più annunci (e più traffico) che nella pagina ...../fiat+panda Google la privilegia.
    • che visto che gli annunci che sono in ....../fiat+panda sono per forza anche in ....../fiat Google consideri la prima come duplicate content.

    Ringrazio già tutti per l'attenzione e mi scuso se ho scritto tanto ma penso che sia più utile mettere più dettagli possibili da subito.
    Grazie!


  • Admin

    Ciao Aquitania,

    quello che succede è abbastanza normale e in parte le ipotesi che fai sono plausibili a parte la prima.

    In realtà controlla anche come questi indirizzi si riflettono sull'architettura del tuo sito e quanto in termini di valore sono differenti le varie pagine.
    Oltre a questo hai utilizzato le priorità nella sitemap?

    Una cosa che puoi fare per capire se la tua architettura informativa rispecchia effettivamente quelle che sono per te le pagine più importanti allora cerca di ottenere i log del tuo sito isolando solo gli accessi di Googlebot (ripulendo dai fake) e capirai se c'è qualcosa di anomalo.


  • User Newbie

    Grazie mille Juanin, molto gentile.

    Si, nelle sitemap ho usato le priorità ma ma ho impostato lo stesso valore sia per gli URL meno visitati che per quelli più visitati.

    Continuo ad usare l'esempio del motore di ricerca auto/moto. Facendo l'ipotesi che il sito si chiami "macchinablabla" la sua struttura e i suoi URL sarebbero questi:

    Quindi a livello di architettura gli URL del tipo "fiat" e "fiat+panda" sono allo stesso livello.

    Non capisco bene la parte in cui parli di "valore" delle pagine. Per me gli URL della pagina "fiat" e quello della pagina "fiat+panda" sono importanti uguali perché c'è gente che sarebbe disposta a comprare una fiat qualunque e gente che invece vuole assolutamente un fiat panda. Se dovessi indicare delle pagine che per me sono meno importanti delle altre allora indicherei tutte quelle che non contengono annunci (home page, pagine sui consigli per gli acquisti o sull'attualità auto/moto, ecc.).

    C'è un'altra cosa che non so: una volta che ho ottenuto la lista dei log di Googlebot al mio sito... cosa cerco? :mmm:

    Grazie mille dell'aiuto!


  • Admin

    Aggrega le URL e cerca di capire quelle accedute con più frequenza.

    Ricorda anche che l'importanza di una risorsa non è definita solamente dal linking interno.