• User

    E' un problema di Xmap?

    Salve a tutti.
    Sono ormai un paio di mesi che il mio sito è online. Il sito è creato con joomla e per la sitemap utilizzo xmap.

    Andando ad analizzare il mio sito con gli strumenti di google webmaster mi sono accorto che nella sezione diagnostica--->scansione web mi viene evidenziato che ho 75 pagine non trovate da parte di googleboot. Praticamente tutto il sito. Ma le pagine che googleeboot non ha trovato, in effetti non dovrebbero esistere avendo esse al loro interno l'estensione index.php.

    Per il mio sito ho utiizzato sh404sef proprio per togliere" di mezzo" index.php che si presentava dopo il nome del dominio.

    La cosa particolare è anche le pagine, diciamo quelle ottimizzate con sh404sef senza index.php, sono indicizzate senza alcun problema.

    Secondo voi quale è il problema?
    Devo fare un redirect di tutte le pagine non trovate?
    Vuol dire che ad ogni pagina che faccio nuova devo predisporre un redirect poichè googleboot legge anche l'index.php?

    ... forse la soluzione migliore sarebbe quella che mi aiutaste a capire come far sparire agli occhi di googleboot le url con all'interno l'index.php.
    Grazie


  • User Attivo

    Ciao montanaro,
    non ho capito bene il tuo problema.
    Potresti farci un esempio di una pagina che non deve essere indicizzata?
    Grazie.


  • User

    hai ragione lorenzo...:

    A-Pagina originale
    h**p://*ww.miosito.com/index.php/case/meteo.html
    (Questa è la pagina creata originariamente durante lo sviluppo del mio sito con joomla)

    B-Pagina modificata una volta applicato plugin sh404sef
    h**p://*ww.miosito.com/case/meteo.html
    (Questa è la pagina creata con sh404sef e giustamente sparisce index.php)

    Googleboot:La pagina A mi viene indicizzata normalmente ma allo stesso tempo mi viene indicizzata anche la pagina B. Ovviamente nel momento in cui vado ad esaminare con gli strumenti di google webmaster mi sono accorto che nella sezione diagnostica--->scansione web mi viene evidenziato che le pagine all'interno delle quali c'è index.php, pagine tipo B... danno errore 404 poichè non posso essere visualizzate.

    Secondo Voi da cosa dipende?
    Perchè googleboot mi vede anche le pagine con l'index.php che non esistono?
    ...spero di essere stato più chiaro...
    gabriele


  • User Attivo

    Ciao montanaro,
    hai provato a vedere se per caso alcuni link nella index.php sono rimasti nel formato A.
    Prova anche ad utilizzare uno strumento esterno per generare la sitemap per vedere se da lo stesso tipo di errore. Guarda qui.
    Facci sapere.


  • User

    ottimo suggerimento quello di utilizzare altri strumenti al fine di esaminare il problema...

    ma...

    1-usato tool on line di internet i file le url con index.php non vengono evidenziati....
    2- come suggerito utilizzando nella ricerca google site:miosito.it ho potuto analizzare che la stessa pagina viene visualizzata sia con che senza l'index.php nell'url.(quella con index.php mi da errore 404)

    ... veramente non so da che parte prendere...

    domanda: se nel file robot.txt inserisco il disallow?
    Disallow: /index.php/
    grazie ancora Lorenzo
    il tuo incubo dalle montagne del Trentino:o
    Gabriele


  • User Attivo

    Ciao montanaro,
    non sei affatto un incubo anzì mi spingi a risolvere il tuo problema 🙂 (mi aiuti a crescere).

    A questo punto ti consiglio di caricare la sitemap.xml creata con il tool e utilizzare il google webmaster central per segnalarla.

    Per quanto riguarda il Disallow: /index.php/ non so fino a che punto serva cmq potrebbe essere una idea ma non so se ti crea problemi.