• User Attivo

    Errori Strumenti Google

    Ciao a tutti,
    Ho scaricato negli strumenti di Google per il Webmaster la sitemap generata con GSiteCrawler ed ora Google mi ritorna 4 errori di URL non trovato.

    Il problema è che non mi sembra ci siano, o per lo meno non riesco a trovarli.
    Le pagine sono perfettamente visibili a tutti i link che dovrebbero identificarle.
    Ho provato per sicurezza anche a scaricare tutte le pagine oggi esistenti sul sito e poi a fare una ricerca di testo, ma non vedo nulla di anomalo.

    Sarebbe utile che Google dicesse almeno dove ha identificato questi URL
    Così potrebbero essere ovunque e ci sono più di 40 pagine.

    Per vostra informazione

    • GSite Crawlwr è l'ultima versione scaricata pochi giorni fa.
    • In precedenza avevo già generato un'altra site map che avevo dato in pasto a Google e non furono segnalati errori.
    • Di recente ho modificato il contenuto e non mi pare di aver aggiornato i link.
    • Il menu con i link alle pagine è dentro il codice Javascript e quello non l'ho modificato di sicuro, quindi l'errore (se c'è) è nei link a piede pagina, però ho fatto un copia incolla tra le pagine. Se ci fosse un errore ci sarebbe dappertutto ed invece sta funzionando tutto per bene.

    Qualche suggerimento?
    Grazie

    Tiger


  • User Attivo

    @WhiteTiger said:

    Il problema è che non mi sembra ci siano, o per lo meno non riesco a trovarli.
    A cosa ti riferisci ? Agli errori o agli URL ?

    @WhiteTiger said:

    Sarebbe utile che Google dicesse almeno dove ha identificato questi URL
    Così potrebbero essere ovunque e ci sono più di 40 pagine.
    Potrebbero anche essere linkate dall'esterno...

    @WhiteTiger said:

    GSite Crawlwr è l'ultima versione scaricata pochi giorni fa.
    Perché ti ostini a scrivere il software utilizzato per la creazione della sitemap ? Se lo avessi fatto con il notepad, gli errori sarebbero stati probailmente gli stessi...

    @WhiteTiger said:

    Qualche suggerimento?

    Gli errori nella sezione Diagnostica/Scansione Web si dividono in

    • Non trovato
    • Timeout degli URL
    • URL limitati da robots.txt
    • URL non raggiungibili
    • URL non seguito

    Tu ti riferisci proprio a Non trovato ? In tal caso:

    • clicca sul link e vedi qual è l'URL non trovato
    • ricontrolla se nella sitemap c'è un collegamento a tale pagina
    • ricontrolla se nei link interni al sito c'è un collegamento a tale pagina
    • tramite servizi per trovare i link in entrata al tuo sito, controlla se qualche sito ti linka la pagina inesistenteSe non riesci a trovare nulla, crea la pagina che risulta inesistente; a questo punto puoi fare due cose:
    • fai un redirect permanente verso un'altra pagina del sito (meta refresh (se html), httpd (se IIS), htaccess (se apache), response.setheader... (se asp) etc.
    • la riempi con i testi adatti

  • User Attivo

    GSiteCrawler, nella stessa cartella dove ti salva la sitemap, in caso di errore (cioè pagine non trovate, errore 404) ti crea un file txt con scritto l'url non raggiungibile e dove è linkato, controlla direttamente lì


  • User Attivo

    Ciao WhiteTiger,

    se il problema è un errore di 404 (pagina non trovata) ed in realtà la pagina esiste (e restituisce quindi un 200 - status ok), si tratta di una sfortunata coincidenza. Con molta probabilità lo spider di google è passato in un momento di down del server. In questo caso non preoccuparti, il problema si risolve da solo.

    Se si tratta di pagine inesistenti, invece, il problema è di altra natura e come accennava francesco potrebbe trattarsi di errati link esterni (BL) od interni al sito.
    Prima di costruire la sitemap con GSitecrawler (occhio al file di log sugli errori), prova a passare lo Xenu, un programma molto carino che simula lo spider di google.

    Se il problema persiste riscrivici,

    Andrea Serravezza


  • User Attivo

    @gaiodedu said:

    se il problema è un errore di 404 (pagina non trovata)...
    Oh oh, guarda chi si vede:ciauz: ...argomento interessante eh ? :vai:

    @gaiodedu said:

    Con molta probabilità lo spider di google è passato in un momento di down del server
    In quel caso non sarebbe indicato tra Timeout degli URL o URL non raggiungibili ?


  • User Attivo

    @gaiodedu said:

    se il problema è un errore di 404 (pagina non trovata) ed in realtà la pagina esiste (e restituisce quindi un 200 - status ok), si tratta di una sfortunata coincidenza. Con molta probabilità lo spider di google è passato in un momento di down del server.

    ti sbagli, a me è successo pochi giorni fa, server momentaneamente down, sul GWT le pagine non raggiungibili venivano indicate con errore 500


  • User Attivo

    Intanto ringrazio tutti per il loro intervento.
    Cerco di dare qui una risposta complessiva.

    Il messaggio di errore riportato nei Google tools è 404 (non trovato.
    Le pagine indicate proprio non esistono, la struttura è infatti diversa.
    qielle pagine stanno nella sottocartella A e Gogle le da presenti nella sottocartella B quindi non penso sia colpa di un down temporaneo.
    D'altra parte non riesco a capire dove possa essere questo link sballato.

    Nel menu no, primo perchè è uno solo per tutto il sito e poi perchè... funziona.

    Nei link a piè di pagina neppure, perchè con il copia incolla li ho messi dappertutto ed anche questi funzionano.

    Insomma, tutti i link sul sito funzionano, a meno che me ne sfugga qualcuno.
    E visto che le pagine segnalate, in quelle cartelle, non esistono sarei portato a fregarmene, ma mi scoccia che Google mi dica che c'è qualcosa che non va.

    L'unico dubbio è che interpreti male i "../.." presente nei link però è strano visto che prima funzionava tutto.

    Scaricato il sito direttamente da Internet (per non fidarmi di quello sul PC) ho lanciato una ricerca su tutte le pagine alla ricerca del testo contenente la stringa errata, ma non è emerso nulla.

    Mah... vorrà dire che mi metterò qui con pazienza a leggere l'html pagina per pagina a vedere dove cacchio sia l'inghippo.

    Ah... dimenticavo, GCrawler l'ho scaricato perchè mesi fa leggendo il forum lo si suggeriva proprio per realizzare velocemente le sitemap 🙂
    Non mi ha generato errori.

    Grazie ancora.


  • User Attivo

    @fdaguanno said:

    Oh oh, guarda chi si vede:ciauz: ...argomento interessante eh ? :vai:

    Ciaooo :ciauz: sì, direi molto interessante 😉

    In quel caso non sarebbe indicato tra Timeout degli URL o URL non raggiungibili ?

    Sì ma il nostro amico non era stato chiarissimo e non volevo precludermi la strada del "down del server" purtroppo molto frequente.

    Il messaggio di errore riportato nei Google tools è 404 (non trovato.
    Le pagine indicate proprio non esistono, la struttura è infatti diversa.
    qielle pagine stanno nella sottocartella A e Gogle le da presenti nella sottocartella B quindi non penso sia colpa di un down temporaneo.
    D'altra parte non riesco a capire dove possa essere questo link sballato.

    Nel menu no, primo perchè è uno solo per tutto il sito e poi perchè... funziona.

    Nei link a piè di pagina neppure, perchè con il copia incolla li ho messi dappertutto ed anche questi funzionano.

    Sicuramente quelle url le prende da link esterni, specie se il gsitecrawler non li trova. Se sei su server unix based ti consiglio un redirect 301 da url casrtella-A a url cartella-B

    Ciao,

    Andrea


  • Super User

    se io linko una pagina che non esiste sul vostro sito Google come si comporta? prende un 404, e secondo me cerca di fare un favore all'utente segnalandoglielo su GWT.


  • User Attivo

    @Tambu said:

    se io linko una pagina che non esiste sul vostro sito Google come si comporta? prende un 404, e secondo me cerca di fare un favore all'utente segnalandoglielo su GWT.
    Io su GWT ho degli url non trovati che nella struttura di link interna non esistono. Immagino che siano link esterni, quindi penso che, come dici tu, Google mi fa un favore segnalando la cosa.

    Si potrebbe mettere in piedi un test...


  • User Attivo

    @gaiodedu said:

    Sicuramente quelle url le prende da link esterni, specie se il gsitecrawler non li trova. Se sei su server unix based ti consiglio un redirect 301 da url casrtella-A a url cartella-B

    Uhmmm, il sito in questione è talmente poco diffuso e relativamente nuovo che dubito che ci siano delle pagine esterne linkate male.
    e poi, bisognerebbe capire come sia stato possibile.
    Quelle pagine non sono mai state spostate dalla cartella iniziale, quindi il riferimento (ammesso che ci sia) non poteva essere errato.

    Forse però non mi sono spiegato bene io.
    Dando per scontato che la segnalazione c'è e volendo ammettere che l'errore sia correttamente segnalato, c'è qualche strumento per verificare dove possa annidarsi e che non sia il doversi leggere il codice pagina per pagina o lanciare una "volgare" ricerca di stringhe sulla pagine contenute nella cartella (e sottostanti) ?

    Grazie ancora


  • User Attivo

    @WhiteTiger said:

    ...che dubito che ci siano delle pagine esterne...Confermo quanto detto in precedenza, ora ho le prove.
    Ho linkato tramite commento ad un post di un blog molto trust una pagina inesistente del mio blog. Dopo neanche una settimana tale pagina l'ho trovata tra gli URL non trovati di GWT.

    @WhiteTiger said:

    ...c'è qualche strumento per verificare dove possa annidarsi...Per averne la certezza devi obbligatoriamente cercare in ogni pagina del sito; non ti dico di navigarlo da web, ma di scaricarlo in locale con un software apposito e poi di fare la ricerca da file system.


  • User Attivo

    @fdaguanno said:

    Ho linkato tramite commento ad un post ...

    ...

    poi di fare la ricerca da file system.

    Per l'appunto, l'hai linkato tu!
    Io le pagine in questione non le ho mai messe da nessun'altra parte e men che meno le ho linkate.
    Dubito perciò che anche altri lo abbiano fatto.

    Visto che il percorso è relativo, con i "../../" è più probabile un errore che d'altra parte non riesco a trovare.
    Pazienza...

    L'importante è che il menu ed i link principali funzionino.
    Se gli errori saltano fuori, bene, altrimenti... Amen.

    Per me il caso si chiude qui.
    Grazie di tutto a tutti.