- Home
- Categorie
- Digital Marketing
- Consigli su Penalizzazioni e Test SEO
- Url e script inesistenti nel dominio
-
Url e script inesistenti nel dominio
Ciao a tutti,
vi vorrei segnalare questa situazione che ho trovato relativa al dominio acquaricadilecce.it.
Nel log di accesso che ho implementato per monitorare gli errori ho trovato questo link acquaricadilecce.it/Default.asp?modulo=partita&id_partita=32&id_campionato=2.
Alcune precisazioni: fino al 2006 il sito è stato implementato in asp ed esisteva una pagina default.asp, attualmente è implementato con lo Zend Framework in php.
Come è possibile che viva ancora questo link su google e lo ritrova tra i risultati di ricerca?Grazie per l'attenzione e a chi mi saprà illuminarmi su questa situazione
-
Ciao Tanieli07 e benvenuto del Forum GT!
Se non espressamente indicato Google conserva per parecchio tempo, talvolta anni, gli url delle pagine indicizzate.
Controlla nel tuo log l'identificativo dell'User Agent che ha richiesto l'url (Googlebot?) per verificare che sia stato effettivamente uno spider a richiedere quella pagina e non un utente reale (che per esempio l'aveva salvata nei sui link "preferiti").
Controlla inoltre lo status HTTP restituito dal tuo web server a quella richiesta (dovrebbe essere 404-File Not Found).Saluti
-
La riga del log è questa
2009-06-16T08:32:56+02:00 ERR (3): ERROR - Errore 0: accesso URL acquaricadilecce.it/Default.asp?modulo=partita&id_partita=32&id_campionato=2 - xxx.xxx.xxx.xxx - Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1)
quello che vedi scritto dopo l'indirizzo IP è il valore della variabile HTTP_USER_AGENT
Saluti
-
Come previsto non si tratta di Google, ma di un visitatore che utilizza Windows XP con Internet Explorer 6.0
il web Server ha risposto non con 404 ma con un errore perchè non è in grado di supportare il tipo di file richiesto (*.asp)
Il visitatore ha richiesto quell'url o perchè lo aveva salvato (bookmark) o perchè è ancora nell'indice di Google. Controlla tutti gli url indicizzati attraverso il comando google:
***site:www . tuodominio . it ***(senza spazi)
e nel caso utilizza i tools del "Google WebMaster Central" per indicare a Google url inesistenti.Ciao
-
Ho provato a togliere la pagina asp indicata, pero' il tool di google mi ha negato la rimozione con questa motivazione
"La tua richiesta è stata respinta in quanto il webmaster del sito non ha applicato il file robots.txt o i metatag corretti per impedirci di indicizzare o archiviare la pagina. Contatta il webmaster di questo sito oppure seleziona un'altra opzione di rimozione dallo strumento per la richiesta di rimozione di pagine web"Il problema è che quel link io non l'ho mai avuto e implementato in quanto i contenuti del sito erano uguali a quelli che ci sono adesso.
Daniele
-
La pagina di gestione "documento non trovato" che hai implementato restituisce lo status HTTP 200 (ok).
Ciò non è corretto dovresti farle resituire il codice 404 (file not found).
In questo modo Google la eliminerà dall'indice (oppure tramite il file robots.txt) automaticamente dopo qualche giorno o dietro segnalazione al Webmaster Central.
-
Hai inviato una sitemap del sito aggiornata a google?
-
Il sito è aggiornato a livello di sitemap.
Resta il dubbio di come Google abbia indicizzato il link non avendo più script asp da molti anni e il server dell'hosting attualmente è linux