- Home
- Categorie
- Digital Marketing
- Posizionamento Nei Motori di Ricerca
- ERRORI 404: Come bloccare determinati URL?
-
ERRORI 404: Come bloccare determinati URL?
Salve a tutti, ho un quesito da porre. Il mio sito web contiene degli URL dinamici che variano giornalmente generando degli errori 404.
Gli URL hanno la seguente forma:
miosito.it/miadirectory/?v=1234&id=567
miosito.it/miadirectory/?v=456&id=678
miosito.it/miadirectory/?v=789&id=012Come si può notare, gli URL variano da ??v=? in poi. Ho inserito quindi una regola nel file robots.txt al fine di evitare che lo spider di Google segua questa forma di URL.
La regola è la seguente:
Disallow: /miadirectory/?*
Nonostante ciò sul pannello di Google per i Webmaster continuo a riscontrare errori 404 generati da questo tipo di URL.
Qualcuno sa dirmi come mai? Sbaglio qualcosa nel settare il file robots?
Grazie anticipatamente per un eventuale aiuto.
-
Ciao darkos1,
ti conviene aggiungere il meta tag noindex nelle varie pagine web da te elencate (support.google.com/webmasters/bin/answer.py?hl=it&answer=156449).
Inoltre mi sa che hai sbagliato a scrivere la regola, l'* va prima del ?.
-
Ciao Darkos1,
ha ragione morettolss.
La sintassi corretta è:Disallow: /miadirectory/*?
Ciao Seocolli.
-
Nelle pagine in questione avevo già inserito il tag noindex, mi sono dimenticato a specificarlo all'inizio del post... Correggerò il robots.txt...
Grazie mille per i consigli!
-
Fai attenzione darkos1, se inserisci il tag noindex come ti ha suggerito morettolss non devi bloccare il passaggio del crawler di Google disabilitandolo nel file robotx.txt, ovvero, se tu impedisci a Google di passare dalle tue pagine, come può leggerne il noindex?
Valerio Notarfrancesco
-
vnotarfrancesco, quale soluzioni mi consigli allora? tag noindex o blocco dal robots.txt?
-
Se vuoi bloccare l'indicizzazione segui il consiglio di morettolss, quindi tag noindex.
Io però vedrei di capire cosa sono quelle pagine che vengono generate e cos'è il parametro v.Valerio Notarfrancesco
-
francesco,grazie nuovamente per la risposta.
"miosito.it/miadirectory/?v=1234&id=567" é un link ad un iframe dove é presente il codice html di un player video.
Questi player video sono stati ripetutamente utilizzati da altri siti senza la nostra autorizzazione. Abbiamo quindi escogitato questa nuova forma di URL dove il parametro "?v=" varia dinamicamente ogni giorno. In questo modo se l'URL viene copiato, il giorno dopo il parametro "v=" cambia mostrando all'utente una "pagina morta".
-
Ha ragione Valerio, non avevo precisato che non dovevi più inserire il disallow nel robots.
Per cui ti conviene mettere il noindex, così l'url non compare nei risultati di ricerca.