- Home
- Categorie
- Digital Marketing
- Google Search Console e Altri Strumenti
- Modifica robots.txt con wildcard
-
Di nulla
Se hai altri problemi usa pure il forum
Ciao
Enea
-
In effetti avevo già aperto un thread (Sviluppo e Gestione siti --> web Scripting lato client --> Ottimizzazione caricamento script) ma forse l'ho farcito troppo...
Che dici?
Ciao!
-
Ciao Enea,
scusa ancora il disturbo...ma ho cercato qualche informazione su internet e non sono riuscito a farmi un'idea precisa:
la compilazione del robot.txt sostituisce la presenza dentro il codice della pagina del meta robot ad esempio <meta content='index,follow' name='robots'/> ?
Te lo chiedo perché ho notato che in una delle pagine che dovrebbero ora dovrebbero avere il disallow come da robot.txt, guardando le informazioni della pagina hanno invece un index,follow
grazie del chiarimento
-
Ciao ZombieKB,
in teoria il robots dovrebbe essere il primo file che il crawler legge, ad ogni modo che sia bloccata in un modo o nell'altro (sempre in teoria) non dovrebbe considerare quella pagina.Ciao
Enea
-
Ciao
Quindi posso rimuoverli tranquillamente? Non vorrei che mi creassero conflitti...
Grazie!
-
Prima di rimuoverli segui la procedura corretta
Ciao
Enea
-
...che sarebbe?
Thanx
-
Scusa ancora...mi sono accorto di una cosa curiosa, nel codice del template ho queste cose
Appena subito sotto l'apertura dell' <head> ho questo:
<b:if cond='data:blog.pageType == "archive"'> <meta content='noindex,noarchive' name='robots'/> </b:if>
poco più sotto questo:
<meta content='index,follow' name='robots'/>
E' esattamente quello che è specificato nel robots.txt giusto?
-
Il primo codice dice di non indicizzare e non archiviare il contenuto della pagina (hai presente la cache di google? Quella!)
Il secondo invece dice di indicizzare e seguire i link.A prescindere da ciò che hai nel robots una delle due righe va eliminata, tieni quella che è più utile in quel caso specifico.
Ciao
Enea
-
Grazie 1000 Enea
Prezioso come sempre!
Ciao