- Home
- Categorie
- Digital Marketing
- Posizionamento Nei Motori di Ricerca
- Problema indicizzazione sito
-
Problema indicizzazione sito
Salve,
questo pomeriggio ho creato una sitemap con il plugin di WP "Google Sitemap Generator Plugin" e l'ho inviata a Google con lo strumento messo a disposizione all'interno di "Strumenti per i Webmaster di Google".Non appena eseguito l'invio, il tool mi ha restituito 11 messaggi, equivalenti al numero di pagine all'interno del mio portale, che recitano la seguente dicitura: "Problema: URL bloccato da robots.txt. - Descrizione: La Sitemap contiene URL bloccati da robots.txt.".
Non riesco a identificare il problema, all'interno di WP prima di procedere alla indicizzazione nella sezione privacy ho flaggato l'opzione "Permettere ai motori di ricerca di indirizzare questo sito".
Il sito è agevolazioniprimacasa.info
Attendo fiducioso un vostro aiuto. :bho:
Grazie,
Olliver
-
Caro olliver,
ho esattamente lo stesso problema, speriamo che qualcuno ci dia un soluzione perchè mi sono bloccato.
-
Ciao Olliver,
nella sezione URL bloccati di Strumenti per i Webmaster di Google nel box Contenuti di http : // agevolazioniprimacasa . info/robots.txt vedi lo stesso testo che attualmente contiene il robots.txt visibile accedendo all'url?@pasqualeDL: dovresti indicarci che tipo di url risultano bloccati e mostrarci il contenuto del tuo robots.txt
Grazie.
-
@Blays said:
Ciao Olliver,
nella sezione URL bloccati di Strumenti per i Webmaster di Google nel box Contenuti di http : // agevolazioniprimacasa . info/robots.txt vedi lo stesso testo che attualmente contiene il robots.txt visibile accedendo all'url?@pasqualeDL: dovresti indicarci che tipo di url risultano bloccati e mostrarci il contenuto del tuo robots.txt
Grazie.
Innanzitutto Blays ti ringrazio moltissimo per la risposta e per il supporto.
All'interno della sezione URL bloccati mi dice che in riferimento al link agevolazioniprimacasa.info/robots.txt non sono presenti URL bloccati, che non è MAI stata scaricata e la colonna Stato non è popolata.
Nel box sottostante, che immagino dovrebbe riportare il contenuto del file robots, non è mostrato niente, nemmeno quanto visibile accedendo all'url corretto.
-
Aggiungo un ulteriore dettaglio perchè forse può essere utile alla risoluzione del problema.
Accedendo a Strumenti per i Webmaster > Ottimizzazione > Sitemap e cliccando sul link Sitemap: /sitemap .xml si finisce in una pagina con url http: // www . agevolazioniprimacasa .info/sitemap.xml che restituisce il seguente messaggio di errore: "Errore nel caricamento del foglio di stile: Si è verificato un errore di rete durante il caricamento del foglio di stile XSLT: http: // agevolazioniprimacasa .info/wp-content/plugins/google-sitemap-generator/sitemap.xsl".
La sitemap è invece accessibile all'indirizzo http: // agevolazioniprimacasa .info/sitemap.xml che differisce da quello precedente solo per la mancanza di "www".
Sono confuso.
-
In Configurazione > Impostazioni hai settato come dominio preferito quello con il www o quello senza www?
Ti consiglio di farlo e di fare il redirect sempre verso il predefinito, dovresti risolvere così anche il problema "di confusione" tra sitemap e robots.
-
@Blays said:
In Configurazione > Impostazioni hai settato come dominio preferito quello con il www o quello senza www?
Ti consiglio di farlo e di fare il redirect sempre verso il predefinito, dovresti risolvere così anche il problema "di confusione" tra sitemap e robots.Mi dispiace continuare a stressarti. :bho:
Come da tuo suggerimento (sperando di averlo compreso appieno), sono stato costretto ad aggiungere a Strumenti per i Webmaster sia "www . agevolazioniprimacasa . info" che "agevolazioniprimacasa . info" come se fossero due siti differenti perchè altrimenti non mi faceva fare la scelta del Dominio preferito (mi dava problemi di verifica della proprietà di entrambi i domini).
A valle di questo, per entrambi i domini ho settato "Visualizza URL come ** www . agevolazioniprimacasa . info**".
Ora sorge la complicazione... accedendo agli Strumenti per Webmaster di "www . agevolazioniprimacasa . info" mi appare sottoposta n°1 sitemap, accedendo a quella di "agevolazioniprimacasa . info" non mi appare nessuna sitemap sottoposta.
Ed inolter al link http: // www . agevolazioniprimacasa . info/sitemap.xml continua a comparirmi lo stesso messaggio di errore citato nel mio post precedente.
Aiuto :bho:
-
Ciao blays e grazie per aver risposto,
allo stato attuale risultano avvisi ([LEFT]La Sitemap contiene URL bloccati da robots.txt.) [/LEFT]per tutti e 22 le pagine (ossia tutte le pagine del mio sito) contenute nella site map che ho inviato a google tramite googlewm.all'url robot.txt appare questo:
User-agent: *Disallow: /wp-admin/Disallow: /wp-includes/grazie
@Blays said:
Ciao Olliver,
nella sezione URL bloccati di Strumenti per i Webmaster di Google nel box Contenuti di http : // agevolazioniprimacasa . info/robots.txt vedi lo stesso testo che attualmente contiene il robots.txt visibile accedendo all'url?@pasqualeDL: dovresti indicarci che tipo di url risultano bloccati e mostrarci il contenuto del tuo robots.txt
Grazie.
-
@olliver said:
Mi dispiace continuare a stressarti.
Assolutamente nessuno stress
Come da tuo suggerimento (sperando di averlo compreso appieno), sono stato costretto ad aggiungere a Strumenti per i Webmaster sia "www . agevolazioniprimacasa . info" che "agevolazioniprimacasa . info" come se fossero due siti differenti perchè altrimenti non mi faceva fare la scelta del Dominio preferito (mi dava problemi di verifica della proprietà di entrambi i domini).
A valle di questo, per entrambi i domini ho settato "Visualizza URL come ** www . agevolazioniprimacasa . info**".
Ok, hai eseguito la procedura alla perfezione.
Ora sorge la complicazione... accedendo agli Strumenti per Webmaster di "www . agevolazioniprimacasa . info" mi appare sottoposta n°1 sitemap, accedendo a quella di "agevolazioniprimacasa . info" non mi appare nessuna sitemap sottoposta.
Ed inolter al link http: // www . agevolazioniprimacasa . info/sitemap.xml continua a comparirmi lo stesso messaggio di errore citato nel mio post precedente.
Aiuto :bho:
Non preoccuparti dell'errore, la sitemap non ha bisogno di fogli di stile.
Ora attendi solo che nel dominio con www appaiano le informazioni relative al tuo robots.txt (potrebbe volerci anche 1 settimana) e poi invia nuovamente la sitemap, non dovrebbe darti più problemi.
Ciao.
-
@Blays said:
Assolutamente nessuno stress
Ok, hai eseguito la procedura alla perfezione.
Non preoccuparti dell'errore, la sitemap non ha bisogno di fogli di stile.
Ora attendi solo che nel dominio con www appaiano le informazioni relative al tuo robots.txt (potrebbe volerci anche 1 settimana) e poi invia nuovamente la sitemap, non dovrebbe darti più problemi.
Ciao.Quindi (e poi scappo altrimenti mi spedisci la fattura non ho bisogno di fare il redirect verso il l'URL con WWW?
-
@pasqualeDL said:
allo stato attuale risultano avvisi ([LEFT]La Sitemap contiene URL bloccati da robots.txt.) [/LEFT]
per tutti e 22 le pagine (ossia tutte le pagine del mio sito) contenute nella site map che ho inviato a google tramite googlewm.Nel Google webmaster tools il robots.txt è stato rilevato e scaricato?
-
@olliver said:
non ho bisogno di fare il redirect verso il l'URL con WWW?
Invece si, ti consiglio di farlo.
Ciao.
-
@Blays said:
Invece si, ti consiglio di farlo.
Ciao.Credo di aver fatto qualcosa di grave...
Ho copia incollato sulla parte superiore del mio file .htaccess (accessibile da WordPress dal plugin SEO di Yoast) le seguenti righe:
RewriteEngine On
RewriteBase /
RewriteCond % ^agevolazoniprimacasa . info
RewriteRule ^(.*)$ http: // www . agevolazoniprimacasa . info /$1 [L,R=301]Ora mi viene restituito un "internal server error" e non riesco più ad accedere al sito né al pannello di controllo... ho anche provato a cancellare le suddete righe dall'.htaccess accedendo da FileZilla ma la situazione non si è restabilita....
-
@Blays said:
Nel Google webmaster tools il robots.txt è stato rilevato e scaricato?
in salute, url bloccati mi dice
[TABLE="width: 1306"][TH="class: col-url, align: left"]file robots.txt[/TH]
[TH="class: col-total-blocked, align: left"]URL bloccati[/TH]
[TH="class: col-last, align: left"]Scaricata[/TH]
[TH="class: col-status, align: left"]Stato[/TH]
[/TR][TD="class: col-url, align: left"]robots.txt[/TD]
[TD="class: col-total-blocked, align: left"]-[/TD]
[TD="class: col-last, align: left"]Mai[/TD]
[/TR]
[/TABLE]
-
Allora ti aggiorno su quanto fatto:
se digitavo dominio/robots.txt mi visualizzava un impedimento a tutti gli spider per due cartelle sulla mia rootallora sono andato su filezilla ma non sono riuscito a trovare il file robots.txt
allora ho deciso di farne uno io vuoto, e lo caricato sulla root
poi da googlewb ho reiniviato il modulo
risultato: in ottimizzazione/sitemap non mi da più nessun avviso, anzi mi dice che ho inviato 22 e indicizzato due.
però:
faccio, dalla stessa schermata il test, e mi riporta lo stesso errore di prima(ossia robots.txt blocca), anche se sulla schermata principale mi dice sempre nessun errorefaccio la ricerca da site:domino e non mi dice che sono state indicizzate
quindi?
-
@olliver said:
Ora mi viene restituito un "internal server error" e non riesco più ad accedere al sito né al pannello di controllo... ho anche provato a cancellare le suddete righe dall'.htaccess accedendo da FileZilla ma la situazione non si è restabilita....
Hai ripristinato esattamente l'.htaccess precedente? Se funzionava prima dovrà continuare a farlo.
-
@pasqualeDL said:
faccio, dalla stessa schermata il test, e mi riporta lo stesso errore di prima(ossia robots.txt blocca), anche se sulla schermata principale mi dice sempre nessun errore
faccio la ricerca da site:domino e non mi dice che sono state indicizzate
quindi?
Attendi che nel WMT il robots.txt venga correttamente scaricato ed aggiornato, poi non avrai ulteriori problemi. Anche il site ha bisogno di qualche tempo per riportare i dati aggiornati.
Ciao.
-
@olliver said:
Credo di aver fatto qualcosa di grave...
Ho copia incollato sulla parte superiore del mio file .htaccess (accessibile da WordPress dal plugin SEO di Yoast) le seguenti righe:
RewriteEngine On
RewriteBase /
RewriteCond % ^agevolazoniprimacasa . info
RewriteRule ^(.*)$ http: // www . agevolazoniprimacasa . info /$1 [L,R=301]Ora mi viene restituito un "internal server error" e non riesco più ad accedere al sito né al pannello di controllo... ho anche provato a cancellare le suddete righe dall'.htaccess accedendo da FileZilla ma la situazione non si è restabilita....
Per fortuna avevo fatto un backup del file .htaccess.
Sono riuscito a ripristinare il sito ma non a fare il redirect.
La dicitura sopra riportata è corretta?
Grazie a tutti e buona giornata
-
Allora le novità odierne:
sono tornati i 22 avvisi([LEFT]La Sitemap contiene URL bloccati da robots.txt.)[/LEFT] e questa volta li vedo anche in googlewm/ottimizzazione/sitemap, senza dover fare il test.
-
poi volevo farti una domanda: ma come faccio a capire se googlewm ha scaricato il mio file robots