• User

    home page sparita dall'indicizzazione

    Ciao a tutti,
    mi sono accorto che la mia home page è sparita dall'indicizzazione di Google improvvisamente.
    Cosa può essere successo?
    Il mio robots è michelepierri . it / robots.txt , ma non mi sembra che sia questo il problema.

    Google Webmaster, cliccando su Scansione -> url bloccati mi riporta improvvisamente un robots bianco, e se testo l'indirizzo michelepierri . it riporta:
    [TABLE="width: 1062"]

    [TD="class: col-googlebot"]Rilevato come directory; file specifici possono avere diverse limitazioni[/TD]
    [TD="class: col-useragent"][/TD]
    [/TR]
    [/TABLE]
    La mia sitemap è invece michelepierri.it / sitemap.xml

    Cliccando su Visualizza come google, e provando a inserire l'home page ho questo errore:

    Googlebot ha recuperato la pagina in questo modo.URL: http : // www . michelepierri . it/
    Data: martedì 13 agosto 2013 12:48:43 GMT-7
    Tipo Googlebot: Web
    Tempo di download (in millisecondi): 459

    HTTP/1.1 403 ForbiddenServer: cloudflare-nginxDate: Tue, 13 Aug 2013 19:48:44 GMTContent-Type: text/htmlTransfer-Encoding: chunkedConnection: keep-aliveSet-Cookie: __cfduid=d4fe53b53eb3b3f55610ec33f50a5d12f1376423324485; expires=Mon, 23-Dec-2019 23:50:00 GMT; path=/; domain=.michelepierri . itVary: User-AgentCache-Control: private, no-cache, no-store, must-revalidate, max-age=0Pragma: no-cacheCF-RAY: 9d7ecb1f40205b5Content-Encoding: gzip<html><head><script type="text/javascript">var NREUMQ=NREUMQ||[];NREUMQ.push(["mark","firstbyte",new Date().getTime()]);</script><title> 403 Forbidden</title></head><body><h1> 403 Forbidden</h1>
    Access to this resource on the server is denied!<script type="text/javascript">if(!NREUMQ.f){NREUMQ.f=function(){NREUMQ.push(["load",new Date().getTime()]);var e=document.createElement("script");e.type="text/javascript";e.src=(("http:"===document.location.protocol)?"http:":"https:")+"//"+"js-agent.newrelic.com/nr-100.js";document.body.appendChild(e);if(NREUMQ.a)NREUMQ.a();};NREUMQ.a=window.onload;window.onload=NREUMQ.f;};NREUMQ.push(["nrfj","beacon-1.newrelic.com","1b473294f5","550561","M1QBYUMCDUAEWkRfWgoeNkdYTAVcF0xdGUMGQgZaHxMLQw==",0,47,new Date().getTime(),"","","","",""]);</script></body></html>

    Non so cosa sia successo.
    Grazie in anticipo.


  • User

    Penso di aver capito che sia colpa di questo modulo:

    Turn off mod_security filtering.

    mod_security.c
    SecFilterEngine Off

    Infatti se lo disabilito in htaccess con

    Turn off mod_security filtering.

    <IfModule mod_security.c>
    SecFilterEngine Off
    </IfModule>

    Google Bot riesce a scansionare la directory senza alcun errore.
    Cosa sta succedendo? Non mi era mai capitato.

    Grazie.


  • Admin

    Forse il tuo mod_security è configurato male e blocca l'accesso a Googlebot.