• User

    errori in strumenti webmaster

    Ciao a tutti spero mi aiutate in questo problema.Ho un blog da circa un mese,in strumenti per webmaster ho 1397 url inviati e 259 nell indice web...ora mi sono accorto che in errori di scansione mi dice sul "non trovato" 2682 !! Non capisco cosa sia successo...allego il mio file di robots:
    Disallow: /wp- Allow: /wp-content/uploads/

    e lhtaccess:

    BEGIN WordPress

    <IfModule mod_rewrite.c>
    RewriteEngine On
    RewriteBase /
    RewriteRule ^index.php$ -
    RewriteCond %{REQUEST_FILENAME} !-f
    RewriteCond %{REQUEST_FILENAME} !-d
    RewriteRule . /index.php
    </IfModule>

    END WordPress

    Mi aiutate per favore? Va bene cosi o gli errori sono troppi?


  • Moderatore

    Ciao Dumyilblog e Benvenuto sul forumGT,
    in GWT (google webmaster tools) oltre al numero di errori ti dovrebbe anche far vedere quali url danno l'errore e da quali pagine sono linkati, vedi se le url con errore sono pagine reali navigabili.

    Il file htaccess è corretto poichè è quello di default di WP.

    Il file robots è incompleto, per wp bisogna aggiungere altre righe per evitare che indicizzi pagine non utili per l'utente finale, copia il seguente codice nel file robots.txt, non devono esserci spazi fra una riga e l'altra:

    #Configurazione per  wordpress
    User-agent: *
    Disallow: /wp-
    Allow: /wp-content/uploads/
    Disallow: /trackback/
    Disallow: /feed/
    Disallow: /comments/
    Disallow: */trackback/
    Disallow: */feed/
    Disallow: */comments/
    Disallow: /*?
    #Disallow: /tag/: /category/: /date/
    

    Le ultime tre voci sono commentate con # (ovvero è come se non ci fossero), in alcuni casi è utile decommentarle per evitare contenuti duplicati, per ora le puoi lasciare così poi in futuro vediamo se decommentare o meno.

    Ciao
    Enea


  • User

    Ok grazie...solo una cosa, ho copiato quello che hai dato tu nel file robots della root con filezilla ok? E per quanto riguarda la configurazione del file robots in strumenti per webmaster?.... Scusa ma sono un po....
    Ed inoltre non ti sembrano poche le url indicizzate? 250 su 1400? Eppure se faccio site:dumy.it mi escono fuori più di 1000 risultati.....booo.


  • Moderatore

    Nel GWT non devi configurare il robots, ci pensa googlebot a prelevarlo quando passa.
    Il sito è giovane (un mese) quindi è possibile che non siano indicizzati tutti gli URL.

    Il GWT non è aggiornato in tempo reale, quello che vedi sono dati vecchi.

    Volendo puoi aumentare le scansioni di googlebot dal pannello di controllo del GWT.

    Ciao
    Enea


  • User

    Ok tante grazie sei gentilissimo... Ma scusa come si fa' ad aumentare le scansioni di googlebot? Ho visto ma non ho capito come si faccia... Ah vedo solo ora... Persiceto ed io Anzola... Paesani 🙂


  • Moderatore

    Nel pannello di controllo del GWT

    Configurazione sito > impostazioni

    Metti la spunta su "Imposta velocità di scansione personalizzata" ed aumenti un po' (non esagerare).

    Siamo vicini 🙂


  • User

    @overclokk said:

    Ciao Dumyilblog e Benvenuto sul forumGT,
    in GWT (google webmaster tools) oltre al numero di errori ti dovrebbe anche far vedere quali url danno l'errore e da quali pagine sono linkati, vedi se le url con errore sono pagine reali navigabili.

    Il file htaccess è corretto poichè è quello di default di WP.

    Il file robots è incompleto, per wp bisogna aggiungere altre righe per evitare che indicizzi pagine non utili per l'utente finale, copia il seguente codice nel file robots.txt, non devono esserci spazi fra una riga e l'altra:

    >#Configurazione per  wordpress
    User-agent: *
    Disallow: /wp-
    Allow: /wp-content/uploads/
    Disallow: /trackback/
    Disallow: /feed/
    Disallow: /comments/
    Disallow: */trackback/
    Disallow: */feed/
    Disallow: */comments/
    Disallow: /*?
    #Disallow: /tag/: /category/: /date/
    >```Le ultime tre voci sono commentate con # (ovvero è come se non ci fossero), in alcuni casi è utile decommentarle per evitare contenuti duplicati, per ora le puoi lasciare così poi in futuro vediamo se decommentare o meno.
    
    Ciao
    Enea
    Ciao e grazie di tutto...ho messo il robots.txt come mi hai detto tu ed ora ho visto che mi ha aggiunto 5 url ma mi da' una voce in errori di scansione:
    Soggetto a restrizioni da robots.txt 18.387
    guardando questi url vedo che sono tutti in lingua estera...ovvero tipo
    tag occupazione ?lang=nl
    va bene cosi?

  • Moderatore

    tag occupazione ?lang=nl
    Usi un plugin come traduttore che genera quelle pagine?


  • User

    Ciao si uso Transposh Filtro per Traduzioni un plugin lo ho messo in alto sulla sidebar... ed in piu' ora sono salite a 36000 le url che nn trova inSoggetto a restrizioni da robots.txt.


  • User

    Nessuno che mi aiuta?:bho:...da quando ho messo quel robots mi indicizza sempre meno url su google...ora sono a 288 e la settimana scorsa a 285.....


  • Moderatore

    Per i link che trovi in "soggetto a restrizione da robots.txt" non ti devi preoccupare se sono pagine non utili al motore di ricerca, in quel robots infatti ci sono solo le cartelle di sistema di WP (e alcne altre che ti evitano contenuti duplicati), in ogni caso se noti che una riga di codice ti blocca degli url importanti per gli utenti e quindi vuoi che google ti indicizzi basta semplicemente che metti allow al posto di disallow oppure la elimini.

    Per le url che non trova il discorso è diverso, da quali pagine viene segnalato l'errore?

    Google ha bisogno di tempo per indicizzare tutti i contenuti, specie se sono tanti come nel tuo caso.

    Ciao
    Enea


  • User

    Ecco grazie...negli url nn trovati mi da 3000 e passa collegamenti ,un esempio e' questo:dumy.it/2011/traduciamo-il-nostro-blog-wordpress-in-60-lingue/[email protected] -- che se gli clicco sopra mi da' 404 non trovato...giuro che sto impazzendo...ho tolto il plugin delle traduzioni...meglio?


  • Moderatore

    Quella url infatti finisce con @gmail . com è normale che non funzioni, controlla da quale pagina è generata e perchè succede questo.

    Il plugin non importa disattivarlo a meno che non ti dia dei problemi quando crea le traduzioni, controlla anche quello, guarda la url della pagina tradotta.

    Ps: Mi raccomando comincia i post con la maiuscola come dice il regolamento al punto 3.2


  • User

    ...Grazie dei consigli..l'unica cosa che posso dire e' che quell indirizzo email lo uso solo per facebook..per condividere post sulla bacheca...quindi non capisco cosa dovrei disattivare...:?


  • Consiglio Direttivo

    Salve Dumyilblog,
    il moderatore oltre a correggere ogni suo post le ha anche ricordato, nel suo ultimo post, che come da regolamento si richiede l'uso delle maiuscole ad inizio frase, anche per un cordiale convivere e per dare una migliore lettura a tutta l'utenza del Forum GT, come sarebbe gradito tra l'altro, e comunque contro il regolamento che lei ha accettato all'atto della sua iscrizione al Forum, evitare l'uso dello style SMS e dei QUOTE poco utili.

    Spero in un proficuo continuo di questa interessante discussione che tornerà di certo utile a molti altri utenti.

    Saluti.
    :ciauz: