    Grazie Enea...

    Nelle Sitemap ‎(2)‎
    Non raggiungibile ‎(5)‎
    Non trovato ‎(388)‎
    Soggetto a restrizioni da robots.txt ‎(2)‎
    Time out ‎(1)‎

    Il problema sono le 388 Non trovato

    la maggior parte di queste pagine erano presenti a settembre ma poi sono state eliminate e le trova riferite da pagine vecchie che sono state anche loro eliminate
    es. /de/963_hospitals/ è stato trovato in /en/963_hospitals/ e /sitemap.xml.gz il 20/set/2011 e da /fr/blo/ il 29/set/2011 che non esistono più

    sono dubbioso se devo farne un elenco e segnalarle rimuovi url..

    altre pagine (tutte le pagine che non cominciano con /it/ o en,de,fr,es) erano presenti nel vecchio sito e magari sono riferite da qualche sito web
    es. /eng/resources.htm me lo da in questa pagina www . giorgiotave . it/forum/consigli-ed-aiuti-per-il-sito/1861-gradirei-un-parere-anche-sul-mio-sito.html#post15896

    su queste pagine mi è difficile togliere i link dal sito che le richiama ma forse potrei fare un redirect 301

    poi ci sono pagine come queste... che sono nuove nuove


    richiamate da /fr/fandf-bed-and-breakfast-rome/ (pagina che non esiste) scoperta del 6 novembre

    ti allego anche elenco delle prime 100 pagine se può farti venire qualche idea


    La prima cosa da fare è creare un file robots.txt dove escluderemo le pagine non utili agli utenti come quelle di amministrazione e alcune delle pagine eliminate.
    Per fare ciò dovrai accedere via ftp e scrivere nel file esistente il seguente codice:

    #Configurazione per wordpress
    User-agent: *
    Disallow: /wp-
    Allow: /wp-content/uploads/
    Disallow: /trackback/
    Disallow: /feed/
    Disallow: /comments/
    Disallow: */trackback/
    Disallow: */feed/
    Disallow: */comments/
    Disallow: /*?
    : /tag/: /category/: /date/
    ```Se il file non esiste puoi crearlo tu con il blocco note dandogli il nome robots.txt.
    Ti spiego un po' come funziona, il simbolo serve a commentare la riga per renderla inattiva, per attivarla basta togliere il.
    In alcuni siti è ottimale non permettere l'indicizzazione di quelle tre cartelle che ho commentato per prevenire contenuti duplicati.
    Per aggiungere altre righe devi fare così:
    Esempio, tu hai questa url:


    Disallow: /fandf-bed-and-breakfast-rome/

    Invece per bloccare delle pagine (non cartelle) ometti lo / finale alla riga, per esempio ho visto che esistono degli url così:


    Disallow: /fandf-bed-and-breakfast-rome

    Non lasciare spazi tra una riga e l'altra.
    Ora procedi con questo consiglio e vediamo in questi giorni come si comporta google.
    Per quelle pagine non più esistenti che sono linkate da altri siti puoi sfruttare la popolarità del sito che ti linka creando un redirect 301 dal vecchio url ad un nuovo url, ti consiglio di ricreare una pagina con un contenuto simile a quello che avevi prima.
    Per ora procediamo così.
    Quando hai creato il file fammi vedere il codice.

    ho fatto il robots come hai suggerito
    ho messo anche
    Disallow: /tag/
    Disallow: /date/
    ma ho lasciato le categorie
    #Disallow: /category/

    poi mi dici che per bloccare
    devo fare
    Disallow: /fandf-bed-and-breakfast-rome

    ma... pensavo che
    Disallow: /*?
    mi bloccasse tutte le pagine con un punto interrogativo e mi piaceva...
    non è così?

    comunque il risultato di questa operazione dovrebbe essere che diminuiscono le pagine non trovate ma aumentano quelle bloccate da robots.txt
    è meglio così?

    #Configurazione per  wordpress
    User-agent: *
    Disallow: /wp-
    Allow: /wp-content/uploads/
    Disallow: /trackback/
    Disallow: /feed/
    Disallow: /comments/
    Disallow: */trackback/
    Disallow: */feed/
    Disallow: */comments/
    Disallow: /*?
    Disallow: /tag/
    Disallow: /date/: /category/
    Disallow: /fandf-bed-and-breakfast-rome/

    @gdatri said:

    ma ho lasciato le categorie
    #Disallow: /category/
    Ok, per ora lascia così, poi vediamo se avrai dei problemi o no.

    @gdatri said:

    ma... pensavo che
    Disallow: /*?
    mi bloccasse tutte le pagine con un punto interrogativo e mi piaceva...
    non è così?
    Si, è corretto, quel codice in questo caso è più che sufficiente, però te l'ho fatto vedere come esempio anche per altre url da eliminare in caso ce ne fosse bisogno.

    @gdatri said:

    comunque il risultato di questa operazione dovrebbe essere che diminuiscono le pagine non trovate ma aumentano quelle bloccate da robots.txt
    Si, quello è lo scopo.
    @gdatri said:
    è meglio così?
    Si, poi col tempo dovrebbero essere eliminate dall'indice di google.

    @gdatri said:

    >#Configurazione per  wordpress
    User-agent: *
    Disallow: /fandf-bed-and-breakfast-rome/
    Questo lo devi fare per tutti gli url eliminati, non solo quello che ti ho scritto io :), ne ho visti degli altri nel post di prima.

    cercherò di fare le cose che servono... anche se non le ho capite molto bene...

    ho 165 pagine nella sitemap


    me ne ritrovo 294 nell'indice


    e 388 non trovate


    Devo capire bene cosa ho già bloccato (ad esempio quelle col ?) e cosa devo bloccare... e se posso farlo senza scrivere un elenco lunghissimo... :?:?

    Ho appena rinominato robots.txt in _robots.txt perchè nel plugin che uso per la site map mi sono ricordato che c'era scritto...

    Aggiungi l'URL della sitemap al file virtuale robot.txt
    Verrà utilizzato il robots.txt virtuale generato da WordPress.
    Un file robots.txt reale NON deve esistere nella cartella del blog!

    L'ho riattivato per vedere se da problemi o se funziona tutto bene ugualmente...

  • Moderatore

    Quale plugin utilizzi per generare la sitemap?

    Ps: Mi raccomando fai attenzione al corretto uso delle maiuscole e della punteggiatura 🙂

    @overclokk said:

    Quale plugin utilizzi per generare la sitemap?

    Google XML Sitemaps for qTranslate
    This plugin will generate a special XML sitemap which will help search engines like Google, Yahoo, Bing and Ask.com to better index your blog. With qTranslate support.
    Versione | Di DSmidgy, NeoEGM, Arne Brachhold

    @overclokk said:

    Ps: Mi raccomando fai attenzione al corretto uso delle maiuscole e della punteggiatura 🙂

    Dove? :mmm:

  • Moderatore

    Ok, lo devo provare e vedere come funziona, poi ti faccio sapere.
    @gdatri said:

    Dove? :mmm:
    Erano nei post precedenti ma ora li ho corretti 🙂


    Comunque avrei deciso di aspettare un po di tempo per vedere cosa si aggiusta da solo...

    Oggi mi da solo 327 non trovato... quattro giorni fa erano 452...

    Siccome il più vecchio è del 29/set/2011 ed io ho fatto modifiche importanti il 2 ottobre... magari tra una settimana si riducono a pochi... Quelli veri... 😉

    Oggi i non trovato sono scesi a 315 😉

    Ma mi dice
    Sono stati trovati gravi problemi relativi allo stato del tuo sito.
    Controlla buono stato del sito

    Robots.txt sta bloccando pagine importanti?
    Alcune pagine importanti sono bloccate dal file robots.txt.

    segnalando questo file...

    http:// www . bbfandf . com/panorama/Wc31ed593c6acb.htm

    che neanche compare in robots.txt:?:?

    #Configurazione per  wordpress
    User-agent: *
    Disallow: /wp-
    Allow: /wp-content/uploads/
    Disallow: /trackback/
    Disallow: /feed/
    Disallow: /comments/
    Disallow: */trackback/
    Disallow: */feed/
    Disallow: */comments/
    Disallow: /*?
    Disallow: /tag/
    Disallow: /date/
    #Disallow: /category/
    Disallow: /fandf-bed-and-breakfast-rome/

  • Moderatore

    @gdatri said:

    Ho appena rinominato robots.txt in _robots.txt perchè nel plugin che uso per la site map mi sono ricordato che c'era scritto...

    Aggiungi l'URL della sitemap al file virtuale robot.txt
    Verrà utilizzato il robots.txt virtuale generato da WordPress.
    Un file robots.txt reale NON deve esistere nella cartella del blog!

    Ciao gdatri,
    basta che togli la spunta e sei a posto.

    Oggi i non trovato sono scesi a 315 😉

    Ottimo 😄

    Robots.txt sta bloccando pagine importanti?
    Alcune pagine importanti sono bloccate dal file robots.txt.

    segnalando questo file...

    http:// www . bbfandf . com/panorama/Wc31ed593c6acb.htm

    Potrebbe essere qualche plugin che crea quei file.
    Esiste la cartella /panorama/ ?


    I non trovato oggi sono 308;)

    @overclokk said:

    Potrebbe essere qualche plugin che crea quei file.
    Esiste la cartella /panorama/ ?

    panorama è il nome del tema che utilizzo

    esiste una cartella panorama sotto /wp-content/themes :mmm:

    comunque è stato rilevato il 09/ott/2011 chiedo la rimozione dell'url?

  • Moderatore

    Ok, prova ad eliminarlo, vediamo si ti da ancora errore, nel caso lo blocchiamo col robots.txt.

    Veramente dice che è importante e che lo trova bloccato con robots.txt
    Anche se non c'è scritto nessun panorama in robots.txt 😉
  • Moderatore

    Ma hai già provato ad eliminarlo?

    Ho mandato la richiesta... Sono in attesa...
    Aggiornamento situazione...
    Ora mi dice...
    Errori di scansione:
    Nelle Sitemap ‎(2)‎ Non raggiungibile ‎(1)‎ Non trovato ‎(288)‎ Soggetto a restrizioni da robots.txt ‎(359)‎ Time out ‎(1)‎

    I non trovato sono calati... ma me ne ha messi 359 bloccati... che probabilmente sono giusti... allego i primi 100 a titolo di esempio...


    Tutto ok gid, sono le url false generate dai 301 messi male dal primo (vecchio) sito, che hanno appunto fatto indicizzare url sballate sul secondo (e nuovo) sito.

    Ma abbiamo già corretto quella cosa, devi solo attendere che - lentissimamente - GWT aggiorni i suoi dati.

    Stai tranquillo, ora il vecchio sito rediretta bene e il nuovo sito ha tanto di canonical e tutto il necessario per indicizzarsi al meglio.


    P.S. ... ah, pensavo che fossimo sul vecchio 3d che parlava dell'unificazione dei due siti.

    Per chi legge qui: tutte le url che presentano "?q=" sono state generate da una serie di 301 in ingresso da un altro dominio, redirect che invece di andare giù lisci portavano dei parametri sulla nuova url che riceveva la redirezione.

    Questa cosa è stata risolta in un altro 3D, ma può aiutarvi nella presente discussione.