• User

    Ma di fatto, da persona non eccessivamente informata, se la sitemap è giusta (perchè aprendola si vede tutto correttamente), come mai vengono generati questi errori? un problema di parsing forse?
    Perchè, almeno io, la vedo correttamente: www . mattewsblog.com/stmp/sitemap.xml
    E' forse il /stmp/ che può creare problemi?
    Ora provo a mettere la sitemap direttamente in root al sito, e vediamo...ci sono circa 754 errori...aiuto...


  • Moderatore

    Non credo che sia il /stmp/ a darti problemi, il fatto è che con i normali browser i link funzionano tutti correttamente, quello che mi farebbe pensare ad un problema simile è un plugin di WP.
    Fai queste prove, guarda se le pagine che ti danno problemi sono correttamente indicizzate con "site:", poi prova a vedere anche dal pannello di controllo del GWT nella sezione "visualizza come google bot" e vedi se ci sono problemi li.
    A proposito, negli errori ti dice se sono generati anche da qualche pagina?
    Ho visto che il robots.txt è quello di default di wordpress, lo hai lasciato tu così?

    Enea


  • User

    Errori da "Visualizza come Google Bot" non ne ho, tutti i recuperi sono riusciti.
    Il file robots è generato (da quanto ricordo) dal plugin stesso, infatti non esiste come file all'interno del sito.
    Le pagine collegate da cui deriva l'errore, sono corrette e le stesse, mi spiego meglio:
    www . mattewsblog . com/pagina1
    genera un errore per la pagina
    www . mattewsblog . com/pagina1/\

    Possi anche disabilitare in toto i vari plugin, ma con i tempi di aggiornamento di GWT diventa un pò complicato attivarli uno ad uno poi....

    Inoltre, ho provato sia immagini che pagine, semba che siano indicizzate, tramite l'operatore "site:" ritornano le pagine solo se le scrivo correttamente, quindi senza il backslash finale.


  • Moderatore

    Il file robots crealo tu e mettilo nella root, in quello attuale c'è solo un allow in tutto il sito, indicizzare cartelle come wp-admin non è utile.
    Hai qualche plugin che gestisce i redirect?
    Nel caso disabilita quelli prima.

    Il file htaccess è a posto?

    Enea


  • User

    Ciao Enea, allora il file robots.txt l'ho generato e inserito in root con l'esclusione da parte di tutti i ragnetti della directory di amministrazione.
    Per quanto riguarda l'htaccess, è questo:

    <IfModule mod_rewrite.c>
    RewriteEngine On
    RewriteBase /
    RewriteRule ^index.php$ -
    RewriteCond %{REQUEST_FILENAME} !-f
    RewriteCond %{REQUEST_FILENAME} !-d
    RewriteRule . /index.php
    </IfModule>

    Però non mi pare errato...
    Nessun plugin per i redirect, non ne uso proprio...
    Grazie, ciao!


  • User

    ADD: ora siamo a 835 link non trovati, salgono vertiginosamente...


  • Moderatore

    Ciao Matteo,
    il robots è inconpleto, in questa discussione spiegavo ad un altro utente cosa mettere nel robots.

    Il file htaccess è quello di default di wordpress ed è ok.

    Purtroppo dobbiamo andare per tentativi, prova a mettere alcune pagine statiche in html nel tuo spazio hosting, falle indicizzare da google e vediamo se quelle ti danno problemi di url.

    Prova anche xenu, è un programma che ti controlla se ci sono problemi ai link del tuo sito.

    Ciao
    Enea


  • User

    Ciao Enea,
    ok intanto procedo con la modifica del robots, ma le pagine statiche le includo nella sitemap o lasciamo che le indicizzi da solo?vuoi escludere problemi alla sitemap rilevata?
    xenu l'avevo provato dal lavoro, c'è solo la possibilità di inserire un url alla volta?
    grazie, ciao!


  • Moderatore

    Puoi fare cosi, per esempio se ne crei quattro, due le inserisci nella sitemap e due no, metti un link nel sito dove vuoi e vediamo come vengono indicizzate.
    In xenu inserisci il dominio del tuo sito, poi lui controllerà tutti i link che trova.

    Ciao
    Enea


  • User

    Ciao Enea, ho un piccolo problema con xenu...se inserisco l'url del mio sito, sia solo nome di dominio che anche host, mi scansiona solo quello, non trova nessun link....è possibile?


  • User

    Enea, ora i link delle categorie sono errati. Ogni volta che seleziono una categoria per entrarci, restituisce un 404. A questo punto, ricarico un backup che avevo di 5 giorni fa, ad esempio. Alternativamente posso eseguire un'installazione pulita, cosa che preferirei, e ripristino articoli, tag, categorie, e media.
    Che dici?


  • Moderatore

    Beh, in questo caso allora sembra proprio un problema del cms stesso, prova una nuova installazione in locale con il tuo database e vedi se ti da problemi, nel caso vada tutto bene caricalo on-line e vedi se funziona tutto a dovere.

    Ciao
    Enea


  • User

    Direi che a questo punto è la cosa migliore...ci sono modi per verificare il database, a parte i plugin di wordpress?


  • User

    Ciao, aggiorno la discussione con la risoluzione. In GWT i link non rilevati erano andati sopra i mille, le categorie non funzionavano più, i tag nemmeno, ragion per cui ho deciso di esportarmi le tabelle wp_comment e wp_posts, reimportandole sopra un db vuolo.
    Ho cambiato il tema che aveva qualche incompatibilità, e ora sono a posto, con i permalink settati correttamente.
    Purtroppo, la soluzione è stata drastica. Almeno, è stata risolutiva.
    Continuerò il monitoraggio di GWT per vedere i cambiamenti.
    Grazie a tutti per il supporto, a buon rendere 😉


  • Moderatore

    In questi casi quando ci sono troppi errori a volte la soluzione migliore è quella di ricominciare da capo reinstallando tutto.
    Il GWT è lento ad aggiornare quindi ci vorrà del tempo, l'importante è che il sito funzioni correttamente.
    E' probabile anche che in questi giorni possano aumentare gli errori per poi fermarsi e quindi diminuire.

    Tienici aggiornati.

    Ciao
    Enea


  • User

    Eccomi di nuovo!!! ora la situazione del GWT è questa:
    Nelle Sitemap ‎(121)‎ Non raggiungibile ‎(5)‎ Non seguito ‎(1)‎ Non trovato ‎(1.699)‎ Soggetto a restrizioni da robots.txt ‎(1)‎

    L'unica corretta è quella soggetta a restrizione, che è la cartella wp-admin, come avevamo impostato.
    Spero che la situazione migliori col tempo...sto riassegnando piano piano tutte le categorie e i tag...
    Ciao!


  • Moderatore

    Bene, tieni controllato le date degli errori, se sono rilevati prima o dopo la reinstallazione del sito.
    Quelli vecchi potrebbero rimanere per un po', l'importante e che non ce ne siano di nuovi.

    Nel caso puoi sempre aggiungere altre righe sul file robots.

    Verifica che i link funzionino tutti correttamente.

    Come ho già detto il GWT è lento ad aggiornare i dati quindi bisogna avere pazienza ma essere pronti ad intervenire quando ce n'è bisogno.

    Ciao
    Enea