• Moderatore

    Ciao Nicweb e benvenuto sul forum.

    Ti lascio la mia opinione, poi magari aspettiamo che venga qualcun'altro a dire la sua.

    Ho girato un pochino il tuo sito, fatto alcuni test.

    Buona notizia:

    Non sei stato penalizzato da Google, nè in via algoritmica nè in via manuale (quality rater).

    Cattiva notizia:

    Il tuo è un problema di 'indicizzazione', al 98 per cento.

    Il tuo caso assomiglia molto da vicino ai fenomeni in cui l'eccesso di tag portano un blog ad una diluizione delle proprie metriche a vantaggio dell'indicizzazione errata nel rapporto tra archivi (=tag) e contenuti (=post).

    Nel tuo caso - se ti va discutiamone - il problema non necessariamente è generato da un eccesso di tag veri e propri (anche se mi piacerebbe conoscere numero di categorie usate nel blog).

    Hai usato il disallow nel robots per escludere i tag, e sembra abbia funzionato.

    Ok, hai fatto bene.

    Però per qualche motivo trovo in serp per il tuo sito - con query site:domain.ext - che Google ha indicizzato anche alcuni archivi per anno, mese e giorno.

    E anche il ciclo di loop che viene generato sulle pagine autore.


    Insomma, intendiamoci: è un problema che probabilmente riguarda sia te che Google.

    Il tuo sito dovrebbe calibrare meglio la distribuzione del flux all'interno del dominio: niente di grave, il sito è molto ordinato e pulito.

    Google, purtyroppo e sono sicuro di non essere il solo a pensarlo, in questi ultimi tempi sta facendo più bizze del solito; ti assicuro che il tuo problema è uno scherzo rispetto ad altre penalty. Va curato, ma non è grave come altri che passano in giro ultimamente.


    Molti ti direbbe o ti diranno di mettere il noindex per TUTTI i sistemi di archiviazione di wp, lasciando indicizzare solo i post.

    Io personalmente la trovo una soluzione un pochino drastica e pertanto non te la consiglio - anche se te la riporto per dovere di informazione.

    Personalmente ritengo che se sto archiviando determinati post in categorie, allora è segno che quell'archivio è un contenuto potenzialmente utile e degno di essere indicizzato, proprio come 'raccolta'.

    Certamente dovresti limitare l'indicizzazione dei sistemi di archiviazione vari di wp.

    Se indicizzi le categorie, magari evita di indicizzare gli archivi giorno, mese e anno.

    E se non hai tanti autori, considera l'idea di non riproporre il loop dei post sotto ad ogni profilo autore, o magari escluderlo dall'indice.

    Devi limare un po' (che significa sottrarre archivi agli spider, in questo caso, non tutti ma almeno alcuni).

    Altra soluzione - o soluzione contestuale che può rinforzare quella citata - è quella di migliorare il linking in ingresso sui singoli post, nei giorni a ridosso della pubblicazione.

    Ripeto, secondo me hai 'solo' un difetto all'indicizzazione.

    Anche se per te è ovviamente molto fastidioso, in realtà non si tratta di una cosa impossibile da risolvere.

    Ma considera almeno in parte che Google va 'aiutato' in certi casi, perchè qualche difetto di indicizzazione può nascere semplicemente per via delle risorse di scansione dedicate da GG per ciascun dominio.

    Ritardi e misunderstanding simili sono spesso frutto di crawler che hanno fretta con un sito con troppi armadi-archivi in cui guardare.

    Magari qualche cosa si perde, quelche indumento si dimentica dove si era messo.

    Se dai un'occhiata fugace ti rocordi solo che la giacca era nell'armadio e le mutande nella cassettiera.

    Per far sì che GG sappia identificare con precisione dove sta la giacca in pelle con bottoni, a quale stampella esatta, devi intervenire su due fattori:

    • fare in modo che Google rovisti nel tuo guardaroba con più attenzione (lavoro per aumentare il trust del dominio, costruzione di link popularity più prestante etc etc);
    • mettere in ordine il più possibile, riporre il cambio stagione inutile e fare in modo che GG possa trovare tutto il necessario senza aprire troppi cassetti o ante.

    Scusami per la metafora. In ogni modo il tuo sito sembra buono, non credo tu abbia una penalty vera e propria. Certamente non trattandosi più di un sito proprio piccolissimo, devi curare alcuni particolari nel dettaglio per evitare sprechi o difetti.

    Ciao!


  • User

    Ciao WWW, ti ringrazio tantissimo per aver analizzato il mio caso e per avermi fornito una panoramica completa del problema. E' più di un mese che ogni giorno perdo tantissimo tempo a capire cosa sia successo al mio blog.

    Ovviamente certo che mi va di parlarne 🙂

    Il numero di categorie sul blog è di 21 ma ogni articolo è presente solo ed esclusivamente in un'unica categoria. Il numero dei tag che inserisco per articolo è 3 o 4, massimo 5.

    WWW posso limare, e quindi risolvere il problema, modificando il file robots.txt escludendo (mettendo il disallow) gli archivi mese e anno e le pagine autori?

    Avevo intuito che il problema potesse essere questo ma avevo paura di effettuare le modifiche per poi peggiorare la situazione.

    WWW perdona la mia ignoranza ma cosa significa "migliorare il linking in ingresso sui singoli post, nei giorni a ridosso della pubblicazione"? So cosa è il linking in ingresso sui post ma non ho capito cosa intendi riguardo la data di pubblicazione.

    Per quanto riguarda la metafora, non preoccuparti assolutamente, sei stato molto chiaro ed è esaustivo con un piccolo esempio 🙂

    Ciao WWW e grazie ancora per tutto.

    Saluti Nicola


  • Moderatore

    Si per il disallow sul robots.txt per gli archivi per anno-mese-giorno.

    Riguardo al linking ai post penso semplicemente che se i tuoi post prendono uno o due link nei giorni immediatamente successivi alla pubblicazione il problema della indicizzazione sfalsata rispetto alle categorie dovrebbe decadere da solo.

    Magari già lo fai, ma te lo segnalo comunque.

    In ogni caso, intendiamoci.

    21 categorie vanno più che bene. E uno dei motivi per cui si sostituiscono ai post è - fra l'altro - che le tue categorie sono pagine con buone metriche.

    Ottime, visto che pubblichi spesso e spesso linki le cat dall'interno dei post.

    Quindi questo - volendo - è un segnale non negativo.

    Altra cosa che controllerei è il tuo feed rss, cioè se in generale il tuo feed è letto velocemente dagli spider.
    Ad esempio potresti segnalarlo a Google come sitemap all'interno degli strumenti per webmaster.

    Vedo che i tuoi post compaiono con lentezza negli indici della blogsearch... ma a dirtela tutta è un fenomeno che sto riscontrando su altri blog ultimamente.

    Infatti non escluderei nemmeno un'eventuale 'pigrizia' di Google.

    Comunque già limare un altro pochino di grasso superfluo dovrebbe cambiare la situazione.

    Poi vediamo se altri notano qualcos'altro di strano, a me il tuo sito non mi è sembrato presentare problemi evidenti.


  • User

    Ciao WWW, grazie ancora per la tua risposta 🙂

    Per il disallow degli archivi autore e di giorno mese anno devo inserire queste istruzioni all'interno del robots.txt:

    Disallow: /2010/*
    Disallow: /2011/*
    Disallow: /2012/*
    Disallow: /author/*

    Giusto?

    Poi per limare ancora e quindi, come dici tu :-D, togliere altro grasso superfluo inserisco anche le seguenti istruzioni:

    Disallow: //page/
    Disallow: /page/*
    Disallow /page/

    Credi che vada bene? Io penso di sì ma in questo modo non faccio visionare nemmeno le pagine delle categorie successive alla prima. 😕 Cosa mi consigli? 🙂

    Per quanto riguarda il linkare l'articolo nei giorni immediatamente successivi, a volte lo faccio ma non sempre è possibile in quanto non è detto che scrivo argomenti correlati. Di solito vado negli articoli pubblicati in precedenza e se c'è qualche correlazione metto un link dal vecchio articolo a quello nuovo pubblicato. Va bene lo stesso oppure è una cattiva pratica?

    Negli strumenti google webmaster ho visto che non ho la possibilità di inviare il feed rss del mio blog come sitemap poiché ho un url di feedburner mentre negli strumenti mi permette di inserire solo url che iniziano con il nome del mio dominio.

    Fino ad un paio di mesi fa, appena pubblicavo un articolo entro massimo un paio di ore era già stato indicizzato da Google e lo trovavo in rete. Ora invece lo trovo dopo almeno 24/36 ore (nella migliore delle ipotesi). A cosa è dovuto questo problema?

    Ciao WWW e ancora grazie. Appena mi dirai la tua opinione riguardo le istruzioni disallow, provvederò a modificare il file robots.txt

    Saluti Nicola


  • Moderatore

    @Nicweb said:

    Ciao WWW, grazie ancora per la tua risposta 🙂

    Per il disallow degli archivi autore e di giorno mese anno devo inserire queste istruzioni all'interno del robots.txt:

    Disallow: /2010/*
    Disallow: /2011/*
    Disallow: /2012/*
    Disallow: /author/*

    Giusto?

    Nooooo!! Per l'amor del cielo no, così metti il blocco anche sui post!

    🙂

    Hai la data nella url dei post, con questi comandi chiudi tutto, non li puoi usare.

    Però vedo che hai AllInOne Seo come plugin.

    Se vai nelle opzioni puoi intanto mettere il noindex tramite metatag grazie al plugin.

    C'è proprio la spunta in basso, nella pagina opzioni, "Usa il noindex sugli Archivi".

    Non è la stessa cosa, ma almeno è mirato, semplice e privo di controindicazioni.

    @Nicweb said:

    Poi per limare ancora e quindi, come dici tu :-D, togliere altro grasso superfluo inserisco anche le seguenti istruzioni:

    Disallow: //page/
    Disallow: /page/*
    Disallow /page/

    Credi che vada bene? Io penso di sì ma in questo modo non faccio visionare nemmeno le pagine delle categorie successive alla prima. 😕 Cosa mi consigli? 🙂

    No, dai, questa no. Voglio dire, non possiamo scremare troppo.

    Eliminare gli archivi per data è già una grossa cosa, la paginazione - dopo la cura - non dovrebbe incidere tantissimo.

    Eviterei.

    @Nicweb said:

    Per quanto riguarda il linkare l'articolo nei giorni immediatamente successivi, a volte lo faccio ma non sempre è possibile in quanto non è detto che scrivo argomenti correlati. Di solito vado negli articoli pubblicati in precedenza e se c'è qualche correlazione metto un link dal vecchio articolo a quello nuovo pubblicato. Va bene lo stesso oppure è una cattiva pratica?

    Intendevo link ricevuti dall'esterno del tuo dominio.
    @Nicweb said:

    Negli strumenti google webmaster ho visto che non ho la possibilità di inviare il feed rss del mio blog come sitemap poiché ho un url di feedburner mentre negli strumenti mi permette di inserire solo url che iniziano con il nome del mio dominio.

    Fino ad un paio di mesi fa, appena pubblicavo un articolo entro massimo un paio di ore era già stato indicizzato da Google e lo trovavo in rete. Ora invece lo trovo dopo almeno 24/36 ore (nella migliore delle ipotesi). A cosa è dovuto questo problema?

    Ehi, un'altra cosa da fixare a proposito del feed l'ho appena notata.

    Allora, tu hai messo il disallow via robots dell'indirizzo del feed sul tuo dominio.

    Perchè mai una scelta del genere?

    Ti sei iscritto a Feedburner.
    Ok.
    Ma NON hai fatto il redirect dall'indirizzo nativo all'indirizzo feedburner del feed.

    Ma in generale il disallow al feed lo toglierei, quale che sia stato l'intento originario.

    Il redirect verso il feed feedburner puoi scegliere di metterlo oppure no.

    Questa riga di codice nel file .htaccess che trovi nella root del dominio - da mettere prima o dopo i comandi di riscritturad i WP - dovrebbe funzionare per redirettare verso il tuo indirizzo feedburner.

    [HTML]Redirect 301 /feed http://feeds.feedburner.com/ViaggiatoriLowCost[/HTML]

    Ma togli il disallow dal robots.

    Anche perchè ti faccio notare che il tuo tema dice certamente che il tuo feed è su feedburner, ma indica nei meta ANCHE l'indirizzo tradizionale del feed wp.

    Quindi al momento impedivi agli spider di leggersi il feed, nella speranza che invece andassero spontaneamente verso il feed su feedburner.

    INVECE, direi che il disallow per il feed lo rimuovi.
    Se ci tieni ad utilizzare solo ed esclusivamente l'indirizzo feedburner, implementa il redirect 301 per il feed e vai tranquillo.

    Altrimenti puoi anche lasciare fluire gli spider sul vecchio indirizzo del feed e invece gli utenti (che seguono i link fisici sul tema) su Feedburner.

    Non è contenuto duplicato, tranquillo. Voglio dire.

    Il feed è la sorgente di dati che viene emessa dal tuo sito.

    Il tuo robots attuale aveva impedito l'accesso diretto ai bot al feed 'tradizionale'.

    L'alternativa di Feedburner non è nè forzata nè univoca, a giudicare dal tuo tema e dalle risposte del server.

    Potrebbe anche essere questa un'ottima spiegazione dei tuoi ritardi di indicizzazone sui post.

    :ciauz:


  • User

    Ciao WWW, hai perfettamente ragione, mi ero completamente dimenticato che gli url contenevano anche la data. Grazie mille!!! Ho appena messo il segno di spunta sulla voce "No index per gli archivi" nelle impostazioni di All in One Seo Pack. Per quanto riguardo gli autori inserisco la stringa "Disallow: /author/*" o nemmeno va bene?

    Ok per le altre istruzioni, pensavo che scremare al massimo potesse portare ulteriori benifici.

    Per quanto riguarda il feed, se ho capito bene, mi stai consigliando di eliminare la stringa "Disallow */feed" dal file robots.txt ed inserire nel file .htaccess il redirect al feed di feedburner. Giusto? Appena mi rispondi provvedo immediatamente ad effettuare anche questa modifica. 🙂 Speriamo che sia questo uno dei principali motivi per cui un post viene indicizzato dopo molte ore, se non giorni 🙂

    Speriamo anche che ritorno quanto prima a comparire nelle serp (e in buona posizione) con i link degli articoli e non delle categorie o degli archivi (quanto tempo ci mette generalmente google a togliere l'indicizzazione agli archivi?).

    WWW grazie sempre per i tuoi preziosi consigli 🙂

    Saluti Nicola


  • Moderatore

    Si, la stringa sull'autore va bene.
    Per quanto riguarda il feed sì, hai capito bene il tutto.

    Per quanto riguarda i tempi del noindex.. biblici, diciamo che più che altro puoi considerarlo come un preservativo buono per gli archivi futuri, per intenderci.


  • User

    WWW scusami ma devo togliere entrambe queste due istruzioni, oppure solo una di esse: 😕

    Disallow: /feed/
    Disallow: */feed/

    Saluti Nicola


  • Moderatore

    Leva entrambi, anche perchè Google non indicizza i feed dal dicembre 2007.

    http://googlewebmastercentral.blogspot.it/2007/12/taking-feeds-out-of-our-web-search.html


  • User

    WWW ho sistemato tutto. Speriamo bene! Grazie veramente tanto per il tuo aiuto, sei stato molto disponibile e gentile. 🙂

    Che dici basta così o si può aggiustare qualche altra piccola cosa? 😄

    A breve aprirò un nuovo topic per un altro piccolo problema che vorrei risolvere (non credo che posso scriverlo in questo topic perché è tutt'altra cosa)

    Saluti Nicola


  • User

    Mi sono dimenticato di aggiungere negli strumenti Google Webmaster il feed come una sitempap.

    WWW quindi se inserisco il seguente link www[punto]viaggiatorilowcost[punto]it/feed/ come seconda sitemap non ci sono problemi, giusto? (Ovvero non si generano contenuti duplicati)

    Ad oggi ancora non trovo alcun miglioramento nonostante tutte le modifiche fatte precedentemente. Se scrivo adesso il titolo esatto di un articolo pubblicato qualche giorno fa non mi esce nei risultati il link dell'articolo ma quello della categoria 😞 Speriamo bene.

    Saluti Nicola


  • User

    WWW ho appena notato che da quando ho fatto il redirect 301 al link del feed di feedburner, il feed RSS non si aggiorna più 😕

    Cosa faccio ora? 😕

    Grazie anticipatamente per il tuo aiuto 🙂

    Saluti Nicola


  • Moderatore

    @Nicweb said:

    WWW ho appena notato che da quando ho fatto il redirect 301 al link del feed di feedburner, il feed RSS non si aggiorna più 😕

    Uhm. Facciamo così, invece del redirect suggerito l'altra volta usiamo la strada che propone Google.

    Prova a vedere se - sostituendo logicamente il redirect precedente - il seguente codice si comporta come dovrebbe.

    Sempre sull'htaccess.

    [HTML]
    RewriteCond %{HTTP_USER_AGENT} !FeedBurner
    RewriteRule ^feed$ http://feeds.feedburner.com/ViaggiatoriLowCost [R,L][/HTML]


  • Moderatore

    In ogni caso, considera anche una cosa.

    Utilizzare il feed come sitemap supplementare si fa come hai scritto sopra e non da assolutamente problemi di contenuti duplicati.

    Però se imposti il redirect a feedburner non sono mica sicuro che tu possa segnalare il feed come sitemap.

    Quindi se vuoi provare questa funzione non mettere il redirect al feed - gli indirizzi url di un feed non vengono inclusi nelòl'indice e quindi duplicati non ne fai, tranquo.

    Il redirect lo avevamo 'discusso' per due motivi, sostanzialmente:

    • per i visitatori in carne ed ossa, per farli iscrivere tutti a Feedburner e non al feed interno

    • perchè quando andava di moda Feedburner quella di redirettare il feed era una cosa che facevamo tutti.

    🙂

    Due o tre anni fa e anche più quasi tutti i blog erano iscritti a Feedburner.

    Il mio lo era senz'altro, ma se non sbaglio anche quello di Giorgio (mi riferisco almeno al seoblog).

    Ma se lo noti ora.. beh, non so come la pensa lui, ma andando a vedere a distanza di tempo sia il suo blog che il mio hanno 'abbandonato' Feedburner...

    Sarà un caso, ma non credo molto alle coincidenze (anche se non conosco i motivi specifici che possono aver motivato questa sua scelta... ma me li immagino.)

    Guarda qui:

    http://seoblog.giorgiotave.it/feed

    Questo solo per essere del tutto sinceri, non voglio aprire una discussione su Feedburner.

    🙂


  • User

    WWW grazie per la spiegazione 🙂

    Ho sostituito il vecchio redirect con il nuovo. Appena pubblicherò il prossimo articolo vediamo se funziona il feed.

    Per quanto riguarda il segnalare il feed Rss come nuova sitemap, visto che nemmeno tu sai se in questo caso si può fare, preferisco non fare nessuna modifica 🙂

    Ciao e grazie ancora. Ti aggiorno a breve sul funzionamento o meno del feed.

    Saluti Nicola


  • User

    WWW il feed RSS funziona 🙂

    Saluti Nicola


  • User

    E' un mese che sembra essere tornato tutto alla normalità (sono di nuovo nelle prime posizioni nelle SERP per le keyword citate) ed in più c'è stato un aumento del traffico pari al 75%. 🙂

    L'unica cosa che ancora non si è sistemata è il fatto che google non passa tutti i giorni e indicizza gli ultimi articoli dopo diverse ore o giorni. Speriamo che si risolva anche questo problema al più presto.

    Saluti Nicola


  • Moderatore

    Beh, mi fa piacere.

    🙂


  • User

    @WWW said:

    Beh, mi fa piacere.

    🙂

    E' soprattutto merito tuo. Grazie mille! Per qualsiasi info e dritta sul mondo dei viaggi low cost non esitare a contattarmi 🙂

    Saluti Nicola