• Super User

    Un fenomeno che mi sta facendo impazzire

    Dunque fino a qualche giorno fa, circa una settimana, se facevo una query su Google con l'intero titolo del post di un mio blog, al primo posto trovavo la pagina cercata, con link e descrizione corretta.
    Da circa una settimana accade che, per esempio, cercando il titolo di un post ( esempio concreto : Sanremo 2010 : chi saranno i partecipanti? Prime indiscrezioni e toto-cantanti ) non solo la pagina non compare affatto ma compare al secondo posto un altra pagina del medesimo blog di un mese prima almeno, con titolo e link che non c'entrano niente , ma con all'interno della descrizione la chiave cercata e al secondo rigo la descrizione di un altro articolo postato subito dopo a quello cercato. La descrizione non c'entra niente naturalmente con la chiave e la pagina cercata!
    Questo è quello che compariva nella serp che ho davanti alle 24,00.
    La cosa bella è che cercando il titolo del pot che viene fuori , la pagina indicizzata risulta corretta.
    E' una penalizzazione, Google che sta facendo casini, o che cosa?
    Nello skin non è cambiato nulla di nulla.
    Da precisare che lo stesso fenomeno sta avvenendo anche su un altro blog che però ha pr 4 e 3 anni di vita!

    Grande Fratello 2010 : Tonon bacchetta Massimo Scattarella | TV Cinema
    Sanremo 2010 : chi saranno i partecipanti? Prime indiscrezioni e toto-cantanti · Ballando con le Stelle dal 9 Gennaio, l ' Ultima Parola spetta a Maurizio ...
    tv. vos.it/2009/11/grande-fratello-2010-tonon-bacchetta-massimo-scattarella/

    Dominio:
    tv.vos.it

    Motori:
    Google

    Prima indicizzazione o attività:
    due mesi e mezzo fa

    Cambiamenti effettuati:
    nessuno

    Eventi legati ai link:
    nessuno

    Sito realizzato con:
    wordpress

    Come ho aumentato la popolarità:
    con link spontanei provenieneti da vari siti

    Chiavi:
    televisione cinema

    Sitemaps:
    Si


  • Super User

    Ciao bluwebmaster,

    non hai idea di quante volte mi sono scontrato anch'io contro questo problema... 😄

    Infatti si presenta con portali di grosse dimensioni, con tanti articoli/post e soprattutto ai portali di informazione.

    Ti faccio alcune domane:

    1. Questo scherzo lo fa con tutte le news oppure è alternante?
    2. Il problema si manifesta per qualche giorno e poi ritorna tutto normale?

    Perchè ora qui:
    http://www.google.it/search?hl=it&q=Grande+Fratello+2010+%3A+Tonon+bacchetta+Massimo+Scattarella&sourceid=navclient-ff&rlz=1B3GGGL_itIT308IT308&ie=UTF-8

    Vedo che la situazione è normale.

    In base alle tue risposte poi cerchiamo una soluzione, ok? 🙂

    Grazie mille,
    a presto.
    Michele


  • Super User

    Ciao bluwebmaster,

    non hai idea di quante volte mi sono scontrato anch'io contro questo problema... 😄

    Infatti si presenta con portali di grosse dimensioni, con tanti articoli/post e soprattutto ai portali di informazione.

    Ti faccio alcune domane:

    1. Questo scherzo lo fa con tutte le news oppure è alternante?
    2. Il problema si manifesta per qualche giorno e poi ritorna tutto normale?

    Perchè ora qui:
    http://www.google.it/search?hl=it&q=Grande+Fratello+2010+%3A+Tonon+bacchetta+Massimo+Scattarella&sourceid=navclient-ff&rlz=1B3GGGL_itIT308IT308&ie=UTF-8

    Vedo che la situazione è normale.

    In base alle tue risposte poi cerchiamo una soluzione, ok? 🙂

    Grazie mille,
    a presto.
    Michele


  • Super User

    Ciao Dechigno e intanto grazie per la cortese risposta.

    Il fenomeno è la prima volta che si prefigura sia per questo che per altri blog ( di cui qualcuno da 3 anni con Pr 4 ) e dura da circa una settimana.

    Per la query " Sanremo 2010 : chi saranno i partecipanti? Prime indiscrezioni e toto-cantanti " la situazione è analoga a com'era ieri , così come per tutti i post dell'ultima settimana.

    Per quella indicata da te la situazione era normale prima come lo è adesso : in pratica accade solo per le pagine indicizzate dopo domenica.

    Non ci sono testi copiati ( ovviamente tranne quelli degli aggregatori che spesso finiscono "sopra" nella serp ) : l'unica cosa che posso immaginare è che essendo le categorie un bel numero nutrito , messo insieme ai link del tag cloud e di queli più letti e degli utlimi 15 articoli abbiano superato il numero di 100, e infatti ieri sera ho provveduto a sfoltire qualche categoria e ad eliminare i tag cloud...anche se in realtà nell'ultima settimana era stata aggiunta una sola categoria.

    La cosa sorprendente è che contemporaneamente lo sta facendo anche su altri blog che ho.
    Nel robots.txt ho provveduto da tempo ormai a non far indicizzare categorie, tag e archivi per evitare duplicati di contenuto.
    Che poi se fai la ricerca per dominio compare subito la primo posto, quindi non mi sembra una vera e propria penalizzazione.

    L'unica cosa che ho notato è che quando visualizzi la cache di un articolo, la pagina appare con la colonna di sinistra sovrapposta al body centrale : non vorrei che fosse qualche "incongruenza" dello skin ( che però è stato sempre lo stesso per oltre due mesi) e che Google ne stia "soffrendo solo adesso.

    Facendo la query : " Sanremo 2010 : chi saranno i partecipanti? Prime indiscrezioni e toto-**cantanti " **

    Ora ottengo :

    **TV Cinema
    **Sanremo 2010 : chi saranno i partecipanti? Prime indiscrezioni e toto-cantanti. i cantanti a Sanremo 2010 Il Festival di Sanremo si sta avviando verso la ...
    tv. vos.it/ - Copia cache

    TV Cinema » Grande Fratello 2010 e la stanza delle scelteSanremo
    2010 : chi saranno i partecipanti? Prime indiscrezioni e toto-cantanti Ballando con le Stelle dal 9 Gennaio, l ' Ultima Parola spetta a Maurizio ...
    tv .vos.it/.../grande-fratello-2010-e-la-stanza-delle-scelte/ - Copia cache

    Inutile nascondere che mi è venuto il mal di testa oltre ad averci passato una nottata alla ricerca di possibili cause**.**


  • Super User

    Un ultima cosa che ho notato è che le pagine "incriminate" (adesso anche su un altro blog con Pr4 ) è che nella serp manca la " copia cache ", mentre per quelle già indicizzate e che non hanno problemi è presente il tastino " copia cache ".


  • Super User

    Dunque la cosa che mi colpisce è che, come già detto, il fenomeno si riproduce su tutti i siti dello stesso server. Insomma è come se l'ip fosse..boh.
    Mentre ieri sembravano ( ma non ne sono certo perchè ero intento a trovare mille ragioni al fenomeno) "colpiti" i post dall 11 novembre, fatta una verifica oggi alle 15,00 sono colpiti i post dal 15 mattina in poi (domenica e nulla è stato operato ne sul server ne sui web ).

    Ora o si tratta di un rallentamento di Google che tende a riallinearsi oppure...boh!

    I post colpiti sono tutti da quella data in poi : attenederò ancora la giornata di domani per vedere se c'è magari (speriamo!!!) un riallineamento graduale dei post dal 15 Novembre in poi.

    Certo è che una cosa che non mi è mai capitata.
    Se si trattasse di una vera penalizzazione questa dovrebbe colpire anche i post antecedenti alle date menzionate, credo.

    Speriamo di trovare la soluzione giusta.


  • Super User

    Ciao Bluwebmaster,

    grazie per condividere con noi la tua esperienza.

    Come ti dicevo, ho già visto situazioni simili su altri siti di informazioni (proprio la stessa identica problematica di indicizzazione).

    Il problema, a mio avviso e in base alla mia esperienza di risolutezza di problemi analoghi, è legata a due fattori principali:

    1. Duplicazione dei contenuti interna
    2. Duplicazione dei contenuti all'esterno

    In pratica si tratta non di una PENALIZZAZIONE ma di un FILTRO (per questo filtra esclusivamente post dopo una certa data e il sito non risulta in alcun modo penalizzato).

    Vediamo ora come affrontare e risolvere i due punti focali dove agisce il filtro:

    1. Duplicazione INTERNA

    Alcune modifiche che hai fatto (riducendo i links in uscita etc etc) vanno benissimo. Però se noti qui:

    http://www.google.it/search?q=site:tv.vos.it+"Sanremo+2010+:+chi+saranno+i+partecipanti%3F+Prime+indiscrezioni+e+toto-cantanti"&hl=it&safe=off&num=100&filter=0

    Troverai almeno 200 pagine che contengono quella stringa esatta (titolo del post) al loro interno. Questo, sempre a mio avviso, manda un po' in confusione Google che basandosi oltre che sul contenuto anche sulla popolarità della pagina, tende a "FAR CONFUSIONE" e predilige una pagina contenente il link piuttosto che la risorsa esatta.

    Come ovviare a questo problema?

    Suggerisco di fare poche modifiche alla volta:

    1. Assicurarsi che la sitemap si aggiorni in tempo reale con le url corrette

    2. Cercare di ridurre al minimo la ripetizione dei vari link con anchortext il titolo della notizia (da 200 l'ideale sarebbe passare a 20)

    3. Fare in modo che il titolo del post/articolo si linki automaticamente alla propria url (questa è una tecnica che veniva usata dai blogger per meglio posizionarsi, ma è molto efficace per far capire a Google che quella pagina è la miglior risorsa per quella query!)

    4. Duplicazione ESTERNA

    Bhe, qui il problema (se così si può chiamare) è causato probabilmente, come hai già intuito, dagli aggregatori di notizie che avendo un TRUST molto elevato tendono a "soffocare" la fonte originaria della notizia.

    Soprattutto quelli che inseriscono il "nofollow" nei links oppure non linkano direttamente la notizia con la sua fonte originale.

    Qui devi valutare tu, se gli aggregatori di permettono di avere un buon ritorno in termini di visite oppure no.

    Personalmente tenderei ad avere al max 2-3 aggregatori, non di più.

    Inoltre, ti suggerisco di accrescere maggiormente la popolarità sulle pagine interne.

    Naturalmente si tratta di un lavoro certosino e piuttosto lento, così come la sistemazione delle SERP da parte di Google.

    Magari puoi fare dei test sugli altri portali di cui parli, per vedere se riesci a risolvere prima i problemi, senza "toccare" per il momento il sito principale. 🙂

    Resto a disposizione,
    a presto.
    Michele


  • Super User

    Ciao Bluwebmaster,

    grazie per condividere con noi la tua esperienza.

    Come ti dicevo, ho già visto situazioni simili su altri siti di informazioni (proprio la stessa identica problematica di indicizzazione).

    Il problema, a mio avviso e in base alla mia esperienza di risolutezza di problemi analoghi, è legata a due fattori principali:

    1. Duplicazione dei contenuti interna
    2. Duplicazione dei contenuti all'esterno

    In pratica si tratta non di una PENALIZZAZIONE ma di un FILTRO (per questo filtra esclusivamente post dopo una certa data e il sito non risulta in alcun modo penalizzato).

    Vediamo ora come affrontare e risolvere i due punti focali dove agisce il filtro:

    1. Duplicazione INTERNA

    Alcune modifiche che hai fatto (riducendo i links in uscita etc etc) vanno benissimo. Però se noti qui:

    http://www.google.it/search?q=site:tv.vos.it+"Sanremo+2010+:+chi+saranno+i+partecipanti%3F+Prime+indiscrezioni+e+toto-cantanti"&hl=it&safe=off&num=100&filter=0

    Troverai almeno 200 pagine che contengono quella stringa esatta (titolo del post) al loro interno. Questo, sempre a mio avviso, manda un po' in confusione Google che basandosi oltre che sul contenuto anche sulla popolarità della pagina, tende a "FAR CONFUSIONE" e predilige una pagina contenente il link piuttosto che la risorsa esatta.

    Come ovviare a questo problema?

    Suggerisco di fare poche modifiche alla volta:

    1. Assicurarsi che la sitemap si aggiorni in tempo reale con le url corrette

    2. Cercare di ridurre al minimo la ripetizione dei vari link con anchortext il titolo della notizia (da 200 l'ideale sarebbe passare a 20)

    3. Fare in modo che il titolo del post/articolo si linki automaticamente alla propria url (questa è una tecnica che veniva usata dai blogger per meglio posizionarsi, ma è molto efficace per far capire a Google che quella pagina è la miglior risorsa per quella query!)

    4. Duplicazione ESTERNA

    Bhe, qui il problema (se così si può chiamare) è causato probabilmente, come hai già intuito, dagli aggregatori di notizie che avendo un TRUST molto elevato tendono a "soffocare" la fonte originaria della notizia.

    Soprattutto quelli che inseriscono il "nofollow" nei links oppure non linkano direttamente la notizia con la sua fonte originale.

    Qui devi valutare tu, se gli aggregatori di permettono di avere un buon ritorno in termini di visite oppure no.

    Personalmente tenderei ad avere al max 2-3 aggregatori, non di più.

    Inoltre, ti suggerisco di accrescere maggiormente la popolarità sulle pagine interne.

    Naturalmente si tratta di un lavoro certosino e piuttosto lento, così come la sistemazione delle SERP da parte di Google.

    Magari puoi fare dei test sugli altri portali di cui parli, per vedere se riesci a risolvere prima i problemi, senza "toccare" per il momento il sito principale. 🙂

    Resto a disposizione,
    a presto.
    Michele


  • Super User

    Grazie per la cortese e competente risposta.

    Faccio tesoro di quello che dici e passo subito a metterla in pratica.

    Sai qual'è il dubbio che mi assilla?
    La cosa che mi sembra di uno strano esagerato è che questo è avvenuto contemporeneamente allo stesso giorno per alcuni siti ( per la verità tutti sottodomini , ma sto verificando anche per gli altri con nomi a domini propri ).
    Posso capire che quello in oggetto abbia un Pr 0 e nato da poco, ma non riesco a capire perchè è avvenuto allo stesso identico momento per una serie di siti di cui alcuni avviati da anni e con Pr superiore e non di poco.
    Non ti nascondo che avevo "malignato" in merito ad analytics aggangiato ad AdSense:dull:.

    Comunque sto apportando le modifiche su tutti i siti che poi hanno lo stesso skin sperando di risolvere il problema (purtroppo il danno in termini di visite su almeno un paio di siti è notevole sob! ).
    Non mi è chiaro solo cosa intendi al punto 3.

    Per le ripetizioni esterne ahimè ho tentato in tutti i modi , anche con .htaccess, gli IP di alcuni aggregatori , ma non so come fanno "passano" lo stesso.
    Addirritura ieri ne ho beccato uno che per arrivare alla fonte originale su un mio sito occorrevano ben 5 passaggi , tanti erano gli aggregatori che riprendevano la notizia tra di loro!!!
    Assurdo , semplicemente assurdo!

    Ti aggiornerò e grazie per la squisita cortesia e competenza.


  • Super User

    Per il punto nr. 3 intendo (ti faccio un esempio):

    Questo il post di esempio:
    tv.vos.it/2009/10/anticipazioni-festival-di-sanremo-2010-ezio-greggio-con-antonella-clerici/

    Ecco il titolo del post dovrebbe essere così:

    [HTML]
    ...
    <div class="post" id="post-">
    <h3><a href="http://tv.vos.it/2009/10/anticipazioni-festival-di-sanremo-2010-ezio-greggio-con-antonella-clerici/">Anticipazioni Festival di Sanremo 2010 : Ezio Greggio con Antonella Clerici?</a></h3>
    ...
    [/HTML]

    In pratica il titolo del post si auto-linka (passami il termine) 😄

    Tienici informati,
    grazie.
    Ciao.


  • Super User

    Per il punto nr. 3 intendo (ti faccio un esempio):

    Questo il post di esempio:
    tv.vos.it/2009/10/anticipazioni-festival-di-sanremo-2010-ezio-greggio-con-antonella-clerici/

    Ecco il titolo del post dovrebbe essere così:

    [HTML]
    ...
    <div class="post" id="post-">
    <h3><a href="http://tv.vos.it/2009/10/anticipazioni-festival-di-sanremo-2010-ezio-greggio-con-antonella-clerici/">Anticipazioni Festival di Sanremo 2010 : Ezio Greggio con Antonella Clerici?</a></h3>
    ...
    [/HTML]

    In pratica il titolo del post si auto-linka (passami il termine) 😄

    Tienici informati,
    grazie.
    Ciao.


  • Super User

    Grazie.
    Ora ho capito e non ci crederai, in 10 minuti ho sistemato seguendo il tuo consiglio su tutti i siti interessati :bigsmile:

    Ho seguito i tuoi consigli anche per quanto riguarda i link interni e i prii due post adesso sono con meno di 8 link interni.
    Il fenomeno, ovviamente continua, staremo a vedere nei prossimi giorni : credo che ce ne vogliano almeno una decina per vedere se sortiscono effetti.

    Ti terrò informato e ancora grazie per la competenza e per la cortesia usata.


  • Super User

    Dunque su tutta la linea ( cioè su tuttii siti sul medesimo server!!!) a quest'ora sono andato a posto i post della giornata del 15 novembre.

    Ho controllato uno dei post che è stato , diciamo, "normalizzato" della giornata del 15 nov. per quanto riguarda i link interni e ne conto ...ehm..ben 593 ma è andato a posto uguale.
    Quindi non deve essere quello, o perlomeno principalmente.
    Quello che noto ancora una volta è che il riallineamento avviene contemporaneamente su tutti i blog del medesimo server, quindi con identico IP.
    So che è una sciocchezza quella che sto per dire ma è come se Google avesse avuto problemi, e forse ne ha ancora, con quell'IP o ...decide di fare così perchè così gli pare! :mmm:

    Speriamo che si riallinei presto e che si torni alla normalità al più presto.

    Anche se ho un dubbio atroce ma al limite te lo dico in privato.


  • User Attivo

    Ho lo stesso identico problema, anche io credo che sia legato in qualche modo al server, ma non capisco.
    da una data in poi non posiziona più gli articoli, pur indicizzandoli.

    Hai risolto? Come?


  • Super User

    A stasera alle ore 21,30 ha indicizzato e posizionato le pagine fino al 16 Nov sul sito in oggetto, mentre è un pò più indietro sugli altri siti.

    Ti faccio una domanda : per caso usi Analtycs e hai AdSense e che tu sappia per caso con gli introiti stavi andando fuori media?
    Perchè è vero che ho riscontrato forse (nei miei siti ) un eccessivo uso dei widget tipo i più letti e gli ultimi articoli e articoli correlati, ma è stranissimo che siano "toccati" tutti i siti di quel server contemporaneamente e con lo stesso tipo di problema.
    Stanotte faccio uno scan di tutto il server pe rvedere magari se sotto qualche directory o sottodirectory non abbiano "bucato" il server nascondendo qualch epishing.
    Perchè, ad esempio altri siti che ho su altri server non sono stati toccati.
    La situazione va normalizzandosi ma molto lentamente.
    Sta di fatto che i post recenti non sono indicizzati e dal momento che sono notizie che hanno il proprio ciclo , si traduce in perdita secca di visitatori.
    Ti faccio un solo esempio su uno dei siti (non quello in oggetto) ho perso il 60 % di visitatori passando da 22.000 unici al giorno a 9.000 giornalieri ...
    Immagina quante pagine in meno e quante impressione in meno!
    Quello in oggetto è uno dei web più giovani, quasi due mesi e mezzo di vita e stava già dando "soddisfazioni" notevoli ...poi Google ha deciso di tarpargli le ali. Sob!
    Fammi sapere la tua esperienza.


  • User Attivo

    Ciao,
    incredibile ma o lavori con me, oppure Google sta facendo qualcosa di comune. 🙂

    Ancheio da ieri ho scoperto che mi indicizza quelli fino al 16 novembre! Precedentemente si era fermato a metà ottobre più o meno (forse il 18 ottobre se non ricordo male).

    Probabilmente abbiamo avuto lo stesso problema.


  • Super User

    Stamani si stanno normalizzando le pagine del 17 : il fenomeno, e lo confermo, riguarda tutti i siti che sono sullo stesso server , quindi con identico indirizzo IP.
    La prova sta nel fatto che un neo sito, nato un mese fa, nel periodo tra il 12 e il 20 non ha dei post : e infatti l'indicizzazione delle pagine dal 21 in poi non è ancora avvenuta.
    Presumo, stando le statistiche mi sto facendo, che verso il 28 del mese entreranno quelle del 21.
    La "normalizzazione" delle pagine avviene gradualmente ad "ore" : infatti stanno "normalizzando" tutte quelle postate prima delle ore 13 del giorno 17 , e questo su tutti i siti dello stesso server.

    A questo punto rileggendo le parole di Dechigno posso pensare che abbiano dato veramente fastidio a Google quella miriade di link interni ( che ho provveduto ad eliminare) , soprattutto quando sono arrivati sul sito più grosso e corposo : è come se fosse scattata una sorte di penalizzazione sulle pagine che interessa l'intero server e quindi IP, non so , come se quell'IP fosse considerato una sorte di spam.
    Le pagine dal 11 Nov al 14 si sono normalizzate in una giornata, adesso ha rallentato per cui presumo che un vero riallineamento, di questo passo, non avverrà mai visto che ragiona per ore e giorno (almeno per adesso) e procede con una giornata di normlaizzazione al giorno.

    Ad Alessandrog chiedo solo se per caso i suoi siti sono aggangiati ad Analitics e AdSense e se per caso agli inizi del mese o alla fine di quello precedente aveve registrato un incremento di impression considerevole con conseguento aumento delle entrate.

    Altra cosa, anche se a questo punto devo ammettere che al 95 % Dechigno ha individuato la causa, avevo fatto richiesta pe runo dei siti di essere incluso nelle news di Google...dopo 5 giorni è iniziata la frana. Sob.
    Vi aggiornerò


  • ModSenior

    Ciao

    sicuramente non è il tuo caso, ma se posso aggiungere una mia esperienza personale ti posso dire di aver riscontrato in passato 2 blog penalizzati a partire da una certa data a causa di un link in uscita da un certo post che linkava una risorsa web non affidabile: a partire dalla data di quel post Google si rifiutava di indicizzare tutti i post.


  • User Attivo

    Anche io pensavo a qualcosa di simile, ma avrebbe riguardato un solo blog e non più di uno.
    La situazione è esattamente quella descritta da Bluwebmaster.


  • Super User

    Dunque per prima cosa ora tutti i siti ( che ricordo risiedono sullo stesso server, quindi con identico IP ) sono "normalizzate" come pagine al giorno 17. Vedremo se nelle prossime ore si riallinea anche il 18 oppure si riallineano domani. E' fondamentale perchè se il riallineamento del 18 inizia domani significa che è come se ci fosse una penality di -7 gg.

    A questo punto l'idea che sia un intero IP ad essere interessato al fenomeno ( o penalizzato ) è evidente e ho fatto un piccolo esperimento.
    Su un blog fermo da due mesi, con skin completamente diverso, Pr 3, ben posizionato, al punto che digitando la sola parola del dominio senza suffisso è al primo posto, ho provveduto a inserire un post.

    Dopo circa 15 minuti la pagine era nel motore accompagnando la query con il comando "site", ma digitando solo il titolo non compare nemmeno tra i primi 50 risultati.
    Lo stesso dicasi dopo due ore circa.

    Ricapitalando : sostenendo la teoria di Dechigno che individuava il motivo in "un eccesso di link interni" su uno o più blog, devo però constatare che la tutti, ma proprio tutti , i siti presenti con il medesimo indirizzo IP sono poi stati "colpiti" dal "fenomeno" costra stranissima a dirsi.
    L'ultimo post , ripeto, è su un sito con skin diverso, argomento diverso, e posizionato in modo egregio.
    Ora credo di poter dire che o si tratta di un "problema" di google solo su alcuni server ( ma nulla è stato cambiato nei giorni immediatamente prima della comparsa del fenomeno) o si tratta che se Google attua una specie di penalizzazione su un blog, lo applica a tutti quelli con lo stesso IP.
    Cosa tragica nel caso di hosting.

    A questo punto non mi resta che fare un ultimo esperimento su un sito su un altro server ( sempre dedicato quindi esclusivamente mio ) che spero di potervi relazionare stasera.
    Se su questo altro sito l'indicizzazione avverrà normlmente anche nel posizionamento significa che Google penalizza ( a meno di problemi suoi ) un intero server.
    Se ci sarà lo stesso trattamento la ragione a questo punto è da ricercare altrove e io una mezza idea me la sto facendo.