• Super User

    [Google] - Analisi delle fluttuazioni sinusoidali

    Ciao ragazzi,
    come suggerito da Giorgio vorrei proporvi questo articolo che ho appena realizzato sulle onde sinusoidali nei posizionamenti durante le fluttuazioni che hanno colpito molti siti in questi ultime settimane.

    Google: da ballerino a surfista

    Analisi del comportamento del motore di ricerca più famoso al mondo, nella fase di aggiornamento dei propri indici su tutti i datacenter.

    Dalla frenesia della Google Dance alle onde sinusoidali

    La Google Dance, non era altro che il fenomeno mensile nel quale, il motore di ricerca Californiano, aggiornava i propri archivi, ricalcolando il numero dei backlink (link che ogni pagina “riceve” dalle altre pagine) e di conseguenza il PageRank (voto espresso in valore numerico da 0 a 10 utilizzato da Google per attribuire l’importanza di una pagina in funzione del numero di backlink che essa riceve).

    Il “ballo”, anche se non sempre costante nella sua manifestazione, durava all’incirca una settimana e condizionava il posizionamento nel mese successivo di tutti i siti. Proprio per questo motivo tutti i webmaster, che ponevano parecchia attenzione al posizionamento nei motori di ricerca, seguivano questo processo con estrema attenzione ed ansie al limite del cardiopalma.

    Questo perchè in fase di “Dance” Google restituiva risultati delle ricerche (dette SERP) molto diverse rispetto alle posizioni prima e dopo il fenomeno, anche in funzione dei datacenter interrogati (proprio per questo motivo l’evoluzione è stata denominata GoogleDance, infatti pareva un vero e proprio ballo di tutti i posizionamenti sia in salita sia in discesa negli indici).

    Tuttavia, ora il motore di Mountain View ha cambiato metodologia nell’aggiornamento dei propri indici, infatti non avvengono più con cadenze prestabilite ma giornalmente: grazie all’incessante lavoro eseguito dagli spider (programmi – detti anche robots - appositamente creati per ricercare, prelevare ed archiviare ogni dato valido per il calcolo del ranking contenuto all’interno ed all’esterno di ogni pagina web) che evitano la scansione mensile di massa delle pagine (chiamata Deep Crawl) come avveniva appunto nella fase Google Dance.

    Ciò nonostante, talvolta, Google attua ancora un fenomeno simile alla GoogleDance, che colpisce la gran parte delle pagine indicizzate, proponendo in questo preciso periodo risultati molto differenti da quelli mostrati in condizioni di normalità. I siti, con le loro pagine, che subiscono questi mutamenti repentini di posizionamenti sono vittima di fluttuazioni sinusoidali volte all’aggiornamento e quindi all’allineamento di tutti i datacenter del famoso motore di ricerca.

    Il nuovo processo ha preso il nome dall’onda sinusoidale generata dal grafico dei posizionamenti ottenuti in questa fase in brevi lassi temporali: cioè, per una medesima query (interrogazione/ricerca) eseguita ad intervalli temporali di breve durata (si parla di qualche ora), la pagina risulta visibile in taluni casi ed invisibile in altri.

    Perchè Google effettua queste fluttuazioni alle proprie SERP ?

    A questo proposito, mi ricollego ad alcuni spunti citati da Francesco De Francesco (fradefra) in una [url=http://www.giorgiotave.it/forum/penalizzazioni-e-consigli-seo/30373-google-mi-fara-venire-un-infarto-4.html#post225414]discussione aperta sul forum GT incentrata allo studio di questo fenomeno.

    Infatti i possibili scenari che caratterizzano e motivano l’utilizzo di questo processo di aggiornamento/allineamento dei risultati delle ricerche per Google possono essere così sintetizzati (in ordine sparso):

    • Google è un’azienda, pertanto è sempre alla ricerca di nuovi clienti, che non sono sicuramente i SEO che lavorano sul posizionamento organico/naturale ma gli inserzionisti di Google Adwords. Basta quindi modificare e rimescolare le posizioni di SERP competitive ad alta redditività (per esempio il settore turistico di prenotazioni alberghiere) per “imporre” a realtà di business on-line l’utilizzo dei propri servizi di promozione in PPC per non subire perdite insanabili.

    • Inserimento di nuovi algoritmi di calcolo del ranking, che hanno necessità di alcuni giorni (a volte mesi) per adattarsi a quelli precedenti ed operare in modo efficiente all’unisono con i precedenti

    • Google gestisce decine di miliardi di pagine, e ne deve calcolare in “tempo reale” la posizione negli indici, pare normale che vi siano oscillazioni di questo tipo

    • Eliminazione dello SPAM e sistemazione programmata degli indici, Google come ogni altro motore di ricerca è vittima di forti azioni di Spamming e la presenza di questo fra le SERP è sicuramente pericolosa in quanto potrebbe far perdere a Google la sua risorsa principale: gli utenti che effettuano miliardi di ricerche ogni giorno. In questi termini sarebbe ipotizzabile, una sorta di comando che permetta di far emergere tutte le pagine SPAM o con contenuti non appropriati per ogni settore/keyword, eliminarle e poi far tornare il tutto come era prima (operazioni di pulizia e snellimento mirata per ogni SERP)

    Quand’è accaduta l’ultima fluttuazione e quali considerazioni sono state fatte?

    L’ultima manifestazione delle onde sinusoidali si è manifestata (e forse ancora tuttora in corso per talune keywords) alla fine del mese scorso (febbraio 2007) ed è durata circa 15 giorni.

    Per meglio valutare ed analizzare cosa avviene ad un sito vittima di queste vertiginose fluttuazioni, prenderemo in esame un esempio pratico relativo agli andamenti del sito di un mio cliente, che seguo personalmente.

    Caso studio

    Caratteristiche del sito

    * Settore: Turistico
    * On-line da: 01/03/2006
    * PageRank (Google Toolbar): 4
    * Difficoltà SERP (keywords): Due termini ad elevata competitività
    * Lingua: Inglese
    * Posizione prima della sinusoide: 3° - 4°
    * Pagina posizionata: Home Page
    

    Fonti e specifiche per le rilevazioni

    * Classi di datacenter monitorati: 
    

    New = 64.233.161.107 | 64.233.161.147 | 64.233.171.99 | 64.233.171.104 | 64.233.171.107 | 64.233.171.147

    64.233.* = 64.233.179.99 | 64.233.179.104 | 64.233.183.99 | 64.233.183.104 | 64.233.185.99 | 64.233.185.104 | 64.233.187.99 | 64.233.187.104 | 64.233.189.104

    64.* = 64.233.167.99 | 64.233.161.99 | 64.233.161.104 | 64.233.167.104

    72.* = 72.14.203.99 | 72.14.203.104 | 72.14.203.107 | 72.14.207.99 | 72.14.207.104 | 72.14.207.107

    .99 = 216.239.37.99 | 216.239.39.99 | 216.239.53.99 | 216.239.57.99 | 216.239.59.99 | 66.102.11.99 | 66.102.9.99 | 66.102.7.99.99

    .104 = 216.239.63.104 | 216.239.39.104 | 216.239.37.104 | 216.239.59.104 | 216.239.53.104 | 66.102.11.104 | 66.102.9.104 | 66.102.7.104 | 216.239.57.104

    .107 = 64.233.179.107 | 64.233.183.107 | 66.102.9.107 | 72.14.207.107 | 216.239.37.107 | 216.239.39.107 | 216.239.53.107 | 216.239.57.107 | 216.239.59.107

    .147 = 216.239.57.147 | 216.239.59.147 | 66.102.7.147 | 64.233.167.147

    * Risultati controllati: primi 25 risultati per ogni Datacenter
    * Frequenza: plurigiornaliera
    * Rilevazione della presenza: in termini percentuali (quindi assoluti e paragonabili per ogni classe IP di datacenter)
    

    I dati raccolti

    • Conteggio attivo solamente nel caso l’home page era presente fra le prime 25 posizioni

    Riportando graficamente questi dati è facile intuire ogni singola onda sinusoidale per classi di datacenter, che rileva un andamento simile ma progressivo e non simultaneo di tutte le classi di datacenter.

    Infatti, prolungando le linee in un’ipotetica percentuale negativa è possibile tracciare l’effetto grafico proprio delle fluttuazioni sinusoidali che sono andate sempre più ad appiattirsi fino a stabilizzarsi sulla non presenza dell’homepage nella SERP controllata.

    L’andamento generale e totale di questa presenza (sulla stima dei datacenter presi in considerazione) difatti manifesta una frequenza piuttosto costante ma in progressivo appiattimento.

    In questi termini non solo la presenza nei datacenter ha una tendenza negativa e costantemente discendente, ma anche il posizionamento della stessa pagina: dapprima in 3° posizione, poi in 4° fino ad arrivare in 8° posizione per poi sparire del tutto.

    Tuttavia, il fenomeno sinusoidale ha portato ad emergere un’altra pagina che, almeno all’inizio sembrava attratta da un “effetto calamita” dall’homepage, infatti queste due pagine col passare del tempo hanno continuato ad avvicinarsi sempre più fino a congiungersi in 7° ed 8° posizione (questa operazione è stata ipotizzata anche da [url=http://www.kerouac3001.com/forum/seo-lab/43-come-google-aggrega-i-risultati.html]Kerouac3001 sul suo forum).

    Purtroppo, però la situazione è durata solo alcuni giorni ma ha permesso alla seconda pagina di stabilizzarsi in 18° posizione.

    Un’altra considerazione importante potrebbe essere fatta analizzando il numero di pagine indicizzate e il numero delle anchor text (ancore testuali dei backlink) sempre per la stessa parola chiave.

    Dati prima della sinusoide: 2.180.000 risultati
    15.400 anchor text

    Dati durante la sinusoide: 2.050.000 risultati
    2.050.000 anchor text

    Dati dopo la sinusoide: 1.800.000 risultati
    14.700 anchor text

    Questi dati fanno riflettere, in quanto è notevole lo sbalzo che subiscono i calcoli delle anchor text nel momento in cui le fluttuazioni sinusoidali sono in atto. Eventuali ipotesi e deduzioni a questo riguardo verranno presentate nel punto successivo.

    Inoltre c’è anche da notare il fatto che il sito preso in esame è stato colpito da questo processo sinusoidale solamente per parole chiave inerenti o derivanti da quella presa in esame per la realizzazione di questa analisi.

    Invece per altri siti vittime di fluttuazioni similari, dopo circa 15 giorni la situazione è tornata in linea a quella precedente al fenomeno.

    Deduzioni e conclusioni

    Dall’analisi sopra descritta, a mio avviso, è possibile ipotizzare (soprattutto tenendo presente i dati relativi al conteggio delle anchor text) che:

    1. La possibile causa delle fluttuazioni, è dovuta alla variazione del calcolo delle ancore dei backlink (infatti durante le onde, i numero di risultati delle anchor text risulta esattamente uguale a quello dei risultati delle ricerche, il che è matematicamente impossibile in fase di normalità).

    2. Basandosi sulla prima ipotesi, è plausibile che Google abbia la possibilità di attivare/disattivare questa opzione in qualsiasi momento

    3. La motivazione più probabile che porta a questo fatto, sembrano operazioni di manutenzione e soprattutto nella pulizia delle SERP dallo SPAM (infatti difficilmente le pagine spam hanno una considerevole mole di backlink di qualità) ed è una teoria confermata anche dal ritorno della gran parte delle pagine sparite ai propri posti nelle SERP subito dopo l’evento sinusoidale

    4. Inoltre, Google sembra proprio agire a suo piacimento, colpendo ed analizzando settore per settore, parola chiave per parola chiave. Infatti mentre alcuni siti dello stesso settore sono in fluttuazione, altri di categorie differenti sono statici e presentano SERP regolari

    5. La perdita di posizionamento, invece può essere dovuta alla minor spinta in termini di backlink dovuta alla fuoriuscita di pagine e anchor text (vedi dati inferiori fra prima e dopo la sinusoide) forse per una maggior severità del filtro anti-duplicazione e delle modifiche apportate all’algoritmo di google per delimitare il fenomeno del GoogleBombing)

    6. Per non subire le fluttuazioni, occorre avere un’elevata popolarità in grado di sostenere il sito fra le prime posizioni anche in questa delicata situazione. Ad ogni modo si consiglia di operare una promozione del sito a livello globale, non concentrandosi solo su una precisa keywords o desinenze di parole chiavi

    Allora su cosa puntare per un buon posizionamento organico duraturo nel tempo ?

    Pensare come Google, cioè sviluppare progetti internet rivolti alla soddisfazione dell’utente in modo esaustivo e nel minor tempo possibile, in questo modo i risultati non tarderanno certo ad arrivare.

    A cura di Michele De Capitani

    Prima fonte di pubblicazione: [url=http://www.prima-posizione.it/articoli-news/]Articoli seo e web marketing


  • Bannato Super User

    grazie mille, michele!
    splendido articolo!!!
    grazie mille... 😉


  • Community Manager

    Si, è molto molto interessante 🙂

    Grazie per averlo condiviso con il forum gt.


  • Super User

    Splendido lavoro dechigno!!

    I più sinceri complimenti!!!!

    :smiley32:

    PS. Vorrei riportare un errore nel tuo post:
    Il nuovo processo ha preso il nome dall’onda sinusoidale generata dal grafico dei posizionamenti ottenuti in questa fase in brevi lassi temporali: cioè nello per una medesima query (interrogazione/ricerca) eseguita ad intervalli temporali di breve durata (si parla di qualche ora) la pagina risulta visibile in taluni casi ed invisibile in altri.

    Dovrebbe mancare qualcosa... Non per fare il puntiglioso, ma per capire meglio 🙂

    PS2. Una domanda... Nei grafici cosa viene riportato nell'ascissa (dei numeri, sono i giorni?) e nell'ordinata (Una percentuale di cosa?)


  • Super User

    Grazie, per i complimenti.

    Ho corretto l'errore di battitura (ho tolto il nello che non centrava proprio niente e messo due virgole che facilitano la lettura... e spero anche la comprensione 🙂 ).

    Invece per quanto riguarda i grafici, in effetti messi così significano poco (se vuoi puoi vederti l'articolo completo sul mio sito http :// ww w. prima-posizione . it/ articoli-news/ (naturalmente senza spazi).

    Ad ogni modo, in ascissa ci sono dei numeri che identificano il numero dei rilevamenti (per avere i giorni precisi e le ore devi guardare la tabella dei dati, qui non l'ho postata ma sul sito c'è 😉 ), mentre in ordinata, come spiego nell'articolo, si trova in termini percentuali la presenza o meno della pagina sule diversi classi di datacenter (in poche parole, se il sito era presente su 2 su 4 datacenter controllati il valore è 50%). Ho dovuto operare in questo modo per poter confrontare ogni classe differente di indirizzi IP, in quanto di alcune classi ne ho controllati 4 mentre di altri 9... e il confronto non poteva essere fatto se non con dati relativi in forma percentuale.

    Spero che messo così sia più semplice da comprendere.. 😉

    ciao e grazie a ancora (naturalmente se volete riprendere l'articolo e discuterlo sui vostri siti/blog vi sarò doppiamente riconoscente 🙂 )
    Michele


  • Community Manager

    Up :d