• Super User

    Brevetto Google sui Dati Storici: I link

    Raele ed io abbiamo messo online la traduzione della quarta sezione dei brevetti di Google sui dati storici, quella riguardante i link.

    • Articolo di Beke: [url=http://www.posizionamento-web.com/brevetto-google-link.asp]Criteri basati sui link
    • Articolo di Raele: [url=http://www.motoriericerca.com/?q=Brevetto-Google-Analisi-link]Criteri basati sui link

    Viene fuori che i link sono un pò come il maiale: "Non si butta via niente" 😄

    Dopo averli contati, averli pesati in modo differenziato e ricorsivo, avere estratto i testi delle ancore ed i title... c'è ancora roba da strizzare 🙂

    Il sistema per valutare un backlink in base alla sua "freschezza" ad esempio sembrerebbe proprio un ottimo fattore correttivo al PageRank...

    Voi che ne dite?


  • Community Manager

    Ora me li leggo e insieme a questi siamo oki 😄

    http://www.motoricerca.info/news/news-353.html

    Grazie 😉


  • Super User

    Da studiare bene.

    Per ora si puo' dire che avete fatto un ottimo lavoro !! :vai:


  • Community Manager

    Sono passati 14 anni da questa discussione che sulla Freschezza dei Link ha dato il via a tante altre discussioni e scambio di informazioni nei nostri eventi.

    La uppo perché Mario Chiocchetti mi invita a commentare il suo Link Freshness: cosa è e perché è importante

    E ne approfitto perché il primo link di Beke non c'è più, quindi vado su archive e incollo il suo testo, lo recupero va 🙂

    Lui dice:

    Analizzare le date di apparizione e sparizione dei backlink fornisce a Google molte indicazioni sul valore dei documenti e dei link che essi contengono.

    E poi va una Traduzione della sezione del brevetto di google sui dati storici riguardante i criteri basati sui link.

    La traduzione è fatta da Beke (Stefano Becheroni) e Francesco Iamurri (Raele) ed è Archive, io me lo sono scaricato in modo da fare da Archivio.

    Chissà dove sono finiti. E che bello rileggere del contributo culturale che hanno portato a tutta la community.

    Grazie ragazzi,

    Vi metto qui il testo dell'articolo

    I link sono stati uno dei primi fattori esterni ai siti web ad essere utilizzato per migliorare gli algoritmi di posizionamento dei motori di ricerca. Inizialmente i motori di ricerca si limitavano a calcolare la link-popularity dei documenti, poi Google habrevettato ed introdotto un nuovo sistema che permetteva di pesare in modo diverso l?importanza dei vari link, ovvero il pageRank.

    Ad oggi praticamente tutti i motori di ricerca principali utilizzano il testo contenuto nelle ancore dei link come fattore di posizionamento, e adesso con il brevetto di Google relativo ai dati storici si aprono nuove possibilità di analisi molto interessanti, sia dal punto di vista dell?affinamento degli algoritmi di ranking che da quello dell?eliminazione dello spam.

    I link che puntano ai vari documenti nel web appaiono e scompaiono, in seguito alle modifiche che i webmaster effettuano sui loro siti web.
    Analizzando l?evoluzione nel tempo di vari fattori riguardanti i link che puntano ad un documento (backlink) si possono individuare elementi importantissimi per capire se il documento è importante, aggiornato, obsoleto, relativo ad un argomento ?caldo? oppure si tratti di spam.
    Secondo il brevetto in questione, per ogni documento indicizzato Google memorizza la data in cui appare ogni nuovo backlink (un link che punta al documento in questione), cioè la data in cui lo spider del motore incontra per la prima volta un documento che contiene il backlink, o la data in cui viene trovato un nuovo backlink in un documento già conosciuto.

    Analizzando le date in cui appaiono i backlink di un documento, Google può verificare quanti di questi siano apparsi, per esempio, nell?ultimo anno, e nel caso siano tutti o in gran parte precedenti, dedurre che il documento ha perso di importanza oppure sia ritenuto sorpassato. Inoltre attraverso la memorizzazione delle date di apparizione dei backlink è possibile identificare il ritmo, la velocità con cui questi link appaiono e stabilire se è costante, in calo, oppure in crescita.
    Si può ipotizzare che un documento in cui il ritmo di apparizione dei backlink è crescente sia un documento che viene considerato importante ed aggiornato. Viceversa un documento che viene linkato sempre meno col passare del tempo è probabilmente un documento che ha perso di importanza, probabilmente superato o poco aggiornato.

    Questa analisi può venire affiancata da quella complementare che invece tiene sotto controllo la sparizione dei backlink già rilevati. Ovviamente un documento che nell?ultimo anno abbia perso molti backlink viene considerato poco aggiornato o poco importante. La stessa cosa si può dedurre di un documento il cui il ritmo di sparizione dei backlink sia in crescita.
    In base a questi criteri verranno assegnati ai documenti dei punteggi che contribuiranno a migliorare oppure a peggiorare il posizionamento del documento nelle ?serp? (pagine dei risultati) di Google.

    Come già per il pagerank, calcolando questi punteggi Google assegna importanza diversa ai backlink dei vari documenti. I fattori che si possono estrapolare dai dati storici e che contribuiscono a differenziare i pesi dei link sono molteplici. Un fattore importante è la ?freschezza? del link. Un link è considerato ?fresco? sia quando viene trovato in un documento nuovo che in uno recentemente aggiornato; in questo caso il link porta al documento a cui punta un punteggio maggiore. Se il documento contenente il link viene aggiornato in maniera rilevante ed il link vi viene mantenuto, esso è considerato ancora più importante, perchè si ipotizza un atto volontario preciso del webmaster di mantenere un link ad una risorsa utile nonostante l?aggiornamento del sito. I link che hanno vita breve, cioè che provengono da documenti che cambiano molto spesso contenuti e link, a parità di freschezza vengono invece considerati meno importanti di quelli più ?stabili?.

    Abbastanza stranamente in questa sezione del documento si citano anche altri sistemi per ?pesare? i link non basati sull?analisi dei dati storici: viene per esempio affermato che i link provenienti da documenti istituzionali, come per esempio quelli governativi sono considerati più importanti degli altri. La stessa cosa vale per i documenti ?autoritativi?, ovvero quelli che sono linkati da un grande numero di altri documenti e che, per questo, sono considerati delle ?authority?, cioè documenti di riferimento per la comunità del web (o almeno per una sua parte).

    l sistemi usati per assegnare i punteggi ai documenti possono quindi essere calcolati attraverso la somma dei pesi dei loro backlink, dove questi pesi dipendono anche dalla freschezza dei link e questo sistema, analogamente a quello del pageRank originale, può esser utilizzato in modo ricorsivo.
    A mio parere la cosa più probabile è che il calcolo del pageRank ormai differisca di molto da quello della formula originale e la valutazione della freschezza dei backlink potrebbe appunto essere uno dei tanti fattori correttivi applicati.

    Google può inoltre facilmente individuare dei picchi anomali nell?acquisizione di backlink da parte di un documento rispetto a modelli ?standard? che identificano le varie tipologie di documenti. In questo caso il motore può supporre di trovarsi di fronte ad un sito che tratta un argomento ?caldo?, e quindi premiarlo, ma può anche ipotizzare di avere rilevato un tentativo di spam, eseguito attraverso l?acquisizione di backlink scambiati, comprati, oppure ottenuti attraverso guestbook, forum o altre pagine dove sia possibile inserire un link senza richiederlo al webmaster. Ovviamente in questo caso difficilmente il documento verrà premiato.

    Viene detto chiaramente in più di una sezione del documento che la rilevazione di picchi improvvisi in processi che solitamente si svolgono più lentamente fa scattare dei campanelli d?allarme, per cui è caldamente raccomandabile non accumulare grandi ed improvvisi aumenti di link che puntano ai propri documenti, magari addirittura tutti con lo stesso testo nell?ancora, perché questo tipo di evento può far scattare ulteriori controlli che potrebbero sfociare in penalizzazioni o addirittura ban dall?indice del motore.

    Negli anni abbiamo affrontato molte volte il concetto, facendo riferimento sempre a una cosa molto importante che Mario sottolinea:

    ovvero che conta molto l'"ultimo periodo", se non ricevi link da un anno (non so quale sia la data) è un segnale.

    Poi c'è, secondo me, tutta una considerazione da fare. È vero che un link vecchio 10 anni è vecchio, ma se la risorsa che lo include è valida ancora oggi, il link ha un valore alto. Molto. Non decade, anzi.

    🙂


  • User Newbie

    Grazie Giorgio per la menzione e per aver ripreso questo interessante thread. A mio parere, è importante riflettere su questo tema, soprattutto in relazione ai cosiddetti domini "dropped". Sicuramente un dominio datato ed autorevole ha un peso maggiore rispetto ad uno nuovo, ma se non viene linkato da tempo perde comunque parte dell'autorevolezza. Voi cosa ne pensate in merito?


  • Community Manager

    @mariochiocchetti said:

    Grazie Giorgio per la menzione e per aver ripreso questo interessante thread. A mio parere, è importante riflettere su questo tema, soprattutto in relazione ai cosiddetti domini "dropped". Sicuramente un dominio datato ed autorevole ha un peso maggiore rispetto ad uno nuovo, ma se non viene linkato da tempo perde comunque parte dell'autorevolezza. Voi cosa ne pensate in merito?

    Ciao Mario,
    benvenuto qui su queste pagine.

    Secondo me c'è un altro tassello da aggiungere: il Topical TrustRank.

    Ammettiamo che tu abbia un link su un dominio datato e autorevole. Questo dominio è in prima pagina per una query. Per quella query quel dominio non è considerato scaduto né da Google né dagli utenti.

    Allora quel valore che passa a te non perde niente.

    Perché, appunto, è considerato tra quei domini che passano quel valore.

    Il problema è infatti che oggi guardiamo poco ai link in questo senso: ci interessano i numeri generici. Ma se abbiamo 100 link, quanti di questi provengono da PAGINE che sono nelle prime 10 Posizioni per le chiavi competitive per le quali dovrebbero posizionarsi?

    Abbiamo i dati del valore della pagina secondo gli strumenti, ma non ci concentriamo molto su COME ranka quella pagina che ci linka.