• Super User

    Nuovi Brevetti di Google: Cutts e Jeffrey Dean fra gli autori

    Ci sono anche Matt Cutts e l' amico (... 😉 ) Jeffrey Dean tra gli autori di due nuovi interessanti Brevetti di Google che riguardano ulteriori aspetti dell'utilizzo dei "dati storici" in funzione del Ranking pubblicati appena due giorni fa e di cui mi pare che ad oggi non sia ancora uscito molto qui da noi...

    L'ultima "mandata" di brevetti (quelli cosiddetti del "Phrase Rank") aveva infatti spostato la nostra attenzione sulle infrastrutture e sui metodi di indicizzazione, con la descrizione dell'indicizzazione per frasi (che molte ripercussioni ha/potrebbe avere nelle serp di oggi) e degli archivi di indicizzazione secondari (che tanto fanno parlare di se
    quando si affrontano temi come i risultati supplementari o i risultati omessi).

    Ma di dati "storici" non ne parlavamo da tempo...

    Dei "mitici" brevetti sui "dati storici", infatti, se ne discusse con grande attenzione e partecipazione ormai diversi mesi fa, con un fiorire di interpretazioni e supposizioni su quell'enorme mole di dati e di nuovi possibili elementi di ranking, ma di cui non si aveva , allora, certezza del loro effettivo utilizzo..

    ...poi uscirono le "interessantissime" 🙂 pubblicazioni riguardo "Big table" a darci conferme e prove sull'utilizzo di dati "storicizzati" da parte di Google, attraverso una precisa descrizione della propria infrastruttura di archivio dati.

    Con qualcuno poi, ci divertimmo quindi ad ipotizzare come Google potesse tenere conto della variazione storica di uno dei dati e degli elementi fondamentali alla base dei propri algoritmi: "la variazione del numero di Link nel tempo" ai fini del ranking di un documento...

    ... ed ecco che oggi, ma non era certo dubitabile, Google ci presenta i relativi brevetti ufficiali :

    DOCUMENT SCORING BASED ON LINK-BASED CRITERIA

    DOCUMENT SCORING BASED ON DOCUMENT INCEPTION DATE

    Il primo proprio focalizzato sul tema: "A system may determine time-varying behavior of links pointing to a document, generate a score for the document based"
    Per una rapida comprensione del brevetto consiglio di leggere (come sempre in questo tipo di documenti/brevetti) il "Summary of invenction" che ovviamente non fornisce una descrizione "puntuale" delle formule di ranking ma dei metodi di calcolo che danno una idea abbastanza precisa di cio' che viene tenuto in conto:

    concetti come appunto,** la variazione nel tempo dei link ricevuti, il concetto di "freshness" di un documento legato alla "freshness" dei link che lo puntano, **il concetto di superamento di soglia media dei link ricevuti nel tempo....

    Quella della "media" è un metodo di lavoro ricorrrente nei sistemi e negli algoritmi del motore di ricerca, dove le valutazioni
    delle "influenze" di dati e fattori contestuali ad un singolo documento, non sono MAI delegate a studi, formule e/o considerazioni esterne e/o "umane" o comunque frutto di ragionamenti e /o supposizioni, ma sempre valutate in funzione del raffronto con i valori medi di tali dati nell'intero universo dei documenti archiviati...

    Anche il secondo brevetto è davvero interessante e per certi versi sorprendente: "A system may determine a document inception date associated with a document, generate a score for the document based at least in part, on the document inception date"
    Una elemento di ranking basato sulla data di creazione di un documento... (che prima o poi doveva pur essere tenuta in conto.. finalmente 😄 ) e fin qui nulla di eccezionale , anche se si potrebbe anche ritornare a parlare di Sand-Box (o no? 😉 ) ma ben piu' interessante mi è parso uno dei punti del brevetto che descrive uno dei possibili metodi da utilizzare: la verifica in base alla query fatta, della data di creazione media dei documenti relativi alla query e la determinazione di un punteggio relativo al discostamento medio da tale data... davvero non ci avevo mai pensato ...

    Comunque continua l'evoluzione di Google e continua sempre piu' affascinante la sfida tecnologica e lo sviluppo dell' information retrieval sul web... e meno male che in america sono abituati a brevettare tutto, che almeno continuiamo ad avere spunti per studiare e lavorare...

    :ciauz:
    Nicola

    "GT Bibliografia" (thred citati) :

    Google Phrase Rank
    Google Big Table
    Brevetti dati storici di Google (2005)
    Congetture sull'importanza della variazione nel tempo del numero di BL


  • Moderatrice

    @nbriani said:

    ...ma ben piu' interessante mi è parso uno dei punti del brevetto che descrive uno dei possibili metodi da utilizzare: la verifica in base alla query fatta, della data di creazione media dei documenti relativi alla query e la determinazione di un punteggio relativo al discostamento medio da tale data... davvero non ci avevo mai pensato ...

    Domanda per capire se ho capito bene: data la query "pippo" a parità di determinati parametri arriverà prima la pagina posizionata con pippo che è stata creata in periodo antecedente?


  • Super User

    Ciao Debora, no, credo si tratti di una questione diversa... data una query tipo "Olimpiadi Pechino" , oggi la data di creazione media dei documenti associati alla query è certamente mooolto diversa alla data che risulterà, ad esempio, nei giorni futuri dell'evento... Google associa un punteggio ai documenti (ma non ci viene detto se e quando negativo o positivo) in base a quanto si discostano nella loro data di creazione da quella media di tutti gli altri documenti riguardanti quel dato argomento/query (le olimpiadi di pechino)...

    Nell'esempio delle olimpiadi quindi, piu' che ci avviciniamo all'evento piu' che è presumibile vengano pubblicati nuovi documenti che ne parlano e quindi la data di creazione media si sposterà via via in avanti... con questo dato il mdr potrebbe decidere di premiare oggi determinati documenti e domani altri in base allo scostamento della loro data di creazione dalla data "media"... (ovviamente questo della data di creazione è solo 1 degli n elementi che contribuiscono al ranking)
    Ti torna il ragionamento? ..interessante non ti pare?

    :ciauz:
    Nicola


  • Community Manager

    Interessante, molto 🙂

    Qualcuno tradurrebbe i brevetti? 😄 Anche in modo da capire se si parla di qualche esempio con strumenti, anche se ne dubito.

    Quello che sicuramente si può ipotizzare è che Google potrebbe usare vari strumenti di analisi e di banca dati. Pensiamo a Google Trends, al più recente Google Web History, a Google Blog e Google Calendar.

    Praticamente, ha in modo automatico, la certezza dio un evento. Non solo perchè molti utenti useranno Calendar, ma sopratutto perchè gli stessi utenti cercheranno le chiavi relative agli eventi e i blogger/rss sforneranno articoli.

    **Fantastico!

    **Ora tutti si aspettano: come lo sfruttiamo noi SEO questo brevetto?

    Io personalmente starei molto attento a creare un sito sulle Olimpiadi del 2012 oggi e puntargli nel giro di qualche mese tutti i link che ho 😄

    Rischio prima di far scattare qualche campanello, poi ti non avere link quando arriverà il momento e quindi di essere spostato giù quando gli altri documenti riceveranno link nel periodo caldo.

    Quindi, i link, dovranno essere ben dosati nel periodo caldo cercando di mantenere una media di crescita di link ottima.

    Solo che dovremmo andare ad istinto 🙂

    Ci tengo a precisare che queste sono solo mie opinioni, date da una lettura veloce 🙂

    :ciauz:


  • Super User

    Leggo su Search Engine Roundtable che i nuovi brevetti registrati sono 4... oltre a quelli citati sopra, quindi, anche questi due:

    Document Scoring Based on Query Analysis
    Document Scoring Based on **Traffic **Associated with a Document

    ... la cosa si fa ancor piu' interessante... solo un paio di esempi: dal primo dei due: " generating a score for the document based, at least in part, on the amount of time the one or more users spent accessing the document"

    (punteggio in base al tempo di permanenza degli utenti su di un doc)

    Dall'altro invece davvero sorprendente il concetto di "Traffic" : "The system generates a score for the document based, at least in part, on the extent to which advertisements are presented or updated within the document, the quality of the advertiser associated with the advertisement provided within the document, whether the advertisement relates to an advertising document that has more than the threshold amount of traffic, and/or the extent to which the advertisement generates user traffic to the advertising document"

    in realtà si parla di traffico generato da "pubblicità" presenti nel documento, e di ranking in funzione non solo del traffico , ma anche del tipo e della qualità di "pubblicità" presente ...* wow... che le sospette influenze di adword/adsense sul ranking abbiano un qualche fondamento????*

    *Chi si sbilancia con qualche ipotesi? 🙂 *

    (qui la discussione su webmasterworld)

    :ciauz:
    Nicola


  • Super User

    Ciao Nicola,
    e grazie per la segnalazione, sei davvero una vedetta puntuale e solerte 🙂

    Non ho ancora letto i quattro documenti, quindi non so cosa aggiungono ai precedenti brevetti sui dati storici, ma posso dirti di sicuro che già nel precedente paper gli ad venivano considerati uno degli strumenti utilizzabili per misurare il traffico generato dai documenti.

    http://www.giorgiotave.it/forum/posizionamento-nei-motori-di-ricerca/3572-brevetto-google-sui-dati-storici-il-traffico.html
    (Sez. 0090 del PDF)

    Appena ho tempo leggo i nuovi brevetti, ma escludo di avere il tempo per farne una traduzione stavolta.
    :ciauz:


  • User Attivo

    Ciao ragazzi,

    ho visto i nuovi brevetti il giorno dopo la loro uscita, ogni tanto mi diverto a fare qualche ricerca sull'ufpto. 😄

    Per quanto riguarda quello sul traffico e sull'analisi delle ricerche non c'è molto di nuovo: sono gli stessi identici brevetti sui dati storici ripetuti per tutti i brevetti, l'unica cosa che cambia sono i claims, l'aggiunta cioè di diversi obiettivi per ogni tipo di brevetto.

    Gli altri due son diversi e toccherebbe dar un'occhiata a quelli.

    :ciauz: