• Community Manager

    Nuovo Brevetto per Google?

    Da Motoriericerca un nuovo [url=http://www.motoriericerca.com/Brevetto-Google-aprile-2006]Brevetto Google

    " Un sistema di ?ricerca e raccomandazione? impiega le preferenze ed i profili di utenti, individuali e di gruppo, all'interno di una comunità di utenti, cosi come pure le informazioni derivate dagli ?indicatori di contenuto? categoricamente organizzati per accrescere le ricerche in Internet, ri-posizionare i risultati delle ricerche , e fornire raccomandazioni per quegli oggetti basati sull'oggetto di ricerca iniziale.

    Il sistema di ?ricerca e raccomandazione? opera nel contesto di gestione degli ?indicatori di contenuto?, che archiviano gli indicatori di contenuto di utenti (alcuni dei quali potrebbero essere pubblicati o condivisi per usi di gruppo) su un database centrale di ?indicatori di contenuto? connesso a Internet.

    Il sistema di ?indicatori di contenuto? condivisi è implementato come un programma distribuito, porzione del quale operano sul terminale dell'utente e altre che lavorano sul sistema centrale del database degli indicatori. Un ?indicatore di contenuto? di un utente è organizzato in accordo con una gerarchia locale, a tema, e categorica.

    L'organizzazione gerarchica è usata per definire un contesto rilevante entro il quale gli oggetti restituiti vengono valutati e ordinati. "

    [url=http://patft1.uspto.gov/netacgi/nph-Parser?Sect1=PTO2&Sect2=HITOFF&u=%2Fnetahtml%2FPTO%2Fsearch-adv.htm&r=1&p=1&f=G&l=50&d=PTXT&S1=Google.ASNM.&OS=AN/Google&RS=AN/Google]Il nuovo Brevetto di Google

    Cosa ne pensate?

    Giorgio

    P.S. Più tardi aggiorno tutto sul SES con impressioni finali, thread risolutivo di tutti i post e ultime due sessioni 😉


  • Super User

    @Giorgiotave said:

    Cosa ne pensate?
    Aspetto che qualcuno lo traduca dal brevettese al linguaggio di noi umani.

    A naso sembra avere a che fare col tagging/social bookmarking (?), comunque.


  • User Attivo

    A fine febbraio si diceva che Google avrebbe lanciato il suo social bookmarking a giorni.
    Recentemente ha registrato googlesubscribed.com e googlesubscribedlinks.com.
    Potrebbe essere l'ennesimo rumor, ma la cosa inizia a puzzare...


  • Super User

    @Tagliaerbe said:

    ma la cosa inizia a puzzare...

    e noi respiriamo a pieni polmoni 😄


  • User Attivo

    @ArkaneFactors said:

    A naso sembra avere a che fare col tagging/social bookmarking (?), comunque.

    Si Arkane: gli "indicatori di contenuto" dovrebbero essere segnalibri e preferiti segnalati dagli utenti.

    Come si legge dalla descrizione dell'invenzione:

    "sistemi e metodi per abilitare ricerche e raccomandazioni di documenti in un insieme attraverso l?uso di segnalibri condivisi in una comunità di utenti."

    E' già qualche giorno che studio il brevetto, ma il testo stesso non è ben paragrafato come il brevetto dei Dati Storici e, visto che non riesco a visualizzare le immagini descrittive (qualcuno ci riesce?), tradurre "per bene" il brevetto richiederà un po di tempo.

    Si tratta anche di capire il possibile campo di applicazione:
    nel social networking, guarda caso, il successo di [url=www.orkut.com]Orkut ultimamente si sta facendo sentire.

    E se avesse legami con Orkut?

    A riguardo di Orkut vi segnalo due articoli:

    Google to Integrate Orkut into Search - SearchEngineJournal http://www.searchenginejournal.com/?p=395
    Why Google needs Orkut ? Jeremy Zawodny
    http://jeremy.zawodny.com/blog/archives/001504.html

    Nel frattempo vi posto la traduzione del "background of invention", utile cmq per approfondire un po la situazione.

    Il popolo dei navigatori fa sempre più difficoltà a trovare quello cerca a causa del continuo aumento di dati e info disponibili. Su Internet, per esempio, esistono milioni e milioni di pagine individuali; in più molte grandi compagnie includono spesso nella loro intranet magazzini pieni di informazioni con migliaia di documenti.

    É anche abbastanza frequente che il documento sul Web o nei depositi di una intranet non sia ben indicizzato. Di conseguenza, trovare l?informazione desiderata in un insieme cosi vasto, senza conoscere identita, locazione, o caratteristiche più specifiche, può diventare difficile come trovare un ago in un pagliaio.

    Il World Wide Web è un imprecisato insieme di documenti concatenati, locati su server distribuiti su Internet. Ogni documento ha un suo indirizzo URL, Uniform Resource Locator, che lo identifica in maniera univoca.
    La maggior parte dei documenti sul Web è in formato HTML, HyperText Markup Language, il linguaggio di video scrittura per il Web, che permette di formattare il documento e collegare contenuti esterni (immagini e file multimediali) per introdurli nel documento, insieme ai link.
    Ovviamente, un utente non può pretendere di ricordare un URL per ogni documento su Internet, anche da un piccolo insieme di documenti preferiti sarebbe difficile.

    I moderni browser hanno introdotto il concetto di ?segnalibri? o ?preferiti?, chiamati semplicemente segnalibri per il resto del documento. I segnalibri permettono all?utente di identificare quali documenti vorrebbe avere sempre a disposizione.

    I segnalibri possono essere pensati come ?indicatori? di contenuto sul Web, specificando ognuno un indirizzo che identifica la locazione del documento desiderato, ma non includendo il contenuto del documento.
    Nella versione corrente di Netscape Navigator, I segnalibri deli utenti sono archiviati e mantenuti in uno speciale file HTML contenuto della macchina. Questo file include una lista di siti rappresentata da un titolo e una URL. Tutto l?intero insieme dei segnalibri è contenuto in un singolo file HTML.

    Nelle recenti versioni di IE si archiviano i segnalibri dell?utente come un file individuale sul file system della macchina. Ogni segnalibro è un piccolo file contenente la URL del sito, mentre il titolo del segnalibro viene archiviato come il nome del file.

    Nessuno degli attuali browser permette un uso più sofisticato dei segnalibri, permettendo comunque alcune manipolazioni. Per esempio, è generalmente possibile creare e modificare una gerarchia di segnalibri (includendo un?ordinamento e muovendo i segnalibri esistenti nella gerarchia); è possibile modificare titolo e URL del segnalibro, cercare alcune parole nel titolo o nell?URL, e spesso derivare informazioni addizionali circa il segnalibro, come la data di creazione, le visite recenti, le visite totali, e altre informazioni.

    Nell?uso tipico, i segnalibri di un browser web funzionano come ?filtri? per quei documenti che l?utente ritiene particolarmente importanti o utili. Mentre un utente potrebbe vedere centinaia di pagine web in un giorno, solo alcune di queste sono state cercate per trovare informazioni utili. Se queste pagine potrebbero essere utili in futuro, l?utente spesso aggiungerà un segnalibro per quella pagina. Questo è un modo utile per gli utenti per accedere alle informazioni su Internet; comunque, i segnalibri tradizionali hanno la limitazione che la collezione è un atto manuale, tipicamente realizzato quando sia la pagina desiderata o la sua URL sono ricevute manualmente da un?altra persona.

    In più, il sistema dei segnalibri tradizionali sono per un singolo utente. Certamente i segnalibri possono essere esportati in una pagina pubblica, permettendo agli altri di vedere e usare i segnalibri.

    Quando un utente desidera cercare un informazione su Internet che non è presente nei suoi segnalibri, l?utente spesso usa un motore di ricerca per trovare l?informazioni. Il motore di ricerca fornisce nel caso all?utente un indice di contenuti condivisi su Internet.

    Ci sono due categorie principali di motori di ricerca: quelli che includono documenti a siti web che sono analizzati e usati per popolare una gerarchia di categorie di soggetti (come la directory di Yahoo) e quelli che esplorano il web o insiemi di documenti per costruire un database di termini consultabili, permettendo la ricerca per parole chiave del contenuto di una pagina web. (Altavista, Google, Excite e tanti altri)
    Conosciuti poi sono I sistemi di raccomandazione, che sono capaci di fornire raccomandazioni di siti web basati su criteri forniti dall?utente o basati sulla comparazione con un singolo documenti preferito (la dicitura che spesso troviamo come "more like this").

    Google è l?esempio di un motore di ricerca che incorpora alcune implementazioni come i sistemi di raccomandazione. Funziona in modo simile ai tradizionali motori di ricerca basati sulle parole chiavi, nel quale la ricerca comincia con l?introduzione di uno o più termini di ricerca da parte dell?utente, da far coincidere a diversi schemi di analisi dei documenti sul Web. Esso differisce dai motori di ricerca tradizionali (come Altavista), nei quail I risultati della ricerca sono ordinate basandosi su una misura dell?importanza della pagina, che differisce dal numero di occorrenze del termine cercato (e semplici variazioni di questo tema)

    La misura dell?importanza di un documento che Google effettua si basa su fattori principali: il numero di pagine (ovunque nel Web) che linkano una pagina (inbound links, definendo la pagina recuperata come un ?autorità?), e il numero di pagine che la pagina recuperata linka (outbound links, definendo la pagina come ?hub?). I link in entrata e in uscita di una pagina vengono pesati, basandosi sulla determinata importanza che Google attribuisce alla pagina, risultando da un punteggio di importanza per ogni pagina recuperata.

    I risultati della ricerca sono presentati in ordine di valore decrescente, con le pagine ritenute più importanti presentate per prime. Dovrebbe essere chiaro che la misura dell?importanza di un pagina che Google effettua è basata su schemi di collegamento sul Web per intero, e non limitato alle preferenze di un singolo utente o gruppi di utenti.

    Un altro motore di ricerca non tradizionale è il sistema IBM CLEVER (CLient-side EigenVector Enhanced Retrieval). CLEVER, come Google, opera come un motore di ricerca tradizionale, e usa il sistema inlink/autorità e outlink/hub come misura dell?importanza di una pagina. Ancora, l?importanza (basata sui links attraverso il Web) è usata per ordinare i risultati della ricerca.

    Unlike Google, CLEVER uses page content (e.g., the words surrounding inlinks and outlinks) to attempt to classify a page's subject matter.

    A differenza di Google, CLEVER usa il contenuto delle pagine (ad esempio le parole che circondano i link, sia in entrata che in uscita) per cercare di classificare il soggetto della pagina. Così, CLEVER non usa il suo database di contenuti del Web, ma un hub esterno, come un indice generato da un altro motore di ricerca, per definire delle ?comunità iniziali? di documenti sul Web. Dagli hubs sul Web, che frequentemente rappresentano gli interessi delle persone, CLEVER è capace di identificare comunità, a da queste comunità, identificare pagine importanti o correlate.

    Direct Hit è un servizio che coopera con I motori di ricerca tradizionali (come HotBot), cercando di determinare quail pagine restituite da una ricerca sono interessanti o importanti, come percepito dagli utenti che hanno precedentemente fatto ricerche simili. Direct Hit traccia quali pagine in una lista di risultati di un ricerca sono visitate più frequentemente; è anche in grado di tracciare la quantità di tempo spesa dall?utente sul sito linkato prima di restituire i risultati della ricerca. I più popolari vengono promossi per future ricerche.

    Alexa è un sistema capace di tracciare le azioni dell?utente durante la sua navigazione. Facendo questo, Alexa mantiene un database storico delle navigazioni dell?utente. L?importanza di una pagina è derivata dalla cronologia di navigazione dell?utente. In accordo, in ogni momento (non solo nel contesto di ricerca), Alexa può dare all?utente informazioni sulle pagine correlate, derivate dagli schemi di traffico, dalla struttura dei link, dal contenuto della pagina, e dal informazioni editoriali.

    Knowledge Pump, un sisstema Xerox, fornisce raccomandazioni basate su comunità di utenti inizialmente permettendo agli utenti di identificare i propri interessi ed ?esperti? nelle aree di interesse. Knowledge Pump è poi in grado di ?spingere? le informazioni rilevanti agli utenti basandosi su queste preferenze; questo è compiuto monitorando il traffico nel network per creare profili di utenti, includendo i loro interessi e ?comunità di pratica?, infine rifinendo le specificazione della comunità. Knowledge Pump attualmente non presenta alcuna azione di ricerca e recupero come i sistemi basati sui motori di ricerca descritti sopra.

    Mentre i sistemi e i servizi precendeti sono una miscela di tradizionali motori di ricerca e sistemi di raccomandazione di vari gradi, dovrebbe essere percepito che nessuno di questi è attualmente adattabile alle capacità di un motore di ricerca mentre si prendono le preferenze di un piccolo gruppo di utenti e non si considera Internet per intero. In particolare, potrebbe essere utile essere in grado di incorporare raccomandazioni basate su comunità in un sistema che è capace di recuperare precedentemente documenti sconosciuti da Internet.

    C'è un unica cosa che ho sottolineato e che non capisco: è quel "a differenza di Google" e la frase che segue che non mi va ne giù ne su :mmm:
    leggo male?

    Il brevetto è fresco fresco e l'assegnatario è Google Inc.
    Idee?

    Scusate per eventuali orrori ortografici, ma il tempo ultimamente è sempre più tiranno 😉


  • Super User

    Grazie per la lunga ed accurata traduzione, Raele. Sei un vero Angelo. 😉

    Io per pigrizia-mista-a-stanchezza-da-venerdì-sera m'ero fermato alla lettura dell'abstract in italiano... 😄

    Questo brevetto spiana chiaramente la strada a Google per l'integrazione di un sistema di social tagging/bookmarking che possa essere utilizzato per (cito traducendo da Summary of the Invention😞

    migliorare la ricerca e recupero delle informazioni, migliorare la generazione di raccomandazioni basate sull'argomento (sia per i documenti che per i gruppi), e [per permettere] la categorizzazione e il sunto automatico dei documenti.

    Un sistema utile anche per indicizzare una parte crescente del cosiddetto "invisible Web", aggiungo io. 😉

    @Raele said:

    C'è un unica cosa che ho sottolineato e che non capisco: è quel "a differenza di Google" e la frase che segue che non mi va ne giù ne su :mmm:
    leggo male?
    No, hai tradotto bene. Provo a interpretare: a differenza di Google, CLEVER tenta di classificare l'argomento di una pagina, cioè collocarlo in una tassonomia (gerarchia di classi o categorie) predefinita.


  • User Attivo

    @ArkaneFactors said:

    Grazie per la lunga ed accurata traduzione, Raele. Sei un vero Angelo. 😉

    Io per pigrizia-mista-a-stanchezza-da-venerdì-sera m'ero fermato alla lettura dell'abstract in italiano... 😄

    in brevettese poi... 😄

    la traduzione del background andava fatta anche per chiarire la situazione a chi ultimamente non ha seguito gli sviluppi nel social networking o sulla crescente [url=http://www.giorgiotave.it/forum/viewtopic.php?t=9737]importanza degli schemi di traffico per il tracciamento dei comportamenti e delle preferenze degli utenti.

    @ArkaneFactors said:

    Questo brevetto spiana chiaramente la strada a Google per l'integrazione di un sistema di social tagging/bookmarking che possa essere utilizzato per (cito traducendo da Summary of the Invention😞

    migliorare la ricerca e recupero delle informazioni, migliorare la generazione di raccomandazioni basate sull'argomento (sia per i documenti che per i gruppi), e [per permettere] la categorizzazione e il sunto automatico dei documenti.

    e perchè non usare magari questa marea di dati per correggere le ricerche sul motore di ricerca?

    cito l'articolo di Zawodny segnalato sopra:

    What surprises me is that nobody has looked at it the other way around: What problems might Orkut solve that Google would otherwise find significantly more challenging?

    Those that do seem to speculate about "applying your social network to search" and other exotic stuff, but I'm thinking of something far more basic than that: users.

    That's right, users.

    Now, I know what you're thinking. "Google has millions of users!" Of course they do. How much do they really know about those users? Do they really have a user database from which they can mine interesting data? If they have one, it must pale in comparison to what Yahoo, AOL, and MSN have.

    Rather than try to convince users to start "registering" for Google, why not piggyback on one of the most viral fads going around: a social network application? And, for added effect, make it an invite only system so that you feel special once you're invited.

    Just think about it for a few minutes. If you've been thru the Orkut registration process, you know that it attempts to collect a ton of data about you. The kind of demographic data that marketing folks drool over. And right now there are lots of folks dying to get that special invite and begin the sign-up process.

    Still with me? Good.

    Let's assume that Google internationalizes Orkut and lets it run to the point that it has millions of users registered and active. That's not an unreasonable thing to expect. Then, one day down the road, they quietly decide to "better integrate" Orkut with Google and start redirecting all Orkut requests to orkut.google.com.

    Bingo!

    ma le immagini riuscite a visualizzarle?


  • Super User

    @Raele said:

    e perchè non usare magari questa marea di dati per correggere le ricerche sul motore di ricerca?
    Beh, lo dice: enhanced search and retrieval. E' prima nell'elenco delle possibili applicazioni dell'invenzione, in effetti.

    L'interpretazione proposta dal buon Zawodny riguardo alla possibile integrazione di Orkut in chiave di un progressivo sfruttamento, da parte di Google, dei dati e profili utente è condivisibile; tralascia però di considerare un aspetto a mio avviso fondamentale: come ogni innovazione finora introdotta da Google, anche quelle che si prefigurano per il prossimo futuro sono anche finalizzate al miglioramento dell'esperienza utente e della qualità dei risultati.

    Insomma, non è solo userexploitation. 😉

    ma le immagini riuscite a visualizzarle?
    No. 😞

    P.S., per Giorgiotave: se clicco sul pulsante "Quota" del post di Raele, ottengo questo:

    CGI Error
    The specified CGI application misbehaved by not returning a complete set of HTTP headers.
    Mi capita abbastanza spesso di incontrare questo errore quando tento di fare reply-with-quote a un messaggio contenente più citazioni.