- Home
- Categorie
- La Community Connect.gt
- Tutto sulla Community
- PageRank per immagini in arrivo
-
PageRank per immagini in arrivo
Google ha presentato un brevetto per riconoscere,indicizzare ed associare a delle keyword il contenuto delle immagini.
Il pagerank per le immagini sta arrivando.
http://www.docstoc.com/docs/529160/PageRank-for-Product-Image-Search
-
Ecco qua il brevetto depositato.
-
Nota per chi legge. Molto spesso nel testo originale compaiono descrizioni come ?l'almeno una immagine? e ?l'almeno un elemento?. Per rendere la lettura in italiano decentemente comprensibile ho tolto queste scritte e sostituito rispettivamente con ?immagine? e ?elemento?. Laddove ho riportato invece le singole frasi è perchè ho ritenuto necessario riportare il testo dall'inglese per fare chiarezza.
[CENTER]Abstract[/CENTER]
Un sistema metodo e mezzi leggibili da computer sono are rilevati per fornire immagini ordinate. Il sistema può includere un componente di aggregazione per aggregare una pluralità di immagini al testo corrispondente. In aggiunta, il ssitema può includere un detector di nome per riconoscere i nomi dentro una query di ricerca. Inoltre, il sistema può includere un componente ordinante per ordinare le immagini aggregate basato sul nome che il detector di nomi rileva.-
Un metodo per fornire immagini ordinate, comprende:identificare almeno una immagine su una pagina web di un sito web; identificare almeno un elemento di testo associato con almeno una immagine di una pagina web del sito web; associare l'almeno una immagine all'almeno un elemento di testo di un database; e ordinare l'almeno una immagine basata su uno o più fattori di ordinamento del database, dove almeno uno o più fattori considrea una relazione di link tra l'almeno una immagine e almeno un'altra immagine.
-
Il metodo di cui al punto 1, dove uno o più fattori di ordinamento includono un fattore di ordinamento che considerae un numero di siti web che includono una identica copia dell'immagine
-
Il metodo di cui al punto 1, dove uno o più fattori di ordinamento includono un fattore di ordinamento che considera un numero di siti web che includono una versione simile dell'immagine
-
Il metodo di cui al punto 1, dove uno o più fattori di ordinamento includono un fattore di ordinamento che considera una dimensione di una immagine
-
Il metodo di cui al punto 1, dove uno o più fattori di ordinamento includono un fattore di ordinamento che considera il numero totale di link che sono verso l'URL di una immagine
-
Il metodo di cui al punto 1, dove un primo insieme di metadati associati con una immagine è condiviso da ogni immagine che ha una relazione di link.
-
Il metodo di cui al punto 1, dove uno o più fattori di ordinamento includono un fattore di ordinamento che considera la frequenza con cui una immagine appare su un sito web.
-
Un sistema per fornire immagini ordinate, comprendente:un componente di aggregazione per aggregare una pluralità di immagini con il testo corrispondente;un detector di nomi per individuare i nomi dentro una query di ricerca;un componente di ordinamento per ordinare le immagini aggregate basate su quello che il detector di nomi ha identificato come nome.
-
Il sistema di cui al putno 8, comprendente anche un identificatore di faccia.
-
Il sistema di cui al punto 9, in cui le immagini dentro le immagini aggregate sono individuate dal face detector per includere almeno una faccia di una persona sono ordinate più in alto quando il detector di nomi individua il nome di una persona dentro la query di ricerca.
-
Il sistema di cui al punto 9, dove le immagini dentro le immagini aggregate che sono identificate dal face detector includono almeno la faccia di una persona sono ordinate più in basso o più in alto quando il detector di nomi non individua il nome di una persona dentro la query di ricerca.
-
Il sistema di cui al punto 8, dove il componente di ordinamento ulteriore ordina le immagini aggregate basate almeno su una caratteristica dell'immagine.
-
Il sistema di cui al punto 12, dove almeno una caratteristica dell'immagine include almeno il numero di pixel, un allungamento (aspect ratio), una dimensione del file immagine, l'entropia dell'immagine e il gradiente dell'immagine.
-
Uno più mezzi leggibili da computer aventi istruzioni utilizzabili al computer archiviate su ciò che fa un metodo per fornire immagini in ordine, il metodo comprendente:ricevere una query di ricerca che include almeno un elemento di testo;identificare almeno una immagine relativa alla query di ricerca;ordinare almeno una delle immagine usando uno o più elementi di ordinamento, dove almeno uno dei fattori di ordinamento considera una distanza tra un elemento di testo e una immagine sulla pagina web; e fornisce una o più immagini ordinate.
-
Un mezzo leggibile da computer secondo il punto 14, ulteriore che converte la distanza di ogni elemento di testo dentro la query di ricerca in un punteggio preliminare usando una funzione sigmoidale.
-
Il mezzo leggibile al computer di cui al punto 15, dove il punteggio preliminare di ogni elemento di testo è sommato per calcolare un punteggio generale.
-
Il mezzo leggibile al computer di cui al punto 14, dove la distanza è determinata considerando uno o più numeri di parole d'intervento, simboli, e tag tra l'item e l'immagine.
-
Il mezzo leggibile al computer di cui al punto 14, dove uno o più fattori di ordinamento includono un fattore di ordinamento che considera se almeno una immagine include una faccia di una persona.
-
Il mezzo leggibile al computer di cui al punto 14, dove in uno o più fattori di ordinamento includono un fattore che considera se la query di ricerca include il nome di una persona.
-
Il mezzo leggibile al computer di cui al punto 14, dove uno o più fattori di ordinamento includono un fattore di ordinamento che considera il numero totale delle immagini di un sito web.
-
-
[0001]Non applicabile.
Dichiarazione riguardante ricerca o sviluppo sponsorizzata federalmente.
[0002]Non applicabile.
BACKGROUND
[0003] I motori di ricerca possono fornire molti servizi di ricerca agli utenti compresi testo, immagini e video. Oggi le ricerche per contenuti testuali generalmente comprendono la maggioranza delle ricerche fatte dagli utenti. In ogni caso ricerche per contenuti di immagini stannno aumentando e sono popolari; servizi di ricerche immagini stanno diventando sempre più disponibili.
[0004]Al momento, la tecnologia di ricerca immagini è basata su ricerche di parole chiave e non è basata sulla ricerca del mezzo stesso. Una immagine è ad esempio indicizzata dalla sua URL e dal testo associato dalla pagina web in cui appare. Le query di ricerca che rispondono al testo indicizzato possono restituire una immagine associata come risposta, con una piccola o meno informazione dal mezzo immagine stesso essendo usando in un processo di richiesta.
[0005]Al momento non ci sono metodi sufficienti per determinare la rilevanza di ogni immagine indicizzata per una corrispondente query di ricerca. I metodi convenzionali possono non prendere in considerazione la rilevanza del testo indicizzato con le immagini corrispondenti. In più i metodi convenzionali possono non considerare la qualità delle immagini indicizzate. Di conseguenza, i metodi convenzionali per fornire immagini in risposta ad una query di ricerca di immagini possono non fornire i miglior possibile risultato immagine di ricerca all'utente che fa la richiesta.
-
Sommario
[0006]Un sistema, metodo, e mezzo leggibile al computer sono rilevati per fornire immagini in ordine. Il mezzo leggibile al computer può essere configurato per effettuare un metodo che includa ricevere una query di ricerca che ha del testo e che identifica immagini correlate alla query di ricerca. Ancora, il metodo effettuato può includere l'ordinamento usando uno o più fattori di ordinamento e fornendo le immagini ordinate al richiedente.
[0007]Questo sommario è fornito per introdurre una selezione di concetti in forma semplificata che sono descritti anche sotto nella descrizione dettagliata. Questo sommario non è da intendersi per identificare le caratteristiche chiave o essenziali del tema esatto, né da essere usato come sussidio nel determinare lo scopo del tema.
Breve descrizione dei disegni
[0008]I contenuti illustrativi dellap presente invenzione sono descritti in dettagli sotto con riferimento alle figure disegnate allegate, che sono incorporate dal riferimento
[0009]FIG. 1 è un diagramma di blocco di un ambiente operativo d'esempio per implementare l'invezione.
[0010]FIG. 2 è un diagramma di blocco di un contenuto di un sistema per implementare l'invenzione.
[0011]FIG. 3 è un diagramma di flusso che illustra un contenuto di un metodo per creare un database di immagini e testo associato.
[0012]FIG. 4 è un diagramma di flusso che illustra un metodo per fornire immagini ordinate in risposta ad una query di ricerca di immagine.
Descrizione dettagliata
[0013]Riferendosi inizialmente alla FIG. 1, un ambiente di rete d'esempio per implementare la presente invenzione è mostrato e indicato generalmente come ambiente di rete 100. L'ambiente di rete 100 è un esempio di ambiente adatto è non si intende suggerire nessuna limitazione sullo scopo d'uso o la funzionalità dell'invenzione. Ne l'ambiente di rete 100 dovrebbe essere interpretato come avere alcuna dipendennza o requisito di ogni altra combinazione di elementi illustrati.
[0014]L'invenzione può essere descritta nel contesto generale de codice al computer o istruzioni macchina, incluse istruzioni eseguibili al computer come moduli di programma, essere eseguire da un computer o altra macchina, come un PDA o altri device tenuti in mano. In genere, i moduli di programma includono routine, programmi, oggetti, componenti, strutture dati, etc., si riferiscono al codice ce effetua compiti particolari o implementano particoli tipi di dati astratti. L'invenzione può essere esercitata in una varietà di configurazioni di sisitemi, inclusi i devices tenuti in mano, elettronica di consumo, computer di uso generale, device speciali di calcolo, server, etc. L'invenzione può anche essere esercitata in un ambiente di calcolo distribuito dove i compiti sono eseguiti da da device remoti che sono linkati attraverso una rete di comunicazione.
[0015]L'ambiente di rete 100 include un client 102 associato alla rete 104 tramite una interfaccia di comunicazione. L'interfaccia di comunicazione può essere una interfaccia che può permettere al cliente di essere connesso direttamente ad altri device o permettere che il client 102 sia connesso a un device sulla rete 104. La rete 104 può includere ad esempio una rete LAN, WAN, o Internet. In un contenuto, il client 102 può essere connesso a un altro device tramite una interfaccia wireless attraverso la rete 104.
[0016] Uno o più server comunicano col client 102 tramite la rete 104 usando un protocllo come HTTP, un protocollo usato comunemente su Internet per scambiare informazioni. Nel contenuto illustrato, un server frontend 106 e un server backend 108 (es: web server o server di rete) sono accoppiati alla rete 104. Il client 102 impiega la rete 104, il server frontend 106 e il server backend 108 per accedere ai dati archiviati di pagine web ad esempio in un indice di dati centrale (indice) 110.
[0017] I contenuti della presente invenzione effettuano ricerche per dati rilevanti permettendo ai risultati della ricerca di essere mostrati a un utente 112 in risposta a una richiesta di un utente specifico (es: una query di ricerca). In un contenuto, l'utente 112 usate il client 102 per inserire una richiesta di ricerca comprendente uno o più termini riguardanti un particolare argomento di interesse per il quale l'utente 112 vorrebbe identificare documenti elettronici rilevanti (es: pagine web). Ad esempio, il server frontend 106 rispondere al client client 102 autenticando l'utente 112 e redirezionando la richiesta dall'utente 112 al server di backend 108.
[0018] Il server di backend 108 può processare una query inviata usando l'indice 110. In questo modo, il server di backend 108 può recuperare dati per documenti elettronici (es: risultati della ricerca) che possono essere rilevanti per l'utente. L'index 110 contiene informazioni riguardanti i documenti elettronici come le pagine web disponibili in Internet. In più, l'indice 110 può includere una varietà di altri dati associati ai documenti elettronici come la posizione (es:, link, o URL), metatag, testo, e categoria di documento. Nell'esempio di FIG. 1, la rete è descritta nel contesto dei dispersi risultati della ricerca e mostrare tali risultati all'utente 112 attraverso il client102. Considerevolmente, sebbene i server di frontend 106 e backend 108 sono descritti come componenti differenti si possono intendere come un singolo server che potrebbe eseguire la funzione di entrambi.
[0019] Un'applicazione motore di ricerca (applicazione) 114 è eseguita dal server backend 108 per identificare le pagine web e like (i.e., electronic documents) in risposta alla richiesta di ricerca ricevuta dal client 102. Più nello specifico, l'applicazione 114 identifica i documenti rilevanti dall'indice 110 che corrispondono a uno o più termini inclusi nella richieseta di ricerca e seleziona le pagine web più rilevanti da mostrare all'utente 112 attraverso il client 102.
[0020] La FIG. 2 è un diagramma di blocco di un contenuto di un sistema 200 per implementare l'invenzione. Il sistema può includere il client 202, il gestore di contenuti 204, e una rete 212. Il client 202 può o essere o può includere un computer desktop o laptop, una rete abilitata per cellulari (con o senza capacità di acquisire mezzi o fare playback), wireless email client, o altro client, machine o device per eseguire vari task compresi navigazione web, ricerca, email e altri task, applicaizoni e funzioni. Il client 202 può inoltre essere un qualsiasi altro device portatile comeuna camera digitale, una video camera digitale (con o senza capacità di catturare immagini), media player come as player musicali e video personali, e ogni altro device portatile. Il client 202 può anche essere un server come una workstation che esegue Microsoft Windows.RTM., MacOS.TM., Unix, Linux, Xenix, IBM AIX.TM., Hewlett-Packard UX.TM., Novell Netware.TM., Sun Microsystems Solaris.TM., OS/2.TM., BeOS.TM., Mach, Apache, OpenStep.TM. O altro sistema operativo o piattaforma.
[0021] Il gestore di contenuti 204 può essere un server come una workstation che esegue Microsoft Windows.RTM., MacOS.TM., Unix, Linux, Xenix, IBM AIX.TM., Hewlett-Packard UX.TM., Novell Netware.TM., Sun Microsystems Solaris.TM., OS/2.TM., BeOS.TM., Mach, Apache, OpenStep.TM. o altro sistema operativo o sistema. In un contenuto, il gestore di contenuti 204 può essere un motore di ricerca che contiene uno o più elementi 106, 108, 110, 114, e 116 (FIG. 1). Il gestore di contenuti 204 può anche includere un modulo di aggregazione 206, database 208, componente di ordinamento 210, e detector di nmi 214. In un contenuto, uno o più componenti di aggregazioni 206, database 208, componente di ordinamento 210, e detector di nomi 214 possono essere componenti esterni al gestore di contenuti 204. In un simile contenuto, il gestore di contenuti 204 può mantenere accesso verso i componenti esterni o controllarli.
[0022] Il componente di aggregazione 206 può essere utilizzato per il crawling di pagine web per aggregare immagini e testo che appare nelle stesse pagine come immagini. Il testo può includere, ad esempio, ogni tipo di caratteri o simboli. Una volta che una immagine e il testo corrispondente all'immagine sono stati identificati, il componente di aggregazione può archiviare le immagini e il loro testo corrispondente nel database 208. In un contenuto, il database 208 è lo stesso indice 110 (FIG. 1). In un contenuto, il testo può essere o meno relativo all'immagine. In un altro contenuto il componente di aggregazione 206 può aggregare il testo che è collegato a un'immagine ma è trovato su una diversa pagina web [da quella] dell'immagine. Il componente di aggregazione 206 può essere configurato per associare il testo trovato sulla stessa pagina come una immagine associata che è a una distanza qualsiasi dall'immagine associata. Un amministratore ad esempio del sistema 200 può determinare la distanza che il testo può avere dall'immagine per essere associato all'immagine.
[0023] In un contenuto, il gestore di contenuti 204 può ricevere richieste di ricerca che includono una o più query di ricerca per immagini archiviate nel database 208. Una query di ricerca può includere qualsiasi testo che è relativo a un'immagine che chi fa la richiesta vorrebbe recuperare. Il gestore di contenuti 204 può identificare il testo dentro la query di ricerca e confrontare il testo con quello archiviato nel database 208. Il gestore di contenuti 204 può recuperare qualsiasi immagine che ha il testo associato che è simile al testo della query di ricerca. Una volta che le immagini sono state recuperate, il componente di ordinamento 210 può essere utilizzato per ordinare le immagini recuperate in un ordine di rilevanza per la query di ricerca. Il componente di ordinamento 210 può determinare l'ordine di rilevanza usando uno oiù fattori di ordinamento per determinare la rilevanza. I fattori di ordinamento possono essere usati per far salire o scendere il livello di rilevanza dell'immagine per la query di ricerca.
[0024] Il detector di nomi 214 può essere utilizzato per individuare se una query di ricerca includa il nome di una persona. In un contenuto, il detector di nomi 214 può essere istruito a riconoscere nomi diversi inserendo una lista di nomi e cognomi da libri di nomi nel detector di nomi 214. Il detector di faccia 216 può essere un qualsiasi detector di faccia convenzionale che può essere utilizzato per identificare le facce nelle immagini archiviate nel database 208.
[0025] La FIG. 3 è un diagramma di flusso che illustra un contenuto del metodo 300 per creare un database di immagini e testo associato. Il metodo 300 inoltre illustra un contenuto dove le immagini sono ordinate per come sono archiviate nel database. All'operazione 302, le imamgini sono identificare su una pluralità di pagine web. Le immagini possono essere identificate con qualsiasi significato conversionale come ad esempio identificare i tag dell'immagine dentro il codice sorgente di una pagina web. All'operazione 304, il testo è identificato per ogni immagine. Il testo può essere o meno correlato all'immagine. In un altro contenuto, il testo può essere trovato sulla stessa pagina web dove l'immagine è identificata e può essere a qualsiasi distanza dallimmagine identificata. In un altro contenuto, il testo può essere identificato come relativo a un'immagine è trovato su diverse pagine web per la stessa immagine.
[0026] All'operazione 306, le immagini identificate possono essere associate al testo identificato corrispondente dentro il database. All'operazione 308, le immagini dentro il database sono ordinate basandosi su uno o più fattori di ordinamento. La posizione nell'ordinamento di un'immagine può salire o scendere basandosi sui fattori di ordinamento. Sotto ci sono alcuni fattori di ordinamento che possono essere impiegati quando vengono ordinate le immagini:
Collezionare ed usare il numero di siti web che contengono la stessa immagine identica come elemento di ordinamento.
[0027] Un fattore di ordinamento può essere basato sul numero di siti web che contengono la stessa immagine. Con questo fattore di ordinamento l'invenzione determina che le immagini che compaiono nelle pagine web di uno o più siti possono essere più rilevanti delle immagini che compaiono in un solo sito. Come tali, l'ordinamento di una immagine può essere incrementato in base al numero di siti web dove viene individuata l'immagine. In un contenuto, l'invenzione può determinare se diversi siti web contengono una immagine identica valutando l'url dell'immagine. Se i siti web puntano alla setssa URL di una particolare immagine, allora si può determinare che le immagini sono identiche. In un altro contenuto, immagini identiche possono essere determinare calcolando un hash di un'immagine. Il valore di hash di un'immagine può essere confrontato con i valori di hash delle altre immagine, e se i valori sono gli stessi, le immagini sono considerate identiche. Come descritto sopra più grande è il numero di siti web che contengono immagini identiche all'immagine identificata e più in alto è ordinata l'immagine identica. In ogni caso in un altro contenuto più grande è il numero di siti web che contengono immagini identiche a quella identificata e più basso è la posizione dellimmagine identificata.
Collezionare ed usare il numero di siti web che contengono immagini simili come fattore di ordinamento.
[0028] Un altro fattore di ordinamento può essere basato sul numero di siti web che contengono immagini simili. Ad esempio una immagine su sito web che è simile alle immagini su latri siti web può ricevere un ordinamento più alto che dipende dal più grande numero di altri siti web che includono queste immagini simili. In un contenuto, una prima immagine individuata su un primo sito web è simile a una seconda immagine su un secondo sito web se la seconda immagine è una versione modificata della prima immagine. Ad esempio, la prima e la seconda immagine sono considerate simili se la seconda immagine è una versione ridimensionata (più grande o più piccola) della prima immagine. In un altro esempio una versione modificata può anche includere una seconda immagine che è stata prodotta tagliando (cropping) una prima immagine o può includere una seconda immagine che è stata prodotta aggiungendo un bordo intorno alla prima immagine. Come descritto sopra più grande è il numero di siti web che contengono immagini simili all'immagine identificata per prima e più alto è l'ordinamento dell'immagine identificata. Comunque in un altro contenuto più grande è il numero di siti web che contengono immagini simili all'immagine identificata e più basso è l'ordinamento dell'immagine identificata.
Collezionare e usare le dimensioni delle immagini come fattore di ordinamento
[0029] Un altro fattore di ordinamento può essere basato sulle dimensioni delle immagini. In un altro contenuto l'invenzione può essere configurata per determinare che gli utenti è più probabile che clicchino su immagini con un più grande numero di pixel. Come tali, le immagini con un più grande numero di pixel possono essere posizionare più in alto delle immagini con un numero inferiore di pixel.. In un altro contenuto le immagini con un più grande numero di pixel sono posizionate più in basso rispetto alle immagini che hanno un numero di pixel minore.
-
Collezionare e usare le relazioni di link tra immagini come fattore di ordinamento
[0030] Un altro fattore di ordinamento può essere basato sul numero di relazioni di link che un'immagine ha con altre immagini. In un contenuto, le immagini con una relazione di link possono incrementare ogni altro ordinamento. Due immagini possono avere una relazione di link se in risposta all'accesso alla prima immagine a un utente potrebbe presentarsi una seconda immagine. Tale relazione di link può essere mostrata, ad esempio quando un'immagine e una versione thumbnail della stessa sono collegate insieme così che accedere a una versione dell'immagine può condurre l'utente ad accedere all'altra versione dell'immagine. Come descritto sopra, più grande è il numero di relazioni di link che un'immagine ha e più alto è l'ordinamento che l'immagine sulle altre. Comunque, in un altro contenuto, più alto è il numero di relazioni di link che un'immagine ha sulle altre, e più basso è l'ordinamento dell'immagine sulle altre.
[0031] Usando un fattore di ordinamento di relazione di link le immagini che sono linkate insieme possono condividere ciascuna i metadati associati alle altre che poi possono essere usati per rispondere alle query di ricerca. Ad esempio, immaginiamo che una thumbnail che ha testo linkato text vicino è linkata a un'immagine grande della thumbnail dove l'immagine grande è mostrata su una pagina web priva di testo. Ogni immagine può essere interessata, e possibilmente potrebbe aumentare, l'ordinamento di ogni altra immagine. Ad esempio, la dimensione dell'immagine più grande, un conteggio dei pixel ad esempio, può anche essere condiviso e associato con la thumbnail, e il testo vicino alla thumbnail può anche essere condiviso e associato all'immagine grande. I metadati convidisi possono essere associati ad ogni immagine linkata dentro il database 208.
Collezionare e usare la frequenza dell'immagine dentro un sito web come fattore di ordinamento
[0032] Un'altra caratteristica di ordinamento può essere basata sul numero di volte che un'immagine è usata dentro un sito web. Ad esempio, se una pluralità di pagine web dentro un sito web linkano la stessa immagine (il sito web contiene l'immagine su più pagine web dentro il sito web) o se un'immagine è mostrata una pluralità di volte su pagine web dentro il sito web, allora l'invenzione può essere configurata per dare all'immagine un ordinamento più basso di altre immagini che non sono mostrate più di una volta sul sito web. L'immagine può ricevere un valore di ordinamento più basso poiché l'invenzione può determinare che l'immagine è parte del design grafico del sito web piuttosto che un'immagine importante. Comunque, in un altro contenuto, un'immagine può ricevere un ordinamento più elevato quando il numero di volte che l'immagine è mostrata dentro un sito web è più elevato.
Individuare i livelli di caratteristiche di immagini come fattore di ordinamento:
[0033] Un altro fattore può essere basato sull'individuare le immagini che non incontrano o che eccedono i livelli caratteristici di immagine. In un contenuto, le caratteristiche dell'immagine possono includere, ma non sono limitati a, numero di pixel, proporzioni (aspect ratio),dimensione del file immagine, entropia dell'immagine, e gradiente dell'immagine. Un amministratore, ad esempio, può impostare livelli di soglia per ciascuna delle caratteristiche dell'immagine. In un contenuto, un'immagine può essere ordinata più in basso se non risponde o se supera un livello di soglia per ognuna delle caratteristiche dell'immagine. In un altro contenuto, un'immagine può essere ordinata più in alto se non incontra o supera un livello di soglia per ciascuna delle caratteristiche dell'immagine.
Altri fattori di ordinamento
[0034] Un'altra caratteristica di ordinamento può essere basata sul numero totale di una pagina web. Ad esempio, a un'immagine può essere dato un ordinamento più elevato o più basso basato sul numero di immagini che sono nella stessa pagina web dell'immagine. In più, un'altra caratteristica di ordinamento può essere basata sul numero totale di immagini che sono linkate da una particolare pagina web. Ad esempio, a un'immagine può essere dato un ordinamento più elevato o più basso basato sul numero di immagini che sono linkate dalla stessa pagina web dove si trova l'immagine. Inoltre, un'altra caratteristica di ordinamento può essere basata sul numero totale di thumbnail che sono posizionate sulla stessa pagina web dell'immagine ordinata. Ad esempio, a un'immagine può essere dato un ordinamento più elevato o più basso basato sul numero di thumbnail che sono collocate sulla stessa pagina dell'immagine. Ancora, un'altra caratteristica dell'ordinamento può essere basata sul numero totale di link che sono verso l'URL di una immagine. Ad esempio, a un'immagine può essere dato un ordinamento più elevato se ha un grande numero di link verso la sua URL rispetto alle altre immagini. In un altro contenuto l'immagine può ricevere un più basso ordinamento se riceve un grande numero di link verso la sua URL rispetto alle altre immagini.
[0035] La FIG. 4 è un diagramma di flusso diun metodo 400 per fornire immagini ordinate un risposta a una query di ricerca immagini. Il metodo di FIG. 4 può essere configurato per ordinare immagini ?al volo? come le query di ricerca sono ricevute dopo che è creato un database di immagini e di testo associato. In un contenuto, il database può essere creato eseguendo le operazioni 302, 304, e 306 di FIG. 3. All'operazione 402, viene ricevuta una query di ricerca che include il testo. All'operazione 404, sono identificate le immagini relative alla query di ricerca. In un contenuto, le immagini sono identificate confrontando il testo della query di ricerca con il testo associato alle immagini che sono archiviate nel database. All'operazione 406, le immagini identificate sono ordinate usando uno o più fattori di ordinamento descritti sopra. All'operazione 408, le immagini ordinate identificate possono essere fornire al richiedente.** Inoltre, quando l'ordinamento è fatto ?al volo? come in FIG. 4, le immagini identificate possono essere anche ordinate usando un qualsiasi altro fattore di ordinamento**:
Pesando la distanza del testo dall'immagine come fattore di ordinamento
[0036] Un altro fattore di ordinamento può essere basato sulla distanza che il testo dentro una query di ricerca è individuato sulla stessa pagina web dell'immagine, così che [quando il testo] è più vicino all'immagine è associato più forte rispetto al testo che è un po' più distante dall'immagine. La distanza che il testo dentro una query di ricerca ha dall'immagine può essere basato su elementi di distanza differente. Elementi distanti possono includere il numero di parole che intervengono tra il testo e l'immagine, il numero di arresti completi come "." "?" "!" e altra punteggiatura di fine frase/ simboli tra il testo e l'immagin, il numero di tag di celle di tabelle (<td>) che intervengono tra il testo e l'immagine, e il numero di tag di righe di tabelle (<tr>) tra il testo e l'immagine. Un amministratore può essere in grado di configurare questo fattore di ordinamento per pesare ogni distanza di elementi in maniera uguale o differentemente. Ad esempio quella che segue è una formula d'esempio per calcolare la distanza dell'immagine dal testo dentro una query di ricerca che è collocato sulla stessa pagina web dell'immagine:
Distance=(1numero di parole)+(10numero di arresti totali)+(5numero di <td>)-(10numero di <tr>)
Nella formula sopra, il numero di parole che intervengono è moltiplicato per un fattore di peso 1, il numero di arresti totali per un fattore di peso 10, il numero di <td> è moltiplicato per un fattore di peso 5, e il numero di <tr> è moltiplicato per 10. Con questo fattore di ordinamento e con ogni altro fattore descritto sopra in cui un valore numerico viene calcolato o determinato per ordinare un'immagine il valore numerico può essere convertito in un punteggio"S" usando una funzione sigmoide per valutare ulteriormente l'ordinamento delle immagini. Con il presente fattore di ordinamento se la query di ricerca include una o più parole la distanza di ogin parola può essere convertita in un punteggio "S" e ogni punteggio può essere sommato per calcolare un punteggio complessivo di tutta la query di ricerca.
Usare l'identificazione di faccia e nome come fattore di ordinamento:
[0037] Un altro fattore di ordinamento può essere basato sul sul fatto che un'immagine includa una faccia di una persona. Ad esempio, un identificatore di facce 216 (FIG. 2) può essere usato per scansionare le immagini archiviate nel database 208 (FIG. 2) per determinare se le immagini includono una o più facce. In un contenuto le immagini con il più grande numero di facce possono essere ordinate più in alto rispetto alle altre immagini. In un altro contenuto le immagini con solo una faccia possono essere ordinate più in alto rispetto alle immagini che non hanno nessuna faccia o con più di una faccia.
[0038] Ancora, l'invenzione può essere configurata per valutare se la query di ricerca ricevuta è una richiesta di una immagine di una persona. In un contenuto, l'invenzione può determinare se la query di ricerca è una richiesta di una immagine di una persona attraverso l'uso del detector di nomi 214 (FIG. 2). In un contenuto, l'invenzione può usare un detector di nomi per determinare che la query di ricerca è per un'immagine di una persona e le immagini che includono facce di persone possono essere ordinate più in alto delle immagini che non contengono facce di persone. In un altro contenuto, se la query di ricerca include un nome , l'invenzione può usare il detector di nomi per determinare che la query di ricerca non è per una immagine di una persona e le immagini che contengono facce possono essere ordinate più in basso rispetto alle immagini che non contengono facce.
[0039] Mentre particolari contenuti dell'invenzione sono stati illustrati e descritti in dettaglio, si dovrebbe capire che vari cambiamenti e modifiche possono essere fatti all'invenzione senza allontanarsi dallo scopo e dall'intento dell'invenzione. I contenuti descritti qui sono intesi nei rispetto totale ed essere più illustrativi che restrittivi. Contenuti alternativi diventeranno apparenti a questi esperti nell'arte di cui la presente invenzione fa parte senza lasciare il suo scopo.
[0040] Da cosa precede si è visto che questa invenzione è ben adottata per raggiungere tutti i fini e gli oggetti disposti sopra, insieme con ogni altro vantaggio, che sono ovvi e relativi al sistema e al metodo. Si sara appreso che certe caratteristiche e sotto-combinazioni sono di utilità e possono essere impiegate senza riferimento a altre caratteristiche e sotto-combinazioni. Questo è contemplato e rientra nelle altre aggiunte.
-
Segnalo gli aggiornamenti nel blog di Google riguardo a image search e la conferma del riconoscimento facciale che avevamo gia' appreso dal brevetto:
googlesystem.blogspot.com/2008/05/future-updates-for-google-image-search.html