[0088] According to an implementation consistent with the principles of the invention, information relating to traffic associated with a document over time may be used to generate (or alter) a score associated with the document. For example, search engine 125 may monitor the time-varying characteristics of traffic to, or other "use" of, a document by one or more users. A large reduction in traffic may indicate that a document may be stale (e.g., no longer be updated or may be superseded by another document).
In accordo con una implementazione coerente con i principi dell'invenzione, le informazioni relative al traffico associato ad un documento nel tempo possono essere usate per generare ( o alterare ) un punteggio associato con il documento stesso. Per esempio Google può monitorare le caratteristiche della variazione nel tempo del traffico verso un documento, o altro uso dello stesso documento da parte di uno o più utenti. Una rilevante riduzione di traffico può indicare che un documento può essere "stantio" (non più aggiornato o sostituito da un'altro documento).[0089] In one implementation, search engine 125 may compare the average traffic for a document over the last j days (e.g., where j=30) to the average traffic during the month where the document received the most traffic, optionally adjusted for seasonal changes, or during the last k days (e.g., where k=365). Optionally, search engine 125 may identify repeating traffic patterns or perhaps a change in traffic patterns over time. It may be discovered that there are periods when a document is more or less popular (i.e., has more or less traffic), such as during the summer months, on weekends, or during some other seasonal time period. IBy identifying repeating traffic patterns or changes in traffic patterns, search engine 125 may appropriately adjust its scoring of the document during and outside of these periods.
[0089] In una implementazione Google può comparare il traffico medio per un documento negli ultimi J giorni ( dove per esempio J=30) al traffico medio durante il mese in cui il documento ha ricevuto il maggior traffico, eventualmente corretto per cambi stagionali, o durante gli ultimi K giorni (dove per esmpio K=365). Opzionalmente Google può identificare schemi di traffico ripetitivi o anche un cambio negli schemi di traffico nel tempo. Può essere evidenziato che ci sono periodi in cui un documento è più o meno popolare (per esempio ha più o meno traffico ), come durante i mesi estivi, o i weekends, o durante altri periodi stagionali. Identificando schemi di traffico ripetitivi o cambi negli schemi di traffico Google può appropriatamente aggiustare il punteggio di un documento durante o fuori da questi periodi.
[0090] Additionally, or alternatively, search engine 125 may monitor time-varying characteristics relating to "advertising traffic" for a particular document. For example, search engine 125 may monitor one or a combination of the following factors: (1) the extent to and rate at which advertisements are presented or updated by a given document over time; (2) the quality of the advertisers (e.g., a document whose advertisements refer/link to documents known to search engine 125 over time to have relatively high traffic and trust, such as amazon.com, may be given relatively more weight than those documents whose advertisements refer to low traffic/untrustworthy documents, such as a pornographic site); and (3) the extent to which the advertisements generate user traffic to the documents to which they relate (e.g., their click-through rate). Search engine 125 may use these time-varying characteristics relating to advertising traffic to score the document.
[0090] In più, o alternativamente, Google può monitorare le caratteristiche della variazione nel tempo relativamente al "traffico pubblicitario" per un particolare documento. per esempio Google può monitorare una o più combinazioni dei seguenti fattori: (1) Il numero di inserzioni ed il ritmo a cui le inserzioni sono presentate o aggiornate in un dato documento nel tempo. (2) la qualità degli inserzionisti (per esempio a un documento i cui inserzionisti linkino siti che Google conosce per avere guadagnato nel tempo alto traffico ed affidabilità, come Amazon.com, può essere assegnato più peso che ad un documento i cui inserzionisti linkino siti a basso traffico ed affidabilità, come siti pornografici); e (3) il grado al quale gli inserzionisti generano traffico verso il documento a cui fanno riferimento (per esempio l'andamento dei click-trough ). Google può utilizzare queste caratteristiche della variazione nel tempo relativamente al "traffico pubblicitario" per dare un punteggio al documento.
[0091] In summary, search engine 125 may generate (or alter) a score associated with a document based, at least in part, on information relating to traffic associated with the document over time.
[0091] In sintesi, Google può generare ( o alterare ) un punteggio associato ad un documento, basandosi, almeno in parte ad informazioni relative al traffico associato al documento nel tempo.
:sherlock: Mi sembra che il punto 3 del paragrafo 0090 si riferisca esplicitamente ad un monitoraggio dei click sugli ad-sense. Come potrebbero mai rilevare il click-trough su inserzioni non loro?
[0092] User Behavior - Comportamento degli utenti
[0093] According to an implementation consistent with the principles of the invention, information corresponding to individual or aggregate user behavior relating to a document over time may be used to generate (or alter) a score associated with the document. For example, search engine 125 may monitor the number of times that a document is selected from a set of search results and/or the amount of time one or more users spend accessing the document. Search engine 125 may then score the document based, at least in part, on this information.
In accordo con un implementazione, l?informazione corrispondente al comportamento individuale o di massa degli utenti nei confronti di un documento puo? essere usato per generare (o alterare) un punteggio associato al doc. per esempio gg puo? monitorare il numero delle volte che un documento e? selezionato da un set di risultati di una ricerca e/o la quantita? di tempo che uno o piu? utenti spendono accedendo al documento. Gg puo? allora assegare un punteggio al documento basandosi, almeno in parte su queste informazioni.
[0094] If a document is returned for a certain query and over time, or within a given time window, users spend either more or less time on average on the document given the same or similar query, then this may be used as an indication that the document is fresh or stale, respectively. For example, assume that the query "Riverview swimming schedule" returns a document with the title "Riverview Swimming Schedule." Assume further that users used to spend 30 seconds accessing it, but now every user that selects the document only spends a few seconds accessing it. Search engine 125 may use this information to determine that the document is stale (i.e., contains an outdated swimming schedule) and score the document accordingly.
Se un documento e? il risultato di una certa query e nel tempo, o in un lasso di tempo, gli utenti passano piu? o meno tempo in media sul documento dato dalla stessa query (o da una simile), allora questo puo? essere usato come un indicazione che il documento e? fresco o datato, rispettivamente.
Esempio: key della query: ?Riverview swimming schedule"?la query restituisce il documento dal titolo ?Riverview swimming schedule". Si assuma poi che gli utenti usavano spendere 30 secondi accedendo al documento, ma ora ogni utente che seleziona il documento spende solo alcuni secondi accedendo ad esso. Gg puo? usare questa informazione per determinare che il documento e? datato. (per esempio contiene una lista datata)
[0095] In conclusione, gg puo? generare (o alterare) un punteggio associate al documento basato, almeno in parte, sull?informazione corrispondete al comportamento, individuale o di massa, degli utenti nei confronti del documento nel tempo.
[0096] Domain-Related Information
[0097] According to an implementation consistent with the principles of the invention, information relating to a domain associated with a document may be used to generate (or alter) a score associated with the document. For example, search engine 125 may monitor information relating to how a document is hosted within a computer network (e.g., the Internet, an intranet or other network or database of documents) and use this information to score the document.
Le informazioni relative al dominio associate con un documento posssono essere usate per generare, o alterare, un punteggio associate col documento. Per esempio GG puo? monitorare informazione riguardanti come un documento e? hostato (se su internet, attraverso una intranet o altri network o db di documenti) e usare queste info per dare un punteggio al documento.
[0098] Individuals who attempt to deceive (spam) search engines often use throwaway or "doorway" domains and attempt to obtain as much traffic as possible before being caught. Information regarding the legitimacy of the domains may be used by search engine 125 when scoring the documents associated with these domains.
**Chiunque cerchi di ingannare il mdr spesso usando ?throwaway? **(letteralmente volantini, depliant, foglietto pubblicitario) o domini doorway e cercano di ottenere piu? traffico possibile prima di essere beccati.
(?.aho ma sta frase nn po esse cosi??.manca un pezzo!!!o lho tradotta male?
dategli un?occhiata che sembra molto importante).
Le info riguardanti la legittimita? dei domini possono essere usate da GG quando assegna un punteggio ai documenti associati a questi domini.
[0099] Certain signals may be used to distinguish between illegitimate and legitimate domains. For example, domains can be renewed up to a period of 10 years. Valuable (legitimate) domains are often paid for several years in advance, while doorway (illegitimate) domains rarely are used for more than a year. Therefore, the date when a domain expires in the future can be used as a factor in predicting the legitimacy of a domain and, thus, the documents associated therewith.
Alcuni segnali possono essere usati per distinguere tra domini legittimi e illegittimi. Per esempio i domini possono essere rinnovati su un periodo di 10 anni. I domini legittimi sono spesso pagati per alcuni anni in anticipo, mentre i domini doorway (illegittimi) raramente sono usati per piu? di un anno. Comunque, la data quando un dominio scadra? in futuro puo? essere usata come fattore per predire la lagettimita? di un dominio, e quindi dei documenti associati ad esso.
[0100] Also, or alternatively, the domain name server (DNS) record for a domain may be monitored to predict whether a domain is legitimate. The DNS record contains details of who registered the domain, administrative and technical addresses, and the addresses of name servers (i.e., servers that resolve the domain name into an IP address). By analyzing this data over time for a domain, illegitimate domains may be identified. For instance, search engine 125 may monitor whether physically correct address information exists over a period of time, whether contact information for the domain changes relatively often, whether there is a relatively high number of changes between different name servers and hosting companies, etc. In one implementation, a list of known-bad contact information, name servers, and/or IP addresses may be identified, stored, and used in predicting the legitimacy of a domain and, thus, the documents associated therewith.
Anche, o alternativamente, il DNS del dominio puo? essere monitorato per predire se un dominio e? legittimo. Il record DNS contiene dettagli di chi ha registrato il dominio, indirizzi amministrativi e tecnici, e gli indirizzi dei name servers (per esempio i server che traducono il nome del dominio in indirizzo ip). Analizzando questa data nel tempo per un dominio, possono essere scovati i domini illegittimi. Per esempio GG puo? monitorare se le informazioni dell?indirizzo fisicamente corrette esistono in un periodo di tempo, se le info dei contatti per il dominio cambiano relativamente spesso, se c?e? un relativamente alto numero di cambiamenti tra differenti name server e compagnie di hosting. e/o l?inidirizzo IP puo? essere identificato, storato, e usato per predire la legittimita? di un dominio, e quindi dei doc associati.
[0101] Also, or alternatively, the age, or other information, regarding a name server associated with a domain may be used to predict the legitimacy of the domain. A "good" name server may have a mix of different domains from different registrars and have a history of hosting those domains, while a "bad" name server might host mainly pornography or doorway domains, domains with commercial words (a common indicator of spam), or primarily bulk domains from a single registrar, or might be brand new. The newness of a name server might not automatically be a negative factor in determining the legitimacy of the associated domain, but in combination with other factors, such as ones described herein, it could be.
Anche, o alternativamente, l?eta?, o alter info, riguardanti il name server associate con il dominio puo? essere usata per predire la legittimita? di un dominio. Un buon name server puo? avere un mix di differenti domini da differenti registrazioni e avere una storia di hosting di questi domini, mentre un cattivo name server potrebbe hostare principalmente pornografia o domini doorway, domini con parole commerciali (indicatore di spam), o primariamente domini di massa da un singolo. La freschezza di un name server non automaticamente e? un fattore negativo nella determinazione della legittimita? del dominio associate, ma in combinazione con altri fattori, come quelli descritti sopra, potrebbe esserlo.
[0102] In summary, search engine 125 may generate (or alter) a score associated with a document based, at least in part, on information relating to a legitimacy of a domain associated with the document.
[0103] Ranking History
[0104] According to an implementation consistent with the principles of the invention, information relating to prior rankings of a document may be used to generate (or alter) a score associated with the document. For example, search engine 125 may monitor the time-varying ranking of a document in response to search queries provided to search engine 125. Search engine 125 may determine that a document that jumps in rankings across many queries might be a topical document or it could signal an attempt to spam search engine 125.
[0104] In accordo con una implementazione coerente con i principi dell'invenzione, informazioni relative ai precedenti posizionamenti di un documento possono essere usate per generare ( o alterare ) un punteggio associato con il documento. Per esempio Google può monitorare le variazioni nel tempo del posizionamento di un documento in risposta a ricerche fornite a (n.d.t. eseguite su? ) Google. Google può decidere che un documento che migliora nel posizionamento per molte ricerche può essere un documento di attualità oppure può segnalare un tentativo di spam verso Google.
[0105] Thus, the quantity or rate that a document moves in rankings over a period of time might be used to influence future scores assigned to that document. In one implementation, for each set of search results, a document may be weighted according to its position in the top N search results. For N=30, one example function might be [((N+1)-SLOT)/N].sup.4. In this case, a top result may receive a score of 1.0, down to a score near 0 for the Nth result.
[0105] Pertanto la quantità o la velocità con le quali il posizionamento di un documento cambia in un periodo di tempo possono essere usate per influenzare futuri punteggi assegnati a quel documento. In una implementazione, per ciascun insieme di risultati di ricerca un documento può essere pesato in accordo alla sua posizione nei migliori N risultati di ricerca. Per N=30, una funzione di esempio potrebbe essere [((N+1)-SLOT)/N].sup.4. In questo caso un risultato al vertice può ricevere un punteggio di 1.0. fino ad abbassarsi ad un punteggio vicino a 0 per il risultato N.
0106] A query set (e.g., of commercial queries) can be repeated, and documents that gained more than M % in the
rankings may be flagged or the percentage growth in ranking may be used as a signal in determining scores for the
documents. For example, search engine 125 may determine that a query is likely commercial if the average (median)
score of the top results is relatively high and there is a significant amount of change in the top results from
month to month. Search engine 125 may also monitor churn as an indication of a commercial query. For commercial
queries, the likelihood of spam is higher, so search engine 125 may treat documents associated therewith
[0106] Un insieme di ricerche ( per esempio di ricerche commerciali ) può essere effettuato ripetutamente, e i
documenti che guadagnano più di M% posizioni possono essere contrassegnati oppure la percentuale di crescita del
posizionamento può essere usata come un segnale nel determinare punteggi del documento. Per esempio Google può
determinare che una key è probabilmente commerciale se il punteggio medio delle posizioni al vertice è
relativamente alto e c'è un significativo ammontare di cambiamenti nei primi risultati da mese a mese. Google può
anche controllare cambiamenti violenti come indicazione che una query è commerciale. Per le query commerciali la
probabilità di spam è più alta così Google può trattare i documenti ad esse associate di conseguenza.
[0107] In addition to history of positions (or rankings) of documents for a given query, search engine 125 may
monitor (on a page, host, document, and/or domain basis) one or more other factors, such as the number of queries
for which, and the rate at which (increasing/decreasing), a document is selected as a search result over time;
seasonality, burstiness, and other patterns over time that a document is selected as a search result; and/or
changes in scores over time for a URL-query pair.
[0107] Oltre alla storia dei posizionamenti dei documenti per date ricerche, Google può monitorare ( su una
pagina, un host, un documento e/o un dominio )uno o più altri fattori, come il numero di ricerche per cui, o la
velocità a cui ( crescente o decrescente ), un documento è selezionato come il risultato di una ricerca nel
tempo; stagionalità, picchi e altri schemi nel tempo secondo i quali un documento è selezionato come il risultato
di una ricerca; e/o cambi del punteggio nel tempo per una coppia di ricerche sull'url ( n.d.t. ???)
[0108] In addition, or alternatively, search engine 125 may monitor a number of document (e.g., URL) independent
query-based criteria over time. For example, search engine 125 may monitor the average score among a top set of
results generated in response to a given query or set of queries and adjust the score of that set of results
and/or other results generated in response to the given query or set of queries. Moreover, search engine 125 may
monitor the number of results generated for a particular query or set of queries over time. If search engine 125
determines that the number of results increases or that there is a change in the rate of increase (e.g., such an
increase may be an indication of a "hot topic" or other phenomenon), search engine 125 may score those results
higher in the future.
[0108] Inoltre, o alternativamente, Google può monitorare un numero di parametri indipendenti di un documento ( es. URL ), legati alle ricerche, nel tempo. Per esempio Google può monitorare il punteggio medio fra un set di risultati al vertice generato in risposta a una query o un set di query e aggiustare il punteggio di questi risultati e/o di altri risultati generati in risposta alla query o al set di query. Inoltre Google può monitorare il numero di risultati generati per una particolare query o per un set di query nel tempo. Se Google determina che il numero di risultati aumenta o che c'è un cambio nella velocità di aumento ( es. un tale incremento può indicare un argomento "caldo" o un altro fenomeno ), Google può alzare i punteggi per quei risultati in futuro.
[0109] In addition, or alternatively, search engine 125 may monitor the ranks of documents over time to detect sudden spikes in the ranks of the documents. A spike may indicate either a topical phenomenon (e.g., a hot topic) or an attempt to spam search engine 125 by, for example, trading or purchasing links. Search engine 125 may take measures to prevent spam attempts by, for example, employing hysteresis to allow a rank to grow at a certain rate. In another implementation, the rank for a given document may be allowed a certain maximum threshold of growth over a predefined window of time. As a further measure to differentiate a document related to a topical phenomenon from a spam document, search engine 125 may consider mentions of the document in news articles, discussion groups, etc. on the theory that spam documents will not be mentioned, for example, in the news. Any or a combination of these techniques may be used to curtail spamming attempts.
[0109] Inoltre, o alternativamente Google può monitorare i posizionamenti dei documenti nel tempo allo scopo di rilevarne picchi improvvisi. Un picco può indicare sia un fenomeno legato all'attualità ( per esempio ina notizia "calda" ) o un tentativo di spam verso Google attraverso, per esempio, lo scambio o l'acquisto di link. Google può prendere misure per prevenire tentativi di spam, per esempio attraverso l'uso di isteresi per permettere al posizionamento di crescere ma solo entro una certa velocità. In un'altra implementazione, al posizionamento di un dato documento può essere permessa una certa soglia di crescita massima in una predefinita finestra temporale. Come ulteriore misura per distinguere un documento relativo ad un fenomeno di attualità da un documento spam, Google può considerare la menzione del documento in articoli di news, gruppi di discussione etc. ipotizzando che i documenti spam non saranno menzionati, per esempio, nelle news. Ciascuna di queste tecniche o combinazione di esse può essere usata per limitare i tentativi di spam.
[0113] User Maintained/Generated Data - Dati conservati o generati dall'utente
[0114] According to an implementation consistent with the principles of the invention, user maintained or generated data may be used to generate (or alter) a score associated with a document. For example, search engine 125 may monitor data maintained or generated by a user, such as "bookmarks," "favorites," or other types of data that may provide some indication of documents favored by, or of interest to, the user. Search engine 125 may obtain this data either directly (e.g., via a browser assistant) or indirectly (e.g., via a browser). Search engine 125 may then analyze over time a number of bookmarks/favorites to which a document is associated to determine the importance of the document.
[0114] In accordo con una implementazione coerente con i principi dell'invenzione,i dati conservati o generati dagli utenti possono essere usati per generare, o alterare, un punteggio associato al documento. Per esempio, Google puo? monitorare i dati conservati o generati da un utente, come i ?segnalibri? , ?preferiti? ," o altri tipi dei dati che possono fornire una certa indicazione dei documenti favoriti da, o interessanti per, l?utente. .Google può ottenere direttamente (per esempio, via un assistente del browser) o indirettamente questi dati (per esempio, via un browser). Google può allora analizzare col tempo un certo numero di bookmarks/favorites a cui un documento è associato per determinare l'importanza del documento.
[0115] Search engine 125 may also analyze upward and downward trends to add or remove the document (or more specifically, a path to the document) from the bookmarks/favorites lists, the rate at which the document is added to or removed from the bookmarks/favorites lists, and/or whether the document is added to, deleted from, or accessed through the bookmarks/favorites lists. If a number of users are adding a particular document to their bookmarks/favorites lists or often accessing the document through such lists over time, this may be considered an indication that the document is relatively important. On the other hand, if a number of users are decreasingly accessing a document indicated in their bookmarks/favorites list or are increasingly deleting/replacing the path to such document from their lists, this may be taken as an indication that the document is outdated, unpopular, etc. Search engine 125 may then score the documents accordingly.
[ 0115 ] Il Search Engine 125 può anche analizzare le tendenze ascendenti e discendenti per aggiungere o rimuovere il documento (o più specificamente, un percorso per il documento) dalle liste di bookmarks/favorites, il tasso a cui il documento è aggiunto o è rimosso dalle liste di bookmarks/favorites e/o a se il documento è aggiunto, è cancellato da, o è raggiunto attraverso le liste di bookmarks/favorites. Se un certo numero di utenti stanno aggiungendo un documento particolare alle loro liste di bookmarks/favorites o spesso stanno accedendo al documento attraverso tali liste col tempo, questo può essere considerato un'indicazione che il documento è relativamente importante. D'altra parte, se un certo numero di utenti in modo decrescente stanno accedendo ad un documento indicato nella loro lista di bookmarks/favorites o stanno sempre piu? cancellando o cambiando il percorso a tale documento dalle loro liste, questo può essere preso come un'indicazione che il documento è antiquato, impopolare, ecc Google può allora notare di conseguenza i documenti.
[0116] In an alternative implementation, other types of user data that may indicate an increase or decrease in user interest in a particular document over time may be used by search engine 125 to score the document. For example, the "temp" or cache files associated with users could be monitored by search engine 125 to identify whether there is an increase or decrease in a document being added over time. Similarly, cookies associated with a particular document might be monitored by search engine 125 to determine whether there is an upward or downward trend in interest in the document.
[ 0116 ] In una implementazione alternativa, altri tipi di dati dell'utente che possono indicare un aumento o una diminuzione nell'interesse dell'utente nel tempo ad un particolare documento possono essere usati da Google per associare un punteggio al documento. Per esempio, i file temporanei o le cache associate con gli utenti potrebbe essere controllata da Google per identificare se c?è un aumento o una diminuzione in un documento che è aggiunto col tempo. Similmente, i cookies connessi con un particolare documento potrebbero essere controllati da Google per determinare se ci fosse una tendenza ascendente o discendente nell'interesse nel documento.