• Super User

    0106] A query set (e.g., of commercial queries) can be repeated, and documents that gained more than M % in the

    rankings may be flagged or the percentage growth in ranking may be used as a signal in determining scores for the

    documents. For example, search engine 125 may determine that a query is likely commercial if the average (median)

    score of the top results is relatively high and there is a significant amount of change in the top results from

    month to month. Search engine 125 may also monitor churn as an indication of a commercial query. For commercial

    queries, the likelihood of spam is higher, so search engine 125 may treat documents associated therewith

    accordingly.

    [0106] Un insieme di ricerche ( per esempio di ricerche commerciali ) può essere effettuato ripetutamente, e i

    documenti che guadagnano più di M% posizioni possono essere contrassegnati oppure la percentuale di crescita del

    posizionamento può essere usata come un segnale nel determinare punteggi del documento. Per esempio Google può

    determinare che una key è probabilmente commerciale se il punteggio medio delle posizioni al vertice è

    relativamente alto e c'è un significativo ammontare di cambiamenti nei primi risultati da mese a mese. Google può

    anche controllare cambiamenti violenti come indicazione che una query è commerciale. Per le query commerciali la

    probabilità di spam è più alta così Google può trattare i documenti ad esse associate di conseguenza.

    [0107] In addition to history of positions (or rankings) of documents for a given query, search engine 125 may

    monitor (on a page, host, document, and/or domain basis) one or more other factors, such as the number of queries

    for which, and the rate at which (increasing/decreasing), a document is selected as a search result over time;

    seasonality, burstiness, and other patterns over time that a document is selected as a search result; and/or

    changes in scores over time for a URL-query pair.

    [0107] Oltre alla storia dei posizionamenti dei documenti per date ricerche, Google può monitorare ( su una

    pagina, un host, un documento e/o un dominio )uno o più altri fattori, come il numero di ricerche per cui, o la

    velocità a cui ( crescente o decrescente ), un documento è selezionato come il risultato di una ricerca nel

    tempo; stagionalità, picchi e altri schemi nel tempo secondo i quali un documento è selezionato come il risultato

    di una ricerca; e/o cambi del punteggio nel tempo per una coppia di ricerche sull'url ( n.d.t. ???)


  • Super User

    [0108] In addition, or alternatively, search engine 125 may monitor a number of document (e.g., URL) independent

    query-based criteria over time. For example, search engine 125 may monitor the average score among a top set of

    results generated in response to a given query or set of queries and adjust the score of that set of results

    and/or other results generated in response to the given query or set of queries. Moreover, search engine 125 may

    monitor the number of results generated for a particular query or set of queries over time. If search engine 125

    determines that the number of results increases or that there is a change in the rate of increase (e.g., such an

    increase may be an indication of a "hot topic" or other phenomenon), search engine 125 may score those results

    higher in the future.

    [0108] Inoltre, o alternativamente, Google può monitorare un numero di parametri indipendenti di un documento ( es. URL ), legati alle ricerche, nel tempo. Per esempio Google può monitorare il punteggio medio fra un set di risultati al vertice generato in risposta a una query o un set di query e aggiustare il punteggio di questi risultati e/o di altri risultati generati in risposta alla query o al set di query. Inoltre Google può monitorare il numero di risultati generati per una particolare query o per un set di query nel tempo. Se Google determina che il numero di risultati aumenta o che c'è un cambio nella velocità di aumento ( es. un tale incremento può indicare un argomento "caldo" o un altro fenomeno ), Google può alzare i punteggi per quei risultati in futuro.


  • User Attivo

    Ringrazio di cuore Raele-l'Angelo e Beke perche' leggere la loro traduzione mi-ci semplifica non poco la vita.

    Appena avete finito mettete la traduzione sui vostri siti, sara' utilissima a molti altri seo.

    Certo che la parte che tratta del dominio legittino o illegittimo e' una bella botta, alla faccia di chi ottimizza cambiando unicamente le key od il codice delle pagine...

    Ehi seo come faccio a salire o non farmi penalizzare per il mio sito (ma il nome non te lo dico)?

    Risposta... rinnova in un botto per 10 anni il nome del tuo dominio e vedrai che un po' sali...


    Traducete il piu' possibile, se c'e' una dea dei seo ve ne rendera' merito... azz non riesco piu' a scrivere, il testo si confonde, svanisce... vedo solo piu'.... $$$$$$$$


  • Super User

    azz non riesco piu' a scrivere, il testo si confonde, svanisce... vedo solo piu'.... $$$$$$$$ :lol:

    E pensa che sembra probabile che a breve Google diventi registrar e hoster...

    Ma sicuramente questo non c'entra niente :impiccato:


  • Super User

    Here we go again....

    [0109] In addition, or alternatively, search engine 125 may monitor the ranks of documents over time to detect sudden spikes in the ranks of the documents. A spike may indicate either a topical phenomenon (e.g., a hot topic) or an attempt to spam search engine 125 by, for example, trading or purchasing links. Search engine 125 may take measures to prevent spam attempts by, for example, employing hysteresis to allow a rank to grow at a certain rate. In another implementation, the rank for a given document may be allowed a certain maximum threshold of growth over a predefined window of time. As a further measure to differentiate a document related to a topical phenomenon from a spam document, search engine 125 may consider mentions of the document in news articles, discussion groups, etc. on the theory that spam documents will not be mentioned, for example, in the news. Any or a combination of these techniques may be used to curtail spamming attempts.

    [0109] Inoltre, o alternativamente Google può monitorare i posizionamenti dei documenti nel tempo allo scopo di rilevarne picchi improvvisi. Un picco può indicare sia un fenomeno legato all'attualità ( per esempio ina notizia "calda" ) o un tentativo di spam verso Google attraverso, per esempio, lo scambio o l'acquisto di link. Google può prendere misure per prevenire tentativi di spam, per esempio attraverso l'uso di isteresi per permettere al posizionamento di crescere ma solo entro una certa velocità. In un'altra implementazione, al posizionamento di un dato documento può essere permessa una certa soglia di crescita massima in una predefinita finestra temporale. Come ulteriore misura per distinguere un documento relativo ad un fenomeno di attualità da un documento spam, Google può considerare la menzione del documento in articoli di news, gruppi di discussione etc. ipotizzando che i documenti spam non saranno menzionati, per esempio, nelle news. Ciascuna di queste tecniche o combinazione di esse può essere usata per limitare i tentativi di spam.


  • Community Manager

    @agoago said:

    Traducete il piu' possibile, se c'e' una dea dei seo ve ne rendera' merito... azz non riesco piu' a scrivere, il testo si confonde, svanisce... vedo solo piu'.... $$$$

    Che sei 😄

    Sicuramente dobbiamo ringraziare tutti, sto aspettando zil per mettere la nomina.

    Veramente a Beke volevo nominarlo in un altro modo, ma non mi viene 😄

    Beke ti va bene Traduttore?

    Comunque quando sarò finito lo pubblicheremo e pubblicizzeremo per bene con tutti i vostri copy 😉


  • Super User

    @"giorgiotave" said:

    @agoago said:
    Veramente a Beke volevo nominarlo in un altro modo, ma non mi viene 😄 😛

    [quote=giorgiotave]Beke ti va bene Traduttore? Veramente preferirei "Beke, l'uomo del destino" 😄

    A parte gli scherzi, l'unica cosa importante è che tu non apra un sondaggio per chiedere consigli al riguardo :lol:


  • Community Manager

    Fatto 🙂


  • User Attivo

    [0113] User Maintained/Generated Data - Dati conservati o generati dall'utente

    [0114] According to an implementation consistent with the principles of the invention, user maintained or generated data may be used to generate (or alter) a score associated with a document. For example, search engine 125 may monitor data maintained or generated by a user, such as "bookmarks," "favorites," or other types of data that may provide some indication of documents favored by, or of interest to, the user. Search engine 125 may obtain this data either directly (e.g., via a browser assistant) or indirectly (e.g., via a browser). Search engine 125 may then analyze over time a number of bookmarks/favorites to which a document is associated to determine the importance of the document.

    [0114] In accordo con una implementazione coerente con i principi dell'invenzione,i dati conservati o generati dagli utenti possono essere usati per generare, o alterare, un punteggio associato al documento. Per esempio, Google puo? monitorare i dati conservati o generati da un utente, come i ?segnalibri? , ?preferiti? ," o altri tipi dei dati che possono fornire una certa indicazione dei documenti favoriti da, o interessanti per, l?utente. .Google può ottenere direttamente (per esempio, via un assistente del browser) o indirettamente questi dati (per esempio, via un browser). Google può allora analizzare col tempo un certo numero di bookmarks/favorites a cui un documento è associato per determinare l'importanza del documento.

    [0115] Search engine 125 may also analyze upward and downward trends to add or remove the document (or more specifically, a path to the document) from the bookmarks/favorites lists, the rate at which the document is added to or removed from the bookmarks/favorites lists, and/or whether the document is added to, deleted from, or accessed through the bookmarks/favorites lists. If a number of users are adding a particular document to their bookmarks/favorites lists or often accessing the document through such lists over time, this may be considered an indication that the document is relatively important. On the other hand, if a number of users are decreasingly accessing a document indicated in their bookmarks/favorites list or are increasingly deleting/replacing the path to such document from their lists, this may be taken as an indication that the document is outdated, unpopular, etc. Search engine 125 may then score the documents accordingly.

    [ 0115 ] Il Search Engine 125 può anche analizzare le tendenze ascendenti e discendenti per aggiungere o rimuovere il documento (o più specificamente, un percorso per il documento) dalle liste di bookmarks/favorites, il tasso a cui il documento è aggiunto o è rimosso dalle liste di bookmarks/favorites e/o a se il documento è aggiunto, è cancellato da, o è raggiunto attraverso le liste di bookmarks/favorites. Se un certo numero di utenti stanno aggiungendo un documento particolare alle loro liste di bookmarks/favorites o spesso stanno accedendo al documento attraverso tali liste col tempo, questo può essere considerato un'indicazione che il documento è relativamente importante. D'altra parte, se un certo numero di utenti in modo decrescente stanno accedendo ad un documento indicato nella loro lista di bookmarks/favorites o stanno sempre piu? cancellando o cambiando il percorso a tale documento dalle loro liste, questo può essere preso come un'indicazione che il documento è antiquato, impopolare, ecc Google può allora notare di conseguenza i documenti.

    [0116] In an alternative implementation, other types of user data that may indicate an increase or decrease in user interest in a particular document over time may be used by search engine 125 to score the document. For example, the "temp" or cache files associated with users could be monitored by search engine 125 to identify whether there is an increase or decrease in a document being added over time. Similarly, cookies associated with a particular document might be monitored by search engine 125 to determine whether there is an upward or downward trend in interest in the document.

    [ 0116 ] In una implementazione alternativa, altri tipi di dati dell'utente che possono indicare un aumento o una diminuzione nell'interesse dell'utente nel tempo ad un particolare documento possono essere usati da Google per associare un punteggio al documento. Per esempio, i file temporanei o le cache associate con gli utenti potrebbe essere controllata da Google per identificare se c?è un aumento o una diminuzione in un documento che è aggiunto col tempo. Similmente, i cookies connessi con un particolare documento potrebbero essere controllati da Google per determinare se ci fosse una tendenza ascendente o discendente nell'interesse nel documento.

    :ciauz:


  • User Attivo

    [0118] Unique Words, Bigrams, Phrases in Anchor Text - Parole uniche, Bigrams???(che sono?), frasi negli anchor text

    [0119] According to an implementation consistent with the principles of the invention, information regarding unique words, bigrams, and phrases in anchor text may be used to generate (or alter) a score associated with a document. For example, search engine 125 may monitor web (or link) graphs and their behavior over time and use this information for scoring, spam detection, or other purposes. Naturally developed web graphs typically involve independent decisions. Synthetically generated web graphs, which are usually indicative of an intent to spam, are based on coordinated decisions, causing the profile of growth in anchor words/bigrams/phrases to likely be relatively spiky.

    [0119] In accordo con una implementazione coerente con i principi dell'invenzione, informazione a riguardo delle parole uniche, ?bigrams? (che sono?) e le frasi negli anchor text possono essere usati per generare, o alterare, un punteggio associato al documento. Per esempio, Google puo? monitorare ?grafici web? (o link) e il loro comportamento nel tempo e usare queste info per dare un punteggio al documento, rilevare se questo sia spam, o altri scopi. ?Grafici web? sviluppati naturalmente tipicamente implicano decisioni indipendenti. ?Grafici web? generati sinteticamente, che solitamente sono indicativi di spam, sono basati su decisione coordinate, ? causing the profile of growth in anchor words/bigrams/phrases to likely be relatively spiky?. Non lho capita!

    [0120] One reason for such spikiness may be the addition of a large number of identical anchors from many documents. Another possibility may be the addition of deliberately different anchors from a lot of documents. Search engine 125 may monitor the anchors and factor them into scoring a document to which their associated links point. For example, search engine 125 may cap the impact of suspect anchors on the score of the associated document. Alternatively, search engine 125 may use a continuous scale for the likelihood of synthetic generation and derive a multiplicative factor to scale the score for the document.

    [0120] una ragione per questa ?permalosità, fastidiosità? puo? essere l?addizione di un largo numero di anchors identiche da piu? documenti. Altra possibilita? puo? essere l?addizione deliberata di differenti ancore da molti documenti. Google puo? monitorare le ancore e usarle per dare punteggio al documento a cui puntano. Per esempio Google puo' ricoprire l'effetto degli ancoraggi sospetti nel punteggio associato ad un documento. Alternativamente, Google può usare una scala continua per la probabilità della generazione sintetica e derivare un fattore moltiplicativo per regolare il punteggio per il documento.

    [0121] In summary, search engine 125 may generate (or alter) a score associated with a document based, at least in part, on information regarding unique words, bigrams, and phrases in anchor text associated with one or more links pointing to the document.

    :ciauz:


  • Super User

    [0110] It may be possible for search engine 125 to make exceptions for documents that are determined to be authoritative in some respect, such as government documents, web directories (e.g., Yahoo), and documents that have shown a relatively steady and high rank over time. For example, if an unusual spike in the number or rate of increase of links to an authoritative document occurs, then search engine 125 may consider such a document not to be spam and, thus, allow a relatively high or even no threshold for (growth of) its rank (over time).

    [0110] E' possibile per Google fare eccezioni per documenti che sono considerati come autoritativi sotto qualche aspetto, come documenti governativi, web directories ( per esempio yahoo ) e documenti che hanno mostrato un posizionamento relativamente alto e stabile nel tempo. Per esempio se si verifica un picco inusuale nella velocità o nell'entità dell'incremento dei links che puntano a un documento autoritativo, allora Google può non considerare questo documento come spam e pertanto permettergli una soglia molto alta, o non applicare nessuna soglia, al suo posizionamento o alla crescita del suo posizionamento nel tempo.

    [0111] In addition, or alternatively, search engine 125 may consider significant drops in ranks of documents as an indication that these documents are "out of favor" or outdated. For example, if the rank of a document over time drops significantly, then search engine 125 may consider the document as outdated and score the document accordingly.

    [0111] Inoltre, o alternativamente, Google può considerare significative cadute nel posizionamento dei documenti come un'indicazione che il documento è "non apprezzato" o datato. Per esempio se il posizionamento di un documento nel tempo peggiora significativamente, allora Google può considerare il documento come datato ed assegnargli un punteggio di conseguenza.

    [0112] In summary, search engine 125 may generate (or alter) a score associated with a document based, at least in part, on information relating to prior rankings of the document.

    [0112] In sintesi, Google può generare ( o alterare ) un punteggio associato con un documento basato, almeno in parte, su informazioni relative ai precedenti posizionamenti del documento stesso.


  • Super User

    causing the profile of growth in anchor words/bigrams/phrases to likely be relatively spiky?. Non lho capita!

    più o meno direi...

    causando un profilo di crescita delle parole/bigrammi/frasi nei link facilmente assimilabile a un picco.

    Credo dica che i network "artificiali" di link si possono riconoscere perchè un sacco di link con gli stessi testi o quasi arrivano tutti insieme o quasi allo stesso documento.

    I famosi picchi di varia natura che fanno tutti scattare dei campanelli d'allarme.

    Forse i bigrams sono le frasi di due termini


  • Super User

    Cari Beke e Reale, siete bravissimi!
    Non sembra ma vi leggiamo tutti con attenzione.

    Credo che stiamo...(state) sviluppando un ottimo documento :vai:


  • User Attivo

    @beke said:

    causing the profile of growth in anchor words/bigrams/phrases to likely be relatively spiky?. Non lho capita!

    Forse i bigrams sono le frasi di due termini

    I bigrams letteralmente sono le parole di due lettere


  • Super User

    Ah... e perchè vengono distinti dall'insieme generico delle "parole", lo sai?


  • User Attivo

    @beke said:

    Ah... e perchè vengono distinti dall'insieme generico delle "parole", lo sai?

    no, sto facendo ricerche


  • Community Manager

    Ragazzi appena si collega qualche mio cugino chiedo per il termine.

    Intano ho fatto copia incolla si alcune frasi importanti delle vostre traduzioni.
    Per parlare possiamo aprire dei topic, come avevamo previsto, ma dobbiamo inserire la traduzione completa di quella parte 🙂

    Ecco la lista, scusate il copia incolla confuso

    Riassunto dei brevetti

    -Anzianità dei link
    -Inserire link poco alla volta
    -Pagine aggiornate (non html e php) diverse da pagine non aggiornate. Grandi quantità di contenuti aggiornati trattati diversamente da piccole
    -Quante pagine nuove aggiunge un sito in un determinato periodo
    -Salva una lista di termini nuovi
    -il motore genera una similarity hash e puo' usarlo sia per vedere se il documento cambia sia per scovare copie di documenti.
    -Parla di come dare un rank in base alle query e prima specifica che puo' farlo in base alle scelte degli utenti, poi
    -In pratica puo' dare un maggiore peso ai siti che sono associati con le notizie/termini piu' recenti, le super news in pratica
    -In pratica dice che un sito che compare per piu' key discordanti puo' (non necessariamente pero') essere considerato come un segnale che il documento e' spam, in questo caso gli verra' assegnato un punteggio relativamente basso
    -Parla a lungo di come anche la data dei link (quanti nuovi link ogni tot, quanti link spariscono) influisce
    -In particolare li dice che analizzando se i backlink calano od aumentano puo' derivare se un documento e' "fresco" oppure statico.. in pratica se continuiamo ad avere bl ci assegna un rank piu' alto, se ne perdiamo piu' basso
    -link da siti istituzionali o governativi valgono molto
    -link contanto di più se vengono da siti aggiornati frequentemente
    -google monitora quando inseriamo i link
    -un buon link puo' rimanere invariato quando un documento viene updatato se esso e' ancora buono e rilevante
    -cambiamento del testo dell'ancora indica un cambiamento nel documento
    -se il contenuto di un documento cambia in maniera cosi' significativa dal testo associato all'ancora, vuol dire che il dominio su cui sta il documento puo' avere cambiato significativamente o completamente i suoi contenuti (basti pensare a quando un dominio muore e viene ricomprato da altri) e visto che il testo di href di un bl viene considerato come parte integrante del documento a cui punta, il dominio sale nelle serp per ricerche che nn sono piu' on topic e questo e' da evitare.
    -inception data = data d'inizio, probabilmente la prima volta che il crwaler individua il documento
    -Content Updates/Changes
    U=f(UF, UA),

    dove U= score assegnato al documento in funzione di:
    UF=frequenza di aggiornamento dei contenuti
    UA=quantita' dei contenuti aggiornati

    -google può anche non monitorare tutta la pagina, ma un insieme di termini per vedere se la pagina subisce grossi cambiamenti.
    -per alcune query possono essere favoriti documenti che non sono stati recentemente aggiornati. lo score che gg asegna al documento e' determinato sulla differenza dalla media delle date dei cambiamenti del documento. in altre parole, gg determina una data in cui il contenuto di ognuno dei documenti e' stato cambiato, poi una data media dei cambiamenti e modifica il punteggio dei documenti (sia positivamente che negativamente) in base alla differenza tra le 2.

    • aumento di risultati per query simili può essere considerato come news
    • i documenti che rimangono uguali nel tempo ma con dati diversi possono essere monitorati diversamente.
    • per alcune query google può premiare i documenti più freschi, quindi si affida agli utenti che scelgono nelle serp e associa un punteggio diverso al documento stesso
    • per altre query un documento vecchio può essere interessante e google di affida agli utenti.
    • google può assegnare un punteggio in base anche al tempo che un utente spende stando su un documento
      -Chiunque cerchi di ingannare il mdr spesso usando ?throwaway? (letteralmente volantini, depliant, foglietto pubblicitario) o domini doorway e cercano di ottenere piu? traffico possibile prima di essere beccati.

    (?.aho ma sta frase nn po esse cosi??.manca un pezzo!!!o lho tradotta male? Confused dategli un?occhiata che sembra molto importante).
    -Comunque, la data quando un dominio scadra? in futuro puo? essere usata come fattore per predire la lagettimita? di un dominio, e quindi dei documenti associati ad esso.

    • controllo il dns
    • alter info associate ai name server per controllare che siti ospita
    • google monitora i documenti e i miglioramenti di essi nelle serp per controllare se è un documento attuale o spam
    • controlla sia la quantità che la velocità di salita nelle serp
    • commerciale è trattato diversamente perchè c'è più probabilità di spam allora lui controlla la quantità e velocità di salita.
    • il traffico associato ad un documento se diminuisce può star a significare che il documento è vecchio, quindi scende
    • traffico medio per i documenti, poi google può creare schemi di traffico. Questo per controllare anche periodi estivi e weekends
    • traffico pubblicitario controllando il CTR (adsense per vedere le pagine buone)
    • In sintesi, Google può generare ( o alterare ) un punteggio associato ad un documento, basandosi, almeno in parte ad informazioni relative al traffico associato al documento nel tempo.
    • Come ulteriore misura per distinguere un documento relativo ad un fenomeno di attualità da un documento spam, Google può considerare la menzione del documento in articoli di news, gruppi di discussione etc. ipotizzando che i documenti spam non saranno menzionati, per esempio, nelle news.
    • segnalibri e preferiti, google toolbar?cookie?
    • questo per controllare l'interesse del documento da parte dell'utente
    • google controlla l'ancor test per vedere lo spam, quindi non usare ancor test uguali
      -Google può considerare significative cadute nel posizionamento dei documenti come un'indicazione che il documento è "non apprezzato" o datato
      -In sintesi, Google può generare ( o alterare ) un punteggio associato con un documento basato, almeno in parte, su informazioni relative ai precedenti posizionamenti del documento stesso.

    Credo dica che i network "artificiali" di link si possono riconoscere perchè un sacco di link con gli stessi testi o quasi arrivano tutti insieme o quasi allo stesso documento.


  • Super User

    [0122] - [125] Linkage of Independent Peers

    Inizio...


  • Super User

    [0122] Linkage of Independent Peers

    [0122] Collegamento di siti/nodi indipendenti

    [0123] According to an implementation consistent with the principles of the invention, information regarding linkage of independent peers (e.g., unrelated documents) may be used to generate (or alter) a score associated with a document.

    [0123] In accordo ad una implementazione coerente con i principi dell'invenzione, le informazioni riguardanti il collegamento di nodi/siti indipendenti (per esempio, documenti non simili) può essere usato per generare (o alterare) un punteggio associato ad un documento.

    [0124] A sudden growth in the number of apparently independent peers, incoming and/or outgoing, with a large number of links to individual documents may indicate a potentially synthetic web graph, which is an indicator of an attempt to spam. This indication may be strengthened if the growth corresponds to anchor text that is unusually coherent or discordant. This information can be used to demote the impact of such links, when used with a link-based scoring technique, either as a binary decision item (e.g., demote the score by a fixed amount) or a multiplicative factor.

    [0124] Una sviluppo improvviso nel numero di nodi/siti apparentemente indipendenti, ricevuti e/o uscenti, con molti collegamenti a singoli documenti può indicare un network potenzialmente sintetico, che può indicare un tentativo di Spam. Questa indicazione può essere rinforzata se i testi dei link sono insolitamente coerenti o divergenti. Queste informazioni possono essere usate per degradare l'effetto di tali link, quando usate con una tecnica di punteggio basata sui link, oppure come una decisione binaria(per esempio, degradare il punteggio di un dato valore) o un fattore moltiplicativo.

    [0125] In summary, search engine 125 may generate (or alter) a score associated with a document based, at least in part, on information regarding linkage of independent peers.

    [ 0125 ] Ricapitolando, Google può generare (o alterare) un punteggio associato ad un documento basato, almeno in parte, sulle informazioni che riguardano il collegamento dei nodi/siti indipendenti.

    Non sono sicuro di avere tradotto bene il concetto di "Peers"... sono nodi o siti... o che altro? :mmm:


  • User Attivo

    [0126] Document Topics

    [0126] Temi del Documento

    [0127] According to an implementation consistent with the principles of the invention, information regarding document topics may be used to generate (or alter) a score associated with a document. For example, search engine 125 may perform topic extraction (e.g., through categorization, URL analysis, content analysis, clustering, summarization, a set of unique low frequency words, or some other type of topic extraction). Search engine 125 may then monitor the topic(s) of a document over time and use this information for scoring purposes.

    [0127] In accordo con una implementazione coerente con i principi dell'invenzione, informazioni riguardanti i TEMI di un documento possono essere usate per generare (o alterare) un punteggio associato al documento. Per esempio GG può effettuare l?estrazione dei temi (attraverso la categorizzazione, l?analisi dell?url, l?analisi dei contenuti, il clustering (qualche esperto potrebbe spiegare per bene cos?è il clustering), la sommarizzazione, un set di parole uniche a bassa frequenza, o alcuni atri tipi di estrazione del tema). GG può allora monitorare il tema (i temi) di un documento nel tempo e usare queste informazioni per assegnare il punteggio.

    [0128] A significant change over time in the set of topics associated with a document may indicate that the document has changed owners and previous document indicators, such as score, anchor text, etc., are no longer reliable. Similarly, a spike in the number of topics could indicate spam. For example, if a particular document is associated with a set of one or more topics over what may be considered a "stable" period of time and then a (sudden) spike occurs in the number of topics associated with the document, this may be an indication that the document has been taken over as a "doorway" document. Another indication may include the disappearance of the original topics associated with the document. If one or more of these situations are detected, then search engine 125 may reduce the relative score of such documents and/or the links, anchor text, or other data associated the document.

    [0128] Un significativo cambiamento nel tempo in un set di temi associati con il documento può indicare che il documento ha cambiato proprietario e gli indicatori del documento precedente, come il punteggio, gli anchor text, etc, non sono più attendibili. Similarmente, un picco nel numero dei temi potrebbe indicare spam. Per esempio, se un particolare documento è associato con un set di uno o più temi sui quali può essere considerato un periodo ?stabile? di tempo e poi avviene un picco (improvviso) nel numero di temi associati con il documento, questo può essere un indicatore che il documento sia un documento ?doorway?. Un'altra indicazione può includere la scomparsa dei temi originali associati con il documento. Se una o più di queste situazioni sono riscontrate, allora GG può ridurre relativamente il punteggio dei documenti e/o dei links, degli anchor text, o altri dati associati al documento.

    [0129] In summary, search engine 125 may generate (or alter) a score associated with a document based, at least in part, on changes in one or more topics associated with the document.

    [0129] Riassumendo, GG può generare (o alterare) un punteggio associato con un documento basato, almeno in parte, sui cambiamenti in uno o più temi associati con il documento.