- Home
- Categorie
- La Community Connect.gt
- Tutto sulla Community
- Definizione dei brevetti di Google al 31.03.05
-
For example, a document whose content is edited often may be scored differently than a document whose content remains static over time. Also, a document having a relatively large amount of its content updated over time might be scored differently than a document having a relatively small amount of its content updated over time.
Spiega che un sito aggiornato piu' frequentemente sara' valutato differentemente da un sito statico (inteso come non aggiornato, non .html) e che un sito che aggiorna grandi quantita' di contenuti sara' a sua volta valutato differentemente da uno che aggiorna poco
nota mia, questo spiegherebbe perche' da un buon rank ad i blog fatti bene. Cmq nel sito ci sono pure le formule.. se un giorno son particolarmente fuso vedo di ricavare un bel algoritmo..
-
UA may also be determined as a function of one or more factors, such as the number of "new" or unique pages associated with a document over a period of time
UA e' un fattore della formula per il rank in base agli aggiornamenti (il mio posto sopra) e dice che un modo per calcolarla e' anche quello di osservare quante nuove pagine aggiunge un sito in un dato periodo di tempo
-
In this case, search engine 125 may store a term vector for a document (or page) and monitor it for relatively large changes.
Dice che a volte lo spazio per monitorare tutti gli aggiornamenti delle varie pagine e' insufficiente per salvare tutte le pagine e quindi si opta per salvare un vettore (insieme) di termini usati piu' spesso, tipo una lista di keywords
According to yet another implementation, search engine 125 may store a summary or other representation of a document and monitor this information for changes
oppure puo' salvarsi una specie di sommario sempre per monitorare i cambiamenti
la prossima e' interessante
According to a further implementation, search engine 125 may generate a similarity hash (which may be used to detect near-duplication of a document) for the document and monitor it for changes
Il motore puo' generare un "similarity hash" (immagino sappiate tutti cos'e' , cmq una specie di checksum di un documento, es md5 fa hash) e puo' usarlo sia per vedere se il documento cambia sia per scovare copie di documenti.
-
Parla di come dare un rank in base alle query e prima specifica che puo' farlo in base alle scelte degli utenti, poi
Another query-based factor may relate to the occurrence of certain search terms appearing in queries over time. A particular set of search terms may increasingly appear in queries over a period of time. For example, terms relating to a "hot" topic that is gaining/has gained popularity or a breaking news event would conceivably appear frequently over a period of time. In this case, search engine 125 may score documents associated with these search terms (or queries) higher than documents not associated with these terms.
In pratica puo' dare un maggiore peso ai siti che sono associati con le notizie/termini piu' recenti, le super news in pratica. Faccio un esempio per rendere, tempo fa c'e' stato lo tsunami, ecco se i miei siti erano associati allo tsunami avrebbero avuto un peso maggiore di quelli non associati ad esso.
-
Tenete presente che per " motore di ricerca 125" si intende Google
Complimenti Zil !!!
...tieni duro
-
Ritiro tutto quello che ho detto prima.
Altro che se è interessante... me lo stampo subito e lo guardo con calma nel WE.
-
Questa e' paurosa
Yet another query-based factor may relate to the extent to which a document appears in results for different queries. In other words, the entropy of queries for one or more documents may be monitored and used as a basis for scoring. For example, if a particular document appears as a hit for a discordant set of queries, this may (though not necessarily) be considered a signal that the document is spam, in which case search engine 125 may score the document relatively lower.
In pratica dice che un sito che compare per piu' key discordanti puo' (non necessariamente pero') essere considerato come un segnale che il documento e' spam, in questo caso gli verra' assegnato un punteggio relativamente basso
-
Parla a lungo di come anche la data dei link (quanti nuovi link ogni tot, quanti link spariscono) influisce
By analyzing the change in the number or rate of increase/decrease of back links to a document (or page) over time, search engine 125 may derive a valuable signal of how fresh the document is.
In particolare li dice che analizzando se i backlink calano od aumentano puo' derivare se un documento e' "fresco" oppure statico.. in pratica se continuiamo ad avere bl ci assegna un rank piu' alto, se ne perdiamo piu' basso
-
Poi descrive il peso dei link
in pratica piu' un sito ha rank alto e piu' rank passa, e fin qua ok, poi si fa piu' interessante e dice che i link da siti "veri" (es governativi) contano molto (con una M maiuscola direi io)
questo spiega perche' quando mi sono linkato un sito dal sito dell'universita' mi e' esploso
poi parla anche che i link contano di piu' se sono su siti "freschi" cioe' aggiornati frequentemente
vado a cenare, se ho tempo continuo dopo, altrimenti aspettiamo qualche altra buonaanima
-
Molto interessante la traduzione di zil. 777 dai traduci qualcosina
Stavo pensando che possiamo ogni tanto tradurre qualche articolo interessante, magari se troviamo qualche anima buona, creiamo una sezione apposita. Naturalmente come farò per i moderatori ci sarà una pagina personale dove inserire i propri link e profilo.
-
riparto un po io da dove ha lasciato zil
[0071] According to one implementation, the analysis may depend on the number of new links to a document. For example, search engine 125 may monitor the number of new links to a document in the last n days compared to the number of new links since the document was first found. Alternatively, search engine 125 may determine the oldest age of the most recent y % of links compared to the age of the first link found.
L'analisi puo' dipendere dal numero di nuovi link nel documento. Per esempio gg puo' monitorare il numero di nuovi link in un documento negli ultimi "n" giorni e compararlo col numero dei nuovi link da qunado e' nato il documento. in alternativa, gg puo' determinare l'eta piu' vecchia della piu' recente percentuale (chiamata y%) di link comparandola con l'eta' del primo link trovato .
aggiungo io ....urge esempio:
For the purpose of illustration, consider y=10 and two documents (web sites in this example) that were both first found 100 days ago. For the first site, 10% of the links were found less than 10 days ago, while for the second site 0% of the links were found less than 10 days ago (in other words, they were all found earlier). In this case, the metric results in 0.1 for site A and 0 for site B. The metric may be scaled appropriately. In another exemplary implementation, the metric may be modified by performing a relatively more detailed analysis of the distribution of link dates. For example, models may be built that predict if a particular distribution signifies a particular type of site (e.g., a site that is no longer updated, increasing or decreasing in popularity, superceded, etc.).
a scopo illustrativo, cosideriamo y=10 (vedi sopra) e 2 documenti entrambi inizialmente trovati 100 giorni fa.
per il primo sito il 10% dei link sono stati trovati meno di 10 giorni fa, mentre per il secondo sito lo 0% dei link sono stati trovati meno di 10 giorni fa. in questo caso gg attribuisce una sorta di valore 0.1 al primo sito e 0 al secondo sito. e dice che questo valore puo' essere studiato da gg facendo un'analisi piu' dettagliata della distribuione delle date dei link e modificato in funzione del fatto che a distribuzioni di date diverse corrispondono siti diversi .the analysis may depend on weights assigned to the links. In this case, each link may be weighted by a function that increases with the freshness of the link. The freshness of a link may be determined by the date of appearance/change of the link, the date of appearance/change of anchor text associated with the link, date of appearance/change of the document containing the link. The date of appearance/change of the document containing a link may be a better indicator of the freshness of the link based on the theory that a good link may go unchanged when a document gets updated if it is still relevant and good. In order to not update every link's freshness from a minor edit of a tiny unrelated part of a document, each updated document may be tested for significant changes (e.g., changes to a large portion of the document or changes to many different portions of the document) and a link's freshness may be updated (or not updated) accordingly.
L'analisi puo' dipendere dai pesi assegnati ai link. Ogni link puo' essere pesato attrave4rso una funzione che cresce con la freschezza del link. La freschezza del link puo' essere determinata da:
-data di apparizione/cambiamento del link
-data di apparizione/cambiamento del testo associato a un link
-data di apparizione/cambiamento del documento contentente il link
La data di apparizione/cambiamento del documento contentente il link puo' essere il miglior indicatore della freschezza del link basandosi sulla teoria che un buon link puo' rimanere invariato quando un documento
viene updatato se esso e' ancora buono e rilevante
-
Links may be weighted in other ways. For example, links may be weighted based on how much the documents containing the links are trusted (e.g., government documents can be given high trust). Links may also, or alternatively, be weighted based on how authoritative the documents containing the links are (e.g., CUT
i link possono essere pesati in altri modi. per esempio, i link possono essre pesati basandosi su quanto documento contiene link fidati....
ODDIO ma ho sbajato a riparti'...qui c'era gia' arrivato zil
vabbe'...
According to yet another technique, the analysis may depend on an age distribution associated with the links pointing to a document. In other words, the dates that the links to a document were created may be determined and input to a function that determines the age distribution.CUT
L'analisi puo' dipendere dalla distribuzione delle eta' associatia con i link che puntano ad un documento, cioe' le date in cui vengono creati i links che puntano a un documento
e vabbe' roba gia' vista...
The dates that links appear can also be used to detect "spam," where owners of documents or their colleagues create links to their own document for the purpose of boosting the score assigned by a search engine. A typical, "legitimate" document attracts back links slowly...CUT
la stesa funzione di distribuzione della date puo' essere usata per scovare spam, dove i proprietari dei documenti o loro colleghi creano links al loro documento per avanza nelle serp, in qunato un sito tipico, "legittimo" acquista BL piano....col tempo. poi parla del fenomeno dello scambio link...e dei posti dove scrivere i link senza "editorial discretion"...penso siano cmq tutti i posti compresi i forum, blog, guestbook etc.
[0081] Anchor Text
[0082]
uno dei criteri per le ancore e' il modo in cui cambie il testo nell'ancora che puo' essere uno dei criteri che indica che il documento e' stato aggiornato o cmq un cambiamento del focus del documento.[0083]
se il contenuto di un documento cambia in maniera cosi' significativa dal testo associato all'ancora, vuol dire che il dominio su cui sta il documento puo' avere cambiato significativamente o completamente i suoi contenuti (basti pensare a quando un dominio muore e viene ricomprato da altri) e visto che il testo di href di un bl viene considerato come parte integrante del documento a cui punta, il dominio sale nelle serp per ricerche che nn sono piu' on topic e questo e' da evitare.0085]
La freschezza di un ancor text puo' essere usata come fatttore per lo scoring del documento. La freschezza di una ancora puo' essere determinata dalla data di apparizione/cambiamento del testo nell'ancora e/o dalla data di apparizione/cambiamento del documento a cui punta l'ancora: quest'ultima puo' essere un buon indicatore della freschezza di un ancor text basato sulla teoria che abbiamo visto prima per la freschezza dei link e cioe' che buone ancore potrebbero non essere cambiate quando si aggiorna un documento0086]
in definitiva gg puo' generare un punteggio associato al documento, almeno in parte, basato sulle informazioni relative al modo in cui cambia l'ancor text.scusate una cosetta
io sono partito da dove aveva lasciato zil
ora pero' scorrendo il testo della pagina in alto mi pare che non tutte le sezioni siano state trattate qui o sbaglio?rileggendo mi pare ci siano molte cosette interessanti: perche' nn affrontiamo sta cosa un po piu' sistematicamente?! tipo ripartiamo da 0 e, magari, come diceva nn rikordo chi scusatemi, cerchiamo di buttare giu' qualkosa di utile... che ne dite?
-
Splendido lavoro ragazzi!
Giorgio, proporrei un'onorificenza sul campo per Zil e Raele per la grande collaborazione e disponibilità offerta al Forum-Grande-Famiglia.
Il documento che stiamo studiando appare affidabile e sembra essere il modulo compilato da una Agenzia specializzata nel presentare Brevetti, in questo caso per un software di Google che viene definito "motore di ricerca 125".
E' possibile trovare vari riferimenti su chi ha presentato il brevetto, oltre ad un riferimento al tipo di sviluppo del software [relativo alla Università della California] ed alla data di presentazione del 31.03.2005
Credo però che la data di presentazione non debba necessariamente essere collegata alla data di realizzazione di detti brevetti [nonchè di eventuale applicazione agli algoritmi]
...perche' nn affrontiamo sta cosa un po piu' sistematicamente?! Tipo ripartiamo da 0... Condivido in pieno.
Secondo me ci sono tutte le condizioni per fare un bel lavoro di approfondimento e studio.Che ne dici Giorgio ?
Ciauz.
-
ho scritto vari post su un'altro forum (voi sapete quale).
Google si è affidata ad uno Studio il quale ha stilato per loro il documento, vecchio di 3 anni.
Personalmentenon ne so molto di brevetti ma sicuramente il brevetto viene stilato a grandi linee poi ha un arco di tempo (in questo caso 2 anni) nel quale viene visionato e discusso.
I dati e le informazioni in questo MATTONE sonofunzioni di un Mtr associato a Google, cosa che credo io sia sbagliata.
La licenza è stata appropriata all'Università della California, quindi a rigor di logica il trattato è da definirsi attendibile ma vecchio.
Mi spiego meglio.
Il primo google (quindi la base di funzionamento, studiata dai SEO fino ad ora) è da definirsi proprietà di Page e Socio come membri Universitari (la quale ha finanziato il porgetto) quindi il brevetto è "vecchio" o meglio, le informazioni risalgono al primo google.
La società non era ancora stata creata.Sicuramente google è sulla base di questo ma dietro c'è molto altro.
-
Bravi ragazzi e complimenti di cuore a Mamilu per l'idea davvero ottima, c'è gente intellgente in sto forum.
Me lo leggo stasera. Se riesco vi posto un po' di traduzione.Stavo pensando che possiamo ogni tanto tradurre qualche articolo interessante, magari se troviamo qualche anima buona, creiamo una sezione apposita.
assolutamente daccordo. semmai si possono proporre i link agli articoli che vorreste tradurre e chi ha tempo lo fa.
ciauz,
Lucas
-
@Stealth said:
[snip]...[snip]
Sicuramente google è sulla base di questo ma dietro c'è molto altro.
Io penso che nonostante il documento sia vecchio e' pur sempre la base su cui si appoggia google. ne ho letto un bel pezzo e ci sono molti fattori interessanti che se considerati possono fare la differenza.. io con calma me lo leggo tutto e gia' che ci sono lo traduco pure, poi vedremo
-
grande zil
-
ok riparto dall'inizio, pero' qua sta venedo fuori un casino di topic..
** DATA **
inception data = data d'inizio, probabilmente la prima volta che il crwaler individua il documento
La "inception data" puo' essere usata per generare ( o modificare ) il punteggio associato al documento. Il termine "data" e' usato largamente e puo' includere date, e misurazioni di fate. Come descritto piu' avanti ci sono diverse tecniche per calcolare la "inception data", alcune di esse possono essere influenzate da terze parti, altre no. Ognuna di queste tecniche, o la combinazione di piu' di esse, puo' essere utilizzata per determinare l' "inception data" di un documento.
Un modo per individuarla e' determinato dalla prima volta in cui il documento viene visto (passaggio del crawler, segnalazione al motore, combinazione delle due o in altri modi). Oppure puo' essere determinata dalla prima volta che il crawler trova un link al documento.
Un altro modo puo' essere quello dell'eta' del dominio in cui il documento e' ospitato.
Un altro modo ancoro, la prima volta che un documento e' referenziato in un altro, ad esempio tramite un articolo di news, newsgroup, mailing list, oppure combinazione di due o piu' di questi aspetti.
Oppure la prima volta nella quale il documento include un certo numero di pagine.
Un altro modo ancora il timestamp associato dal server al documento oppure altri sistemi non menzionati.Il motore puo' assegnare punteggi diversi a seconda dell'"inception data" perche' si presume che un documento "giovane" avra' meno backlink di uno vecchio e quindi avra' un punteggio molto minore.
Questo vuol dire che per esempio un documento con l'"inception data" di ieri che e' referenziato da 10 back link avra' un punteggio maggiore di un un documento vecchio di 10 anni referenziato da 100 backlinks. Tutto questo pero' e' relativo perche' tanti back links in poco tempo possono venir considerati come un tentativo di spam al motore. La tendenza e' quella di abbassare il punteggio del documento per ridurre l'effetto di spam.L'"inception data" puo' venir utilizzata anche per determinare il peso dei link che puntano al documento (es peso in baso ad unita' di tempo). Questo puo' venir usato anche in altro modo, per esempio dando un punteggio maggiore a documenti in cui i back links vengono generati piu' spesso.
Il punteggio basato sui link potrebbe per esempio essere modificato con questa formula:
H=L/log(F+2),
Dove la H si riferische ad aggiustamenti del valore dei link, la L il valore del rank passato (la famosa formula del pagerank per intenderci..), e la F puo' riferirsi al tempo trascorso dall'"inception data".
+++++++++
riflessione mia, vediamo di capire questa formulaes
L = 50 (valore a caso di page rank che passa un link)
F1 = 4 (unita' a caso, mettiamo 4 settimane)
F2 = 10 (unita' a caso, mettiamo 10 settimane)link su pagina esistente da 4 settimane
H = 50 / log(4+2) = 64.25link su pagina esistente da 10 settimane
H = 50 / log(12+2) = 43.62quindi piu' si va avanti con il tempo e meno occorrono aggiustamenti sul valore dei link
+++++++++Per alcune queries, i documenti piu' vecchi potrebbero essere molto favoriti nei confronti di quelli nuovi. Per questo motivo ci possono essere degli aggiustamenti in base alla differenza d'eta' dei due siti.
-
Ragazzi siete davvero grandi.
Come onoreficenza, pensavo di creare una pagina per ogni moderatore del forum e per ogni forumista che dà un bel contributo, come zil raele .
Stavo pensando anche a dei banner a rotazione in alto, al posto della scritta forum di giorgiotave
Ci sono tante idee su questo forum, con il tempo faremo tutto.
Se andiamo di fretta non facciamo niente.
Pensate:
ProgettoSeo
Laboratorio
Gara Doorway
Errori di Usabilità Accessibilità
Vantaggi per utenti
Portale Thai?E molto altro ci aspettano e perchè no, una bella directory tutta nostro con un piccolo motore di ricerca la buttate voi come idea?
Facciamo tutto, sviluppiamo tutto. Piano Piano, ora tocca al mio letto che vengo da un matrimonio
A domani ragazzi
-
Bravo Zil, tieni duro e avanti così !
E bravo Giorgio.
Grande l'idea del piccolo motore di ricerca!!
Certo, come tutte le altre.Guai avere fretta però.
La grandezza di questo Forum-GrandeFamiglia è appunto nella capacità di produrre e portare avanti idee.Significa che sà dare spazio alle menti dei forumsti lasciando i loro pensieri volare liberamente, e scusate se è poco!
Quindi produciamo pure idee, poi pian piano le applicheremo, quando verrà il loro momento.
Per le onorificenze ai forumisti lodevoli, si potrebbe mettere una "medaglia al valore" di fianco al titolo "menbro junior".
Una cosa tipo -membro junior* -
Oppure - membro junior** - in caso di mostri della gloria.L'idea del banner è ottima, ma avendo riscontri commerciali, la vedrei molto bene per cominciare a fare rientrare le spese di banda a Giorgio.
Non parlo di fare affari-pubblicità, ma di pareggiare le spese di Giorgio, così da far sentire ancor più questo forum dei forumisti.
Una cosa tipo; le spese del forum sono 100x l'anno, si fanno 10 banner e si offrono a 10x l'uno a chi ne farà richiesta.Giorgio, cosa può venire un bannerino a Fritto?
... le mie faccine non vanno e neppure i tasti in alto [bold-italic-quote ecc. ]