• Super User

    Splendido lavoro ragazzi!

    Giorgio, proporrei un'onorificenza sul campo per Zil e Raele per la grande collaborazione e disponibilità offerta al Forum-Grande-Famiglia. 🙂

    Il documento che stiamo studiando appare affidabile e sembra essere il modulo compilato da una Agenzia specializzata nel presentare Brevetti, in questo caso per un software di Google che viene definito "motore di ricerca 125".

    E' possibile trovare vari riferimenti su chi ha presentato il brevetto, oltre ad un riferimento al tipo di sviluppo del software [relativo alla Università della California] ed alla data di presentazione del 31.03.2005

    Credo però che la data di presentazione non debba necessariamente essere collegata alla data di realizzazione di detti brevetti [nonchè di eventuale applicazione agli algoritmi]

    ...perche' nn affrontiamo sta cosa un po piu' sistematicamente?! Tipo ripartiamo da 0... Condivido in pieno.
    Secondo me ci sono tutte le condizioni per fare un bel lavoro di approfondimento e studio.

    Che ne dici Giorgio ?

    Ciauz.


  • User Attivo

    ho scritto vari post su un'altro forum (voi sapete quale).
    Google si è affidata ad uno Studio il quale ha stilato per loro il documento, vecchio di 3 anni.
    Personalmentenon ne so molto di brevetti ma sicuramente il brevetto viene stilato a grandi linee poi ha un arco di tempo (in questo caso 2 anni) nel quale viene visionato e discusso.
    I dati e le informazioni in questo MATTONE sonofunzioni di un Mtr associato a Google, cosa che credo io sia sbagliata.
    La licenza è stata appropriata all'Università della California, quindi a rigor di logica il trattato è da definirsi attendibile ma vecchio.
    Mi spiego meglio.
    Il primo google (quindi la base di funzionamento, studiata dai SEO fino ad ora) è da definirsi proprietà di Page e Socio come membri Universitari (la quale ha finanziato il porgetto) quindi il brevetto è "vecchio" o meglio, le informazioni risalgono al primo google.
    La società non era ancora stata creata.

    Sicuramente google è sulla base di questo ma dietro c'è molto altro.


  • User Attivo

    Bravi ragazzi e complimenti di cuore a Mamilu per l'idea davvero ottima, c'è gente intellgente in sto forum.
    Me lo leggo stasera. Se riesco vi posto un po' di traduzione.

    Stavo pensando che possiamo ogni tanto tradurre qualche articolo interessante, magari se troviamo qualche anima buona, creiamo una sezione apposita.

    assolutamente daccordo. semmai si possono proporre i link agli articoli che vorreste tradurre e chi ha tempo lo fa.

    ciauz,
    Lucas 😉


  • User

    @Stealth said:

    [snip]...[snip]

    Sicuramente google è sulla base di questo ma dietro c'è molto altro.

    Io penso che nonostante il documento sia vecchio e' pur sempre la base su cui si appoggia google. ne ho letto un bel pezzo e ci sono molti fattori interessanti che se considerati possono fare la differenza.. io con calma me lo leggo tutto e gia' che ci sono lo traduco pure, poi vedremo 😉


  • User Attivo

    grande zil
    🙂


  • User

    ok riparto dall'inizio, pero' qua sta venedo fuori un casino di topic..

    ** DATA **

    inception data = data d'inizio, probabilmente la prima volta che il crwaler individua il documento

    La "inception data" puo' essere usata per generare ( o modificare ) il punteggio associato al documento. Il termine "data" e' usato largamente e puo' includere date, e misurazioni di fate. Come descritto piu' avanti ci sono diverse tecniche per calcolare la "inception data", alcune di esse possono essere influenzate da terze parti, altre no. Ognuna di queste tecniche, o la combinazione di piu' di esse, puo' essere utilizzata per determinare l' "inception data" di un documento.

    Un modo per individuarla e' determinato dalla prima volta in cui il documento viene visto (passaggio del crawler, segnalazione al motore, combinazione delle due o in altri modi). Oppure puo' essere determinata dalla prima volta che il crawler trova un link al documento.

    Un altro modo puo' essere quello dell'eta' del dominio in cui il documento e' ospitato.
    Un altro modo ancoro, la prima volta che un documento e' referenziato in un altro, ad esempio tramite un articolo di news, newsgroup, mailing list, oppure combinazione di due o piu' di questi aspetti.
    Oppure la prima volta nella quale il documento include un certo numero di pagine.
    Un altro modo ancora il timestamp associato dal server al documento oppure altri sistemi non menzionati.

    Il motore puo' assegnare punteggi diversi a seconda dell'"inception data" perche' si presume che un documento "giovane" avra' meno backlink di uno vecchio e quindi avra' un punteggio molto minore.
    Questo vuol dire che per esempio un documento con l'"inception data" di ieri che e' referenziato da 10 back link avra' un punteggio maggiore di un un documento vecchio di 10 anni referenziato da 100 backlinks. Tutto questo pero' e' relativo perche' tanti back links in poco tempo possono venir considerati come un tentativo di spam al motore. La tendenza e' quella di abbassare il punteggio del documento per ridurre l'effetto di spam.

    L'"inception data" puo' venir utilizzata anche per determinare il peso dei link che puntano al documento (es peso in baso ad unita' di tempo). Questo puo' venir usato anche in altro modo, per esempio dando un punteggio maggiore a documenti in cui i back links vengono generati piu' spesso.

    Il punteggio basato sui link potrebbe per esempio essere modificato con questa formula:

    H=L/log(F+2),

    Dove la H si riferische ad aggiustamenti del valore dei link, la L il valore del rank passato (la famosa formula del pagerank per intenderci..), e la F puo' riferirsi al tempo trascorso dall'"inception data".

    +++++++++
    riflessione mia, vediamo di capire questa formula

    es
    L = 50 (valore a caso di page rank che passa un link)
    F1 = 4 (unita' a caso, mettiamo 4 settimane)
    F2 = 10 (unita' a caso, mettiamo 10 settimane)

    link su pagina esistente da 4 settimane
    H = 50 / log(4+2) = 64.25

    link su pagina esistente da 10 settimane
    H = 50 / log(12+2) = 43.62

    quindi piu' si va avanti con il tempo e meno occorrono aggiustamenti sul valore dei link
    +++++++++

    Per alcune queries, i documenti piu' vecchi potrebbero essere molto favoriti nei confronti di quelli nuovi. Per questo motivo ci possono essere degli aggiustamenti in base alla differenza d'eta' dei due siti.


  • Community Manager

    Ragazzi siete davvero grandi.

    Come onoreficenza, pensavo di creare una pagina per ogni moderatore del forum e per ogni forumista che dà un bel contributo, come zil raele .

    Stavo pensando anche a dei banner a rotazione in alto, al posto della scritta forum di giorgiotave 😄

    Ci sono tante idee su questo forum, con il tempo faremo tutto.

    Se andiamo di fretta non facciamo niente.

    Pensate:

    ProgettoSeo
    Laboratorio
    Gara Doorway
    Errori di Usabilità Accessibilità
    Vantaggi per utenti
    Portale Thai?

    E molto altro ci aspettano e perchè no, una bella directory tutta nostro con un piccolo motore di ricerca la buttate voi come idea?

    Facciamo tutto, sviluppiamo tutto. Piano Piano, ora tocca al mio letto che vengo da un matrimonio 🙂

    A domani ragazzi 😉


  • Super User

    Bravo Zil, tieni duro e avanti così !

    E bravo Giorgio.
    Grande l'idea del piccolo motore di ricerca!!
    Certo, come tutte le altre.

    Guai avere fretta però.
    La grandezza di questo Forum-GrandeFamiglia è appunto nella capacità di produrre e portare avanti idee.

    Significa che sà dare spazio alle menti dei forumsti lasciando i loro pensieri volare liberamente, e scusate se è poco!

    Quindi produciamo pure idee, poi pian piano le applicheremo, quando verrà il loro momento. 🙂

    Per le onorificenze ai forumisti lodevoli, si potrebbe mettere una "medaglia al valore" di fianco al titolo "menbro junior".
    Una cosa tipo -membro junior* -
    Oppure - membro junior** - in caso di mostri della gloria.

    L'idea del banner è ottima, ma avendo riscontri commerciali, la vedrei molto bene per cominciare a fare rientrare le spese di banda a Giorgio.
    Non parlo di fare affari-pubblicità, ma di pareggiare le spese di Giorgio, così da far sentire ancor più questo forum dei forumisti.
    Una cosa tipo; le spese del forum sono 100x l'anno, si fanno 10 banner e si offrono a 10x l'uno a chi ne farà richiesta.

    Giorgio, cosa può venire un bannerino a Fritto?

    😉 ... le mie faccine non vanno e neppure i tasti in alto [bold-italic-quote ecc. ]


  • Bannato User Attivo

    Voglio partecipare alle complimentazioni, purtroppo nelle traduzioni non posso per niente aiutare ( a stento parlo napoletano, ehm!! scusate .. italiano ), mentre sulle door, bhe credo che lì qualcosina posso fare. :ciauz:


  • Community Manager

    Certo, anche in quel senso ci saranno vari gradi.

    Per il forum e i banner, sono sicuro che troveremo un sistema.

    Ad ogni post nasce un'idea nuova, sintomo che si parla liberamente 🙂

    :ciauz:


  • Super User

    Giorgio ho visto che hai messo su phpadsnew.

    come lo trovi?

    p.s. a me hanno consigliato di blindarlo bene (tipo con mod_security).


  • Super User

    Giorgio ho visto che hai messo su phpadsnew.
    come lo trovi?

    Non vedo una grossa relazione con il thread in questione, che dici di aprirne un altro, magari in php?


  • Super User

    boh, si stava parlando di banner.

    per me si puo' chiudere qui comunque. uno su php non lo apro...


  • Super User

    Ho letto tutto il 3D ora, molto interessante grazie anche alle traduzioni in ITA, non so se lo avrei letto tuto in inglese...grazie ai traduttori 😉

    interessante, ma quanto ci può essere d'aiuto? quanto rispecchia gli algoritmi attuali di Google?

    Non parlo di fare affari-pubblicità, ma di pareggiare le spese di Giorgio, così da far sentire ancor più questo forum dei forumisti.

    Pienamente d'accordo con Elena... meglio iniziare a pareggiare i conti... 😉


  • User Attivo

    [0045] Content Updates/Changes

    [0046]
    Qui si parla del modo in cui cambiano i contenuti delle pagine. Si assegna un valore al documento in base a come cambiano nel tempo i suoi contenuti , se rimangono statici o se vengono aggiornati spesso. niente di nuovo.

    [0047]gg dovrebbe contare questi aggiornamenti con questa formula
    [0048] U=f(UF, UA),

    dove U= score assegnato al documento in funzione di:
    UF=frequenza di aggiornamento dei contenuti
    UA=quantita' dei contenuti aggiornati

    [0049]UF puo' essere determinata in vari modi: time between updates, the number of updates in a given time period, etc.

    [0050] UA puo' essere determinata come funzione di piu' fattori, come il numero delle nuove o uniche pagine associate con il documento in un dato periodo, la % che esse rappresentano sul total e altri criteri visti sopra (da quanto ho capito per contare la frequnza e la freschezza usa sempre gli stessi criteri sia per i link che per il resto)

    [0051]altro modo di determinare UA come funzione di diversi "pesi": cioe' se nella pagina vengono cambiati/aggiornati i js, i commenti, le pubblicita', gli elementi di navigazioni assegna un peso poko rilevante o li ignora....se invece vengono cambiati/aggiornati elementi come title ed ancor text associate ai forward link gg considera piu' peso a questi cambiamenti.

    [0052] UF and UA possono essere usate in altri modi per influenza lo score del documento, per esempio: il tasso di cambiamento in un periodo puo' essere paragonato col tassi di un altro pèeriodo per vedere accelerazioni o decelerazioni negli aggiornamenti...ovviamente assegnado punteggi maggiori nel casso di accelerazioni. Stesso discorso per la quantita' degli aggiornamenti.

    quanto rispecchia gli algoritmi attuali di Google?

    non so...a quanto pare ci sono pareri discordanti su questo.
    Io la vedo come zil: intanto ce lo leggiamo e lo traduciamo ...puo' sempre essere una buona base...nel frattempo cerchiamo di capire a quando si riferisce questa base 😉


  • Super User

    non so...a quanto pare ci sono pareri discordanti su questo.
    Io la vedo come zil: intanto ce lo leggiamo e lo traduciamo ...puo' sempre essere una buona base...nel frattempo cerchiamo di capire a quando si riferisce questa base

    certo che va letto il documento...


  • User Attivo

    [0053]
    In alcune situazioni, i "data storage resources" possono essere insufficienti per archiviare i documenti quando vengono monitorati per vedere i cambiamenti dei contenuti.
    in questo caso gg puo' archiviare "rappresentazioni" dei documenti e monitorare quest'ultime per i cambiamenti. per esempio gg puo' storare le "signatures" dei documenti invece dell'ìintero documento stesso per scoprire cambiamenti nei contenuti del documento. in questo caso gg puo' archiviare un "vettore di termini" per un documento (o una pagina) e monitorare questo per relativi grossi cambiamenti.
    un'altra implementazione e' di storare una relativamente piccola parte (o poki termini) dei documenti che e' ritenuta importante o piu' frequentemente ricorrente.... (excluding "stop words"). ...

    ?? :mmm: cosa sono le stop words?

    [0054]
    According to yet another implementation, search engine 125 may store a summary or other representation of a document and monitor this information for changes.

    gg puo' storare un "**sommario di rappresentazioni **" di un documento e monitorare queste informazioni per i cambiamenti....

    scusate ma ho pensato ekko perke' nn passa mai googlebot...
    ma poi subito dopo ho pensato...ma di queste info che lui si stora in degli array presuppongo ...come fa a monitorarne i cambiamenti se non passa nel documento?
    ...uhmmm non sto capendo! :arrabbiato: ...illuminatemi 😢

    [0055]
    some queries, documents with content that has not recently changed may be more favorable than documents with content that has recently changed. As a result, it may be beneficial to adjust the score of a document based on the difference from the average date-of-change of the result set. In other words, search engine 125 may determine a date when the content of each of the documents in a result set last changed, determine the average date of change for the documents, and modify the scores of the documents (either positively or negatively) based on a difference between the documents' date-of-change and the average date-of-change.

    per alcune query possono essere favoriti documenti che non sono stati recentemente aggiornati. lo score che gg asegna al documento e' determinato sulla differenza dalla media delle date dei cambiamenti del documento. in altre parole, gg determina una data in cui il contenuto di ognuno dei documenti e' stato cambiato, poi una data media dei cambiamenti e modifica il punteggio dei documenti (sia positivamente che negativamente) in base alla differenza tra le 2.

    pero' non c'e' un esempio...uff 😞

    [0056]riepilogo della sezione Content Updates/Changes

    la prossima sezione e' sulle query...ora vado a ninna :ciauz:


  • User Attivo

    Orpo, siete così veloci nel postare nuovi messaggi che non riesco manco a segurvi... da qualche parte avevo notato piccole imprecisioni nella traduzione, cerco di dare una riletta in questi giorni... 🙂

    @Raele-l'Angelo said:

    (excluding "stop words"). ...

    ?? :mmm: cosa sono le stop words

    sono le parole comuni (teoricamente) escluse dalla ricerca, tipo "the" "a" "to" "in" ecc. faccio prima a citare la faq di google:

    Parole comuni

    Google ignora le parole ed i caratteri comuni, denominati anche "stop words", scartando automaticamente termini come "http" e ".com" nonché alcune singole cifre e lettere, dal momento che questi termini non aiutano a restringere il campo di ricerca ma anzi contribuiscono a rallentare i tempi di ricerca.

    Utilizzare il segno "+" per includere parole comuni nella ricerca. Ricordarsi di lasciare uno spazio prima del segno "+". Il segno "+" può essere utilizzato anche per la ricerca di frasi.

    ciauz
    Lucas 😉


  • User Attivo

    da qualche parte avevo notato imprecisioni nella traduzione, cerco di dare una riletta in questi giorni... Smile

    una riletta e un bel post con correzioni direi eh Lucas 😉

    io ce la sto mettendo tutta personalmente, ma so che a volte ci sono alcuni passaggi in cui mi perdo e nn riesco a tradurre correttamente....
    :bho:

    grazie per la delucidazione sulle stop words
    😄 :ciauz:


  • User Attivo

    io ce la sto mettendo tutta personalmente, ma so che a volte ci sono alcuni passaggi in cui mi perdo e nn riesco a tradurre correttamente....

    Ma figurati Raele_l'angelo, stai facendo un gran lavoro (e anche zil)!
    La mia è solo una deformazione professionale... le imprecisioni sono veniali... 😄

    bravo!
    Lucas 😉