• User

    ciao a tutti,
    mi sembra che di cose se ne stiano dicendo diverse, alcune corrette altre no, solo per questione di proprieta' di linguaggio - quello matematico.

    il pagerank e' un numero reale. viene calcolato con un algoritmo che simula la naviagazione casuale su un grafo detto Web ed attribuisce ad ogni nodo del grafo un valore, appunto il pagerank. l'algoritmo e' noto dal 1998. non ha molti misteri.

    il mistero,la ricetta segreta della coca cola, e' come e quanto questo numero concorra, insieme ad altri fattori, a determinare l'ordinamento dei nodi, e di conseguenza il posizionamento di un nodo all'interno dei risultati.

    Per non flippare il cervello a nessuno pensa al pagerank come un sistema di votazione, e prova a limitarlo agli utenti del forum.
    Supponiamo che il primo giorno, quello di apertura del forum, tutti gli utenti siano uguali, ossia tutti equivalentemente "competenti in materia di motori di ricerca". A un certo punto, in base a quanto ognuno di noi ha scritto, chiediamo a tutti gli utenti di esprimere un solo voto (per semplificare la questione) verso altri utenti del forum.
    Con molta probabilita' Giorgio e Stuart riceverebbero una valanga di voti, supponiamo 1000 ognuno. Questo darebbe a loro uno status di "persone molto compententi".

    Ma abbiamo detto l'algoritmo e' ricorsivo o se preferisci si conclude in piu' iterazioni (passaggi) sul grafo. Bada bene, questa ricursione fa parte della definizione stessa del pagerank. Dobbiamo quindi quantomeno procedere a una seconda votazione... questo vuol dire che una volta determinati tutti i voti, andremo a pesare i voti in base alla "competenza" dei votanti.

    Se per esempio Anna ha ricevuto 17 voti da utenti che non sono stati votati da nessuno, mentre Bruno ha ricevuto solo 2 voti, ma da Giorgio e Stuart, allora Bruno ha una "competenza" molto maggiore di Anna. Il pagerank non indica il numero di voti ricevuti, ma il numero di voti pesati ricevuti.

    ciao,
    *M


  • Super User

    Ottimo post, marcuzzer: sei riuscito a spiegare in maniera accessibile un concetto (quello di ricorsione) potenzialmente ostico per chi non mastica d'informatica. Bravo. 🙂

    Aggiungo solo, a mo' d'integrazione, che PageRank è calcolato proprio per mezzo di iterazioni (le "votazioni successive" nell'esempio di marcuzzer).


  • User Attivo

    @Everfluxx said:

    Ottimo post, marcuzzer: sei riuscito a spiegare in maniera accessibile un concetto (quello di ricorsione) potenzialmente ostico per chi non mastica d'informatica. Bravo.
    ....

    Veramente la ricorsione è un concetto matematico, non informatico. La ricorsione esiste ben da prima che s'inventasse il primo computer (Es: le curve matematiche chiamate frattali).


  • Super User

    @fradefra said:

    Veramente la ricorsione è un concetto matematico, non informatico. La ricorsione esiste ben da prima che s'inventasse il primo computer (Es: le curve matematiche chiamate frattali).
    Che dire? Hai perfettamente ragione. 🙂


  • User Attivo

    @Everfluxx said:

    Che dire? Hai perfettamente ragione. 🙂

    Mi ricordo che molti anni fa spiegavo la ricorsione ad un gruppo di persone.

    "... la ricorsione è un tipo di algoritmo con una funzione che nel suo calcolo interno usa se stessa..."

    Tutti in crisi (programmatori junior) salvo uno... che aveva veramente capito tutto e bene. Roberto, si chiamava. Mi ricordo che un anno dopo lasciò l'informatica per fare l'operaio del gas a Milano.

    Ridete, ridete, ma vi giuro che è vero.


  • Super User

    Sono un grande fan della ricorsione. :vaiii:
    Per l'esame di maturità scrissi un programmino in Turbo Pascal che generava insiemi di Mandelbrot. Faceva parte di una tesina sperimentale sul Caos, che partiva dal rapporto tra i filosofi presocratici e Nietzsche per arrivare ai frattali. Questo nell'ahimè remoto 1991.

    Siamo terribilmente OT. 😄


  • User Attivo

    @beke said:

    Il fatto che i link non siano tutti uguali fa parte della formula e del concetto che sta alla base di pagerank.
    Un documento importante ha un pagerank più alto e ne distribuisce di più ai documenti che linka.

    Ma qual'è un documento importante?

    Uno che a sua volta riceve link da documenti importanti.
    E così via.

    E' un algoritmo ricorsivo.

    la matematica c'è eccome.. gli spider di google non sono delle intelligenze artificiali che capiscono ed assegnano ad ognuno il pagerank che si merita. come dice beke è un algoritmo ricorsivo. Che poi dalla formula originale si siano introdotte variabili che rendono il pagerank particolare e tutte le balle che volete.. va bene... ma l'informatica si basa su formule non su esperienze empiriche...


  • Super User

    La matematica cè come dicono in molti nella formula del Pagerank, cosa che non mi trova in accordo o quantomeno in minimissima parte (forse all'inizio dell'avventura creata da Brin e Page, ma poi totalmente esclusa IMHO).

    Allora posto una domanda a tutti quelli che credono che il PR è basato su fattori matematici:
    (Lasciamo perdere le implementazioni che ha avuto nel corso del tempo questo fenomeno);

    la domanda è: come viene assegnato il PR ad un sito web ??
    Quanti BL deve ricevere un documento per essergli attribuito PR1 PR2 PR3 e via dicendo ??

    Voglio conti matematici e non ALTRO (gentilmente con esempi pratici)!!

    Cerchiamo di non ampliare il discorso, che il post era nato in base ad una concreta realtà, quale il non fattore matematico dell'algoritmo del PR.

    Grazie


  • User Attivo

    ekko la risposta a tutte le tue domande

    http://meyer.math.ncsu.edu/Meyer/PS_Files/DeeperInsidePR.pdf


  • User Attivo

    sinceramente ne avrei fatto a meno di tutta questa matematica,

    devo ancora finire di sostenere l'esame di Algoritmi in c, quindi non immagini quanto odi questa materia, ma è stato il mio prof a farci una lezione intera sul pagerank


  • Super User

    @domenico.biancardi said:

    sinceramente ne avrei fatto a meno di tutta questa matematicaDaccordissimo.
    Veramente troppa, sia per i miei gusti, sia per le mie capacità 😄

    @angelweb said:

    la domanda è: come viene assegnato il PR ad un sito web ??
    Quanti BL deve ricevere un documento per essergli attribuito PR1 PR2 PR3 e via dicendo ??
    Voglio conti matematici e non ALTRO (gentilmente con esempi pratici)!!Non è possibile (imho) fare i conti che dici tu senza avere il grafo del web di Google, è solo possibile speculare sul tipo di ripartizione del PR fra i vari documenti.

    Il PR di un documento dipendo non solo dal numero dei link che riceve (altrimenti sarebbe mera link-popularity) ma anche, direttamente e come chiaramente specificato nella formula, dal PR dei documenti che lo linkano e dal numero dei link uscenti che questi ospitano.

    Inoltre, a causa della crescita continua del web e quindi del numero di link in esso contenuti, anche un documento che continua a ricevere gli stessi tenderà a perdere PR ad ogni nuovo export a causa della normalizzazione del valore complessivo del PR.

    [AGGIUNTO]E' questo valore complessivo del PR normalizzato alla fine ad un valore di fondo scala fisso (es. 10 per la toolbar) che decide quale PR avrà il documento, il cui valore calcolato, ma non normalizzato non ti direbbe niente.[/AGGIUNTO]

    Se poi ho detto qualche strafalcione, qualcuno più "matematico" di me mi corregga.... 🙂


  • Super User

    @beke said:

    Inoltre, a causa della crescita continua del web e quindi del numero di link in esso contenuti, anche un documento che continua a ricevere gli stessi tenderà a perdere PR ad ogni nuovo export a causa della normalizzazione del valore complessivo del PR.

    vero. sempre che tu ti riferisca al PR portato sulla scala 0-10 🙂


  • Super User

    @must said:

    vero. sempre che tu ti riferisca al PR portato sulla scala 0-10 :)Si 🙂

    Ho fatto un'aggiunta al post precedente per (provare a) chiarire.


  • Super User

    @beke said:

    Si 🙂

    Ho fatto un'aggiunta al post precedente per (provare a) chiarire.

    missione compiuta 🙂
    :ciauz: