- Home
- Categorie
- La Community Connect.gt
- News Ufficiali da Connect.gt
- Il PageRank di Google (no Page Rank) non è solo matematica
-
@Everfluxx said:
Che dire? Hai perfettamente ragione.
Mi ricordo che molti anni fa spiegavo la ricorsione ad un gruppo di persone.
"... la ricorsione è un tipo di algoritmo con una funzione che nel suo calcolo interno usa se stessa..."
Tutti in crisi (programmatori junior) salvo uno... che aveva veramente capito tutto e bene. Roberto, si chiamava. Mi ricordo che un anno dopo lasciò l'informatica per fare l'operaio del gas a Milano.
Ridete, ridete, ma vi giuro che è vero.
-
Sono un grande fan della ricorsione.
Per l'esame di maturità scrissi un programmino in Turbo Pascal che generava insiemi di Mandelbrot. Faceva parte di una tesina sperimentale sul Caos, che partiva dal rapporto tra i filosofi presocratici e Nietzsche per arrivare ai frattali. Questo nell'ahimè remoto 1991.Siamo terribilmente OT.
-
@beke said:
Il fatto che i link non siano tutti uguali fa parte della formula e del concetto che sta alla base di pagerank.
Un documento importante ha un pagerank più alto e ne distribuisce di più ai documenti che linka.Ma qual'è un documento importante?
Uno che a sua volta riceve link da documenti importanti.
E così via.E' un algoritmo ricorsivo.
la matematica c'è eccome.. gli spider di google non sono delle intelligenze artificiali che capiscono ed assegnano ad ognuno il pagerank che si merita. come dice beke è un algoritmo ricorsivo. Che poi dalla formula originale si siano introdotte variabili che rendono il pagerank particolare e tutte le balle che volete.. va bene... ma l'informatica si basa su formule non su esperienze empiriche...
-
La matematica cè come dicono in molti nella formula del Pagerank, cosa che non mi trova in accordo o quantomeno in minimissima parte (forse all'inizio dell'avventura creata da Brin e Page, ma poi totalmente esclusa IMHO).
Allora posto una domanda a tutti quelli che credono che il PR è basato su fattori matematici:
(Lasciamo perdere le implementazioni che ha avuto nel corso del tempo questo fenomeno);la domanda è: come viene assegnato il PR ad un sito web ??
Quanti BL deve ricevere un documento per essergli attribuito PR1 PR2 PR3 e via dicendo ??Voglio conti matematici e non ALTRO (gentilmente con esempi pratici)!!
Cerchiamo di non ampliare il discorso, che il post era nato in base ad una concreta realtà, quale il non fattore matematico dell'algoritmo del PR.
Grazie
-
ekko la risposta a tutte le tue domande
http://meyer.math.ncsu.edu/Meyer/PS_Files/DeeperInsidePR.pdf
-
sinceramente ne avrei fatto a meno di tutta questa matematica,
devo ancora finire di sostenere l'esame di Algoritmi in c, quindi non immagini quanto odi questa materia, ma è stato il mio prof a farci una lezione intera sul pagerank
-
@domenico.biancardi said:
sinceramente ne avrei fatto a meno di tutta questa matematicaDaccordissimo.
Veramente troppa, sia per i miei gusti, sia per le mie capacità@angelweb said:
la domanda è: come viene assegnato il PR ad un sito web ??
Quanti BL deve ricevere un documento per essergli attribuito PR1 PR2 PR3 e via dicendo ??
Voglio conti matematici e non ALTRO (gentilmente con esempi pratici)!!Non è possibile (imho) fare i conti che dici tu senza avere il grafo del web di Google, è solo possibile speculare sul tipo di ripartizione del PR fra i vari documenti.Il PR di un documento dipendo non solo dal numero dei link che riceve (altrimenti sarebbe mera link-popularity) ma anche, direttamente e come chiaramente specificato nella formula, dal PR dei documenti che lo linkano e dal numero dei link uscenti che questi ospitano.
Inoltre, a causa della crescita continua del web e quindi del numero di link in esso contenuti, anche un documento che continua a ricevere gli stessi tenderà a perdere PR ad ogni nuovo export a causa della normalizzazione del valore complessivo del PR.
[AGGIUNTO]E' questo valore complessivo del PR normalizzato alla fine ad un valore di fondo scala fisso (es. 10 per la toolbar) che decide quale PR avrà il documento, il cui valore calcolato, ma non normalizzato non ti direbbe niente.[/AGGIUNTO]
Se poi ho detto qualche strafalcione, qualcuno più "matematico" di me mi corregga....
-
@beke said:
Inoltre, a causa della crescita continua del web e quindi del numero di link in esso contenuti, anche un documento che continua a ricevere gli stessi tenderà a perdere PR ad ogni nuovo export a causa della normalizzazione del valore complessivo del PR.
vero. sempre che tu ti riferisca al PR portato sulla scala 0-10
-
@must said:
vero. sempre che tu ti riferisca al PR portato sulla scala 0-10 :)Si
Ho fatto un'aggiunta al post precedente per (provare a) chiarire.
-