• Super User

    Il PageRank di Google (no Page Rank) non è solo matematica

    Questo post è giusto per spiegare che il Pagerank? di Google non è solo assegnato/calcolato in base a dei conti matematici ma anche da altri fattori.

    Questo è quello che dice mister GG:

    Basato sullo specifico carattere "democratico" del Web, PageRank sfrutta la vastissima rete di collegamenti associati alle singole pagine per determinarne il valore. In pratica, Google interpreta un collegamento dalla pagina A alla pagina B come un "voto" espresso dalla prima in merito alla seconda. Tuttavia, non si limita a calcolare il numero di voti, o collegamenti, assegnati a una pagina. Oltre a effettuare questo calcolo, Google prende in esame la pagina che ha assegnato il voto. I voti espressi da pagine "importanti" hanno più rilevanza e quindi contribuiscono a rendere "importanti" anche le pagine collegate.

    PageRank assegna ai siti Web importanti e di alta qualità un "voto" più elevato di cui Google tiene conto ogni volta che esegue una ricerca. È evidente che oltre ad essere importanti, le pagine devono corrispondere ai termini ricercati. Quindi, Google integra PageRank con sofisticate procedure di ricerca testo per trovare le pagine che sono rilevanti e rispondono ai criteri di ricerca indicati. Google non si limita solo ad esaminare il numero di volte in cui una parola specifica è presente nella pagina, ma esamina tutti gli aspetti del contenuto della pagina (e dei contenuti delle pagine correlate ad essa) per stabilire se risponde o meno ai criteri di ricerca indicati.

    Contenuto in : http://www.google.it/why_use.html


  • Super User

    @angelweb said:

    ... Quindi, Google integra PageRank con sofisticate procedure di ricerca...

    ...non si limita a calcolare il numero di voti, o collegamenti, assegnati a una pagina. Oltre a effettuare questo calcolo, Google prende in esame la pagina che ha assegnato il voto. I voti espressi da pagine "importanti" hanno più rilevanza...Il fatto che i link non siano tutti uguali fa parte della formula e del concetto che sta alla base di pagerank.
    Un documento importante ha un pagerank più alto e ne distribuisce di più ai documenti che linka.

    Ma qual'è un documento importante?

    Uno che a sua volta riceve link da documenti importanti.
    E così via.

    E' un algoritmo ricorsivo.


  • Super User

    Infatti quello che voglio dire che purtroppo mi sono trovato sempre in disaccordo con molti forumisti su questo forum, che il PR non viene calcolato solo in conti numerici ma anche da altri fattori, ed uno è la rilevanza di un documento importante che di conseguenza prende link da documenti importanti e via dicendo.


  • Super User

    @beke said:

    E' un algoritmo ricorsivo. Già. 🙂

    Si potrebbe affermare che il PR sia "magmatico" e in continua evoluzione (e si possono fare altre considerazioni interessanti, ad esempio che, essendo una piccola frazione di PR connaturata alla creazione stessa di una pagina*, il PR di una home page sia, semmai, direttamente proporzionale --in una certa misura-- al numero di pagine del sito, nel caso in cui quelle stesse pagine siano molto numerose e abbiano ciascuna un link di ritorno verso la home page), ma dire che PR "non è matematica" significa negare la sua natura algoritmica. IMHO.

    • (Anche questo è desumibile dalla formula originale di PageRank, che ancora oggi si dà per valida, fino a prova contraria, come giustamente notava Beke).

  • Community Manager

    @angelweb said:

    Infatti quello che voglio dire che purtroppo mi sono trovato sempre in disaccordo con molti forumisti su questo forum, che il PR non viene calcolato solo in conti numerici ma anche da altri fattori, ed uno è la rilevanza di un documento importante che di conseguenza prende link da documenti importanti e via dicendo.

    Esprimi un concetto uguale agli altri 🙂

    Se uno dice che il PR è influenzato dai link, è la stessa cosa di quello che dici tu, perchè, di fatto, l'importanza del documento è data dai link.

    Quello che dici è uguale a quello che dice Beke, Everfluxx e via via dicendo tutti gli altri 😉

    La formula di cui discutiamo, che è sicuramente stata modificata, si commenta da sola, come anche quello che dice Google.

    :ciauz:


  • Super User

    @angelweb said:

    Infatti quello che voglio dire che purtroppo mi sono trovato sempre in disaccordo con molti forumisti su questo forum, che il PR non viene calcolato solo in conti numerici ma anche da altri fattori, ed uno è la rilevanza di un documento importante che di conseguenza prende link da documenti importanti e via dicendo.Il Pagerank stabilisce l'importanza, o piùpropriamente l'autorità dei documenti contenuti nel grafo del web.
    Questo viene fatto utilizzando esclusivamente i dati del grafo, cioè i collegamenti fra i documenti, e non il loro contenuto.

    Un documento importante (PR alto) è quello che riceve molti link da pagine di bassa importanza (basso PR) e/o pochi da pagine molto importanti (PR alto).

    Il PR fino a prova contraria, per me, è questo.
    Se qualcuno ha degli indizi fondati che il valore indicato sulla barretta verde si calcola in altro modo che questo può ovviamente farcelo sapere 🙂


  • Super User

    @beke said:

    Il PR fino a prova contraria, per me, è questo.
    Se qualcuno ha degli indizi fondati che il valore indicato sulla barretta verde si calcola in altro modo che questo può ovviamente farcelo sapere 🙂
    M'associo. 🙂


  • Community Manager

    Ed è quello che si dice da sempre 🙂


  • Super User

    @Everfluxx: Qua la mano socio 😉

    @Giorgio: Angelweb non sta dicendo proprio la stessa cosa, la sua tesi infatti è che l'importanza di un documento non dipenda solo dai link

    ...il PR non viene calcolato solo in conti numerici ma anche da altri fattori...
    Ovviamente non ho nulla contro Angelweb ci mancherebbe eh 🙂 ma è importante che le visioni e le opinioni si confrontino anche approfonditamente, è solo così che si impara qualcosa.
    E ovviamente ci sta benissimo sia io ad imparare, ne sarei più che felice :yuppi:


  • Community Manager

    @beke said:

    Ovviamente non ho nulla contro Angelweb ci mancherebbe eh 🙂 ma è importante che le visioni e le opinioni si confrontino anche approfonditamente, è solo così che si impara qualcosa.
    E ovviamente ci sta benissimo sia io ad imparare, ne sarei più che felice :yuppi:

    O Yeah :yuppi:

    Io penso che però Angelweb dica più o meno la stessa cosa.

    Però aspettiamo lui per vedere se è vero quello che penso; io credo che quello che dice si concentri nell'affermazione di Google:

    Tuttavia, non si limita a calcolare il numero di voti, o collegamenti, assegnati a una pagina. Oltre a effettuare questo calcolo, Google prende in esame la pagina che ha assegnato il voto.

    Aspettiamo per discuterne 😉


  • Super User

    Secondo me, se si vuole uscire da una discussione potenzialmente sterile, bisogna innanzitutto accordarsi su ciò che s'intende per "PageRank".

    Io e Beke per "PageRank" intendiamo quello che tutti (o quasi :D) intendono: un indice di importanza calcolato per mezzo dell'algoritmo ricorsivo contenuto nel paper originale "The Anatomy of..." che tutti (o quasi :D) ormai conoscono a menadito, rappresentato tramite l'amata/odiata barretta verde sulla Google Toolbar.

    Angelweb invece, mi pare di capire [mi corregga pure se ho male interpretato], col termine "PageRank" intende, per estensione, l'importanza/rilevanza che gli algoritmi di ranking oggi implementati in Google assegnano a una data pagina in base alla query dell'utente.

    Se la mia interpretazione del pensiero di Angelweb è corretta, allora si sfonda una porta aperta, perlomeno per quanto mi riguarda: sono infatti pienamente d'accordo sul fatto che il «PageRank» (fra virgolette) di una pagina non dipenda solo da quello dei suoi inbound link, ma anche da innumerevoli altri fattori tra cui, ad esempio, la rilevanza di quella pagina all'interno del topic di riferimento. Rilevanza che potrebbe essere calcolata --lo ripeto-- in maniera diversa per ciascuna query attraverso una versione "moddata" 😄 di PageRank: vedi il paper Topic-Sensitive PageRank, di cui cito l'abstract:

    @Taher H. Haveliwala said:

    In the original PageRank algorithm for improving the ranking of search-query results, a single PageRank vector is computed, using the link structure of the Web, to capture the relative "importance" of Web pages, independent of any particular search query. To yield more accurate search results, we propose computing a set of PageRank vectors, biased using a set of representative topics, to capture more accurately the notion of importance with respect to a particular topic. By using these (precomputed) biased PageRank vectors to generate query-specific importance scores for pages at query time, we show that we can generate more accurate rankings than with a single, generic PageRank vector. For ordinary keyword search queries, we compute the topic-sensitive PageRank scores for pages satisfying the query using the topic of the query keywords. For searches done in context (e.g., when the search query is performed by highlighting words in a Web page), we compute the topic-sensitive PageRank scores using the topic of the context in which the query appeared.
    A voi la palla. 🙂


  • Super User

    Forse stiamo dicendo tutti la stessa cosa ma il problema è che non ci capiamo o io non mi spiego bene.

    Ribadisco che il PR IMHO non è solo matematica ma viene calcolato da altri fattori e uno è quello dell'importanza di un documento in quanto relativo se possiede PR0 PR1 PR2 ecc.ecc.

    Ci siamo fino a qui ??

    per Giorgio: si dice che il PR è frutto di matematica cioè ricevendo tot di link si ottiene PR..
    e questo non è vero assolutamente.
    Questo è quello che credo.

    Però da quello che ho capito e letto dagli altri ragazzi non mi sembra che siano proprio tutti daccordo con questa affermazione!!


  • Super User

    @angelweb said:

    Ribadisco che il PR IMHO non è solo matematica ma viene calcolato da altri fattori e uno è quello dell'importanza di un documento in quanto relativo se possiede PR0 PR1 PR2 ecc.ecc.

    Ci siamo fino a qui ?? Ehm... no. 😄

    Forse non ti è molto chiaro il concetto di algoritmo ricorsivo... Quello che stai dicendo (se stai dicendo che il PR --o importanza-- di una pagina non dipende solo dal numero di back link ma anche, a sua volta, dal PR --o importanza-- delle pagine contenenti tali link) è infatti ricompreso nella formula (matematica) per il calcolo di PageRank contenuta nel paper di Brin e Page. Cito Beke:

    @beke said:

    Il fatto che i link non siano tutti uguali fa parte della formula e del concetto che sta alla base di pagerank.
    Un documento importante ha un pagerank più alto e ne distribuisce di più ai documenti che linka.

    Ma qual'è un documento importante?

    Uno che a sua volta riceve link da documenti importanti.
    E così via.

    per Giorgio: si dice che il PR è frutto di matematica cioè ricevendo tot di link si ottiene PR..
    e questo non è vero assolutamente.
    Infatti. Ma questo non è nemmeno desumibile dalla formula di PageRank così come oggi la conosciamo: infatti, ai fini del calcolo di PR, non tutti i link hanno lo stesso peso (perché, ricorsivamente, non tutte le pagine hanno lo stesso PR). Perciò è perfino ovvio che uno stesso numero di link non porti necessariamente a un pari incremento di PR.

    Scusami se mi ripeto: il PageRank di una pagina dipende esclusivamente da quello dei suoi back link.


  • Super User

    @Everfluxx said:

    Scusami se mi ripeto: il PageRank di una pagina dipende esclusivamente da quello dei suoi back link.

    Con questa affermazione vuoi dire in base al NUMERO o alla QUALITA' ??


  • Super User

    @angelweb said:

    Con questa affermazione vuoi dire in base al NUMERO o alla QUALITA' ??
    In base a entrambi. E la "qualità" è definita, a sua volta, in termini di PageRank.

    Questo è quel che si dice un algoritmo ricorsivo.


  • Super User

    @Everfluxx said:

    Questo è quel che si dice un algoritmo ricorsivo.

    ma mi vuoi intrippare il cervello a questa ora ?? 😄


  • Super User

    @angelweb said:

    ma mi vuoi intrippare il cervello a questa ora ?? 😄

    Sorry... 😄


  • Super User

    assolutamente d'accordo con beke e everfluxx (nonostante abbia fatto studi umanistici).


  • Super User

    @must said:

    assolutamente d'accordo con beke e everfluxx (nonostante abbia fatto studi umanistici).
    Se è per quello, anch'io ho fatto studi onanistici. 😄


  • Super User

    :lol: (siamo OT, basta)