• Community Manager

    [Weekly Thread] Cosa è il TrustRank, oggi :)

    Il TrustRank oggi, ma cosa è?

    Vorrei che in questo thread non ci fosse una vera e propria discussione con domande e risposte, ma solamente la propria opinione sul TrustRank.

    Per intervenire in questa discussione, consiglio comunque la lettura di:

    TrustRank su WikiGT
    [Convegno GT 2006] - Il TrustRank di Google - Presentazione Beke
    TrustRank - Traduzione Brevetto - Discussione Famosa
    Con TRUST o senza TRUST... qst è il problema?
    Il TrustRank e le pagine "seme"

    Dai su... 😉

    Io dirò la mia in settimana 🙂

    :ciauz:


  • User Attivo

    Salve a tutti, compresi coloro che commenteranno oppure esporranno le proprie idee nel proseguio.

    Mi piacerebbe iniziare questa discussione senza sfociare troppo nel tecnico, anche perchè di fatto nessuno può sapere come le cose funzionino nella teoria, non essendo pubblico l'algoritmo nè tantomeno il teorema che poi ha condotto il team di sviluppo alla creazione di così sofisticata tecnologia.

    Quando analizzo le cose, di solito mi pongo dalla parte di chi cerca di raggiungere un intento, e poi metto in pratica i concetti per vedere se il mio modo di pensare coincide o collima con quello realizzato dal creatore.

    Trustrank è un filtro che a pare mio non opera da solo, ma con altri filtri già operativi.
    Non penso proprio che si limiti ad esprimere un valore come il PageRank, tutt'altro, penso proprio che la sua funzione si spinga ben oltre.
    PhraseRank dovebbe essere un nuovo filtro che lavorerà in simbiosi con TR.
    Quello che ho appurato nella pratica, facendo tests e prove, è che sicuramente TR lavora sempre con il SandBox.
    I filtri lavorano su 2 livelli, il primo livello è l'anzianità del sito, per anzianità del sito io intendo la data della prima indicizzazione che può coincidere o meno con la data di registrazione del dominio (o poco più).
    Sandbox si occupa di "datare" il dominio, l'indicizzazione, i contenuti (pagine) e TrustRank di attribuire una autorevolezza ai contenuti.
    Mi pare evidente che questi due filtri debbano lavorare assieme, come si può prescindere l'anzianità dall'autorevolezza ?.
    Un sito antico deve per forza essere autoritario, un sito giovane a parità di contenuti lo è di meno.
    Vi prego di seguire il mio ragionamento che potrebbe discostare dalle dichiarazioni e dai vari documenti reperibili in rete ;).
    Ovviamente, bisogna che siano comprese le eccezioni, le varianti, e le singolarità; credo però che con l'andare del tempo gli algoritimi siano stati affinati con bassissimi margini di errore.
    Se seguiamo questo ragionamento ci troviamo a che fare con 4/5 punti fermi, riassumendo per il SandBox:

    • Età dominio
    • Età Pagine
    • Età Indicizzazione
    • Età backlinks (trustrank agisce anche su questo a mio parere)

    Qualsiasi sia l'algoritmo di controllo sulle date, è ovvio che debba per forza influenzare il TrustRank.
    Passo a voi la palla 🙂
    Luca


  • Super User

    Ciao Voidcomputer,

    non so.. io non ho una visione cosi' complessa del Trust Rank.. a differenza di altri argomenti, non mi ha mai stimolato "voli pindarici" sul suo funzionamento e sono rimasto abbastanza legato a quanto si legge nei brevetti:

    Secondo me nasce e vive come algoritmo "antispam" o meglio ai fini della ricerca di una ancor maggiore qualità delle serp... l'idea è semplice come quella del PR, i metodi di studio e di test effettuati pure, ha un funzionamento chiaro e un risultato positivo : siti seme "selezionati manualmente" "autorevoli" , come fonti di "trust" , siti seme "spam" come fonte di "distrust" ... un valore iniziale , un sistema di propagazione in rete con un valore assegnato "a cascata" ...

    Non vedo legami "particolari" con altri fattori (Phrase Rank? ma non è un algoritmo, è un sistema di indicizzazione.. sandbox? anzianità? quale legame diretto vedi con TR?? ) , se non il fatto che TUTTI i fattori che concorrono alla formazione di una serp , lavorano appunto "insieme" con lo scopo di fornire il miglior risultato possibile...

    :ciauz:
    Nicola


  • Super User

    breve e coinciso:
    oggi non è sufficiente avere un buon PR occorre che il sito abbia anche un buon TR (sintetizzando al max)

    ho potuto notare che siti "vecchi", con PR da 4 a 6, una discreta LP, etc., ma con basso TR hanno avuto problemi con le "fluttuazioni" periodiche di google e con i filtri antiduplicazione.

    invece siti con TR forte non hanno mai risentito di queste fluttuazioni o, se colpiti, ne hanno risentito in modo significativamente più lieve .. e questo, a maggior ragione, vale anche per i filtri antiduplicazione

    come far aumentare il TR del proprio sito è altra storia


  • User Attivo

    @nbriani said:

    Ciao Voidcomputer,

    non so.. io non ho una visione cosi' complessa del Trust Rank.. a differenza di altri argomenti, non mi ha mai stimolato "voli pindarici" sul suo funzionamento e sono rimasto abbastanza legato a quanto si legge nei brevetti:

    Secondo me nasce e vive come algoritmo "antispam" o meglio ai fini della ricerca di una ancor maggiore qualità delle serp... l'idea è semplice come quella del PR, i metodi di studio e di test effettuati pure, ha un funzionamento chiaro e un risultato positivo : siti seme "selezionati manualmente" "autorevoli" , come fonti di "trust" , siti seme "spam" come fonte di "distrust" ... un valore iniziale , un sistema di propagazione in rete con un valore assegnato "a cascata" ...

    Ho espresso un concetto visto dal lato codice, ho cercato di calarmi nel sistema di ragionamento di chi ha sviluppato il software, tralasciando la selezione "manuale" e quindi gli hubs, ci deve pur essere un sistema di preselezione o segnalazione o di preattribuzione di rank in automatico, e se questo esiste deve seguire una logica, che non può prescindere da un sistema di "datazione" .
    Ho fatto varie prove, quanto da me supposto, in parte l'ho verificato, certo non ho potuto fare i test con siti con altissimo trust, quello che ho fatto, l'ho fatto in maniera sporca con quello che avevo sottomano.

    Non vedo legami "particolari" con altri fattori (Phrase Rank? ma non è un algoritmo, è un sistema di indicizzazione.. sandbox? anzianità? quale legame diretto vedi con TR?? ) , se non il fatto che TUTTI i fattori che concorrono alla formazione di una serp , lavorano appunto "insieme" con lo scopo di fornire il miglior risultato possibile...

    :ciauz:
    Nicola

    Per quanto ho capito io non è detto che i filtri agiscano tutti assieme, penso che vengano chiamati in causa al verificarsi di determinati eventi.
    I filtri antispam seguono delle logiche molto automatizzate (tanto è vero che google stesso prevede una reinclusione in manuale), noi ne conosciamo alcuni, non è detto che siano gli unici.
    Le domande che mi sono posto sono le seguenti :
    E' corretto dire che un sito più antico avrebbe diritto ad avere un trust più elevato ?
    E' corretto dire che chi ha pubblicato per primo un contenuto, deve per forza avere dei backlinks "vecchi", e che il contenuto lo devo avere archiviato già da molto tempo ?
    E' corretto dire che se altri siti "vecchi", ritengono autorevole un sito giovane, con contenuti giovani ed esclusivi non deve incappare nel sandbox ?
    Traducendo questi concetti in codice, presumo che sandbox e tr debbano per forza essere in simbiosi.

    PhraseRank è un sistema di indicizzazione e come tale codice, aka algoritmo.
    Tutti i brevetti sono "codice" il problema è che il codice si copia e si modifica, rendendo vano la protezione del diritto, viceversa brevettando il sistema di sviluppo, si evita di essere copiati :).
    Saluti
    Luca:ciauz:


  • Super User

    Luca,

    vorrei cercare di fare un po' di chiarezza, a favore degli utenti meno esperti, perchè ho paura che i tuoi interventi ci portino fuori strada...

    Intanto,

    Quando si dice "Questo sito ha piu' o meno TRUST" si fa una valutazione assolutamente soggettiva, priva di qualunque riscontro "formale" .

    Tant'è che oggi è diventato di uso comune parlare di "Trust", nel senso pero' generale di "autorevolezza", "forza" di un determinato sito o documento web...

    Ad esempio siamo soliti dire "questo forum ha un grande Trust" perchè il potenziale che ha per portare in SERP i propri contenuti è molto alto... a volte basta scrivere qualche keywords in un thread per raggiungere velocemente buoni posizionamenti in SERP ...

    Non esiste una misura oggettiva di questa "sensazione" ma al contrario è frutto della sensibilità di questo o quel webmaster...

    Parlare di Test o di prove è quindi oggettivamente molto difficile... inoltre tale valore di "autorevolezza" in senso assoluto di un sito web **è certamente frutto di molti parametri **con cui abbiamo imparato a convivere : di sicuro il pagerank, anche la qualità del server, chissà se fattori social possano pure influire, e probabilmente anche il "TrustRank" (oggetto di questo thread) di cui conosciamo la probabile esistenza grazie alla pubblicazione del brevetto .... (poi chissa' quali e quanti altri...)

    Quindi dire "Trust" non significa parlare di "TrustRank" di un sito.... Il "TrustRank" infatti è uno specifico algoritmo, di cui esiste un preciso brevetto del 2005 mi pare, (vedi i link di Giorgio) di cui non esiste nemmeno certezza del suo utilizzo, e che si chiama:

    Combating Web Spam with Trustrank
    di Zoltan Gyongyi, Hector Garcia-Molina, Jan Pedersen

    http://www.vldb.org/conf/2004/RS15P3.PDF

    e che nasce appunto per combattere lo Spam, cioè come "algoritmo" antispam...

    In pratica quei tre studiosi hanno provato come attraverso un numero esiguo di siti "seme" (nell'ordine di poche centinaia) selezionati "manualmente" (partendo da una selezione algoritmica ma selezionandoli e filtrandoli in funzione di alcune caratteristiche specifiche) e a cui viene assegnato un determinato valore di "fiducia iniziale" espresso dal parametro "TrustRank" , si possa ottenere ottimi risultati in termini di riduzione dello spam nelle serp, grazie ad una formula molto simile al PageRank di trasmissione del parametro in funzione della distanza di un documento dai "siti seme" selezionati.

    Hanno preso un db molto grande di documenti web reale, hanno selezionato solo qualche centinaio di siti seme ed hanno provato ad applicare il loro algoritmo in aggiunta agli algoritmi di ranking già attivi, ed hanno confrontato le serp con e senza il "loro" Algoritmo.. ** risultato ?** spam ridotto e assunzione in Google! 😄 (Altavilla Docet)

    Ora oggi cosa possiamo dire noi comuni mortali sul TrustRank ?

    Conosciamo i siti seme ? **NO! abbiamo solo alcune indicazioni sul brevetto sulla loro formazione (per esempio la presenza in grandi directory dei siti selezionati dal cosiddetto Pagerank inverso , ovvero l'algoritmo iniziale utilizzato per la selezione)
    **
    Conosciamo il valore di "TrustRank" di un sito?
    **No! **al contrario del pagerank di cui viene fornito un valore di riferimento (se pur impreciso e temporalmente inesatto) del trustRank non sappiamo nulla e trovo impensabile riuscire ad avere una sensazione seppur generale del Trustrank del proprio sito (non parlo di "Trust" , autorevolezza , ma "trustrank" )

    E' quindi impossibile condurre dei test per capire il trustrank del proprio sito e le sue variazioni... (bè sono sempre pronto a essere smentito, se qualcuno avesse qualche buona idea :1:

    Su quali elementi possiamo discutere quindi?

    • sulla formazione dei siti seme (quali caratteristiche?)
      (Voidcomputer è in questo senso che pensavi ad un legame con l'anzianità di un sito? se supponi che fra i possibili elementi di selezione ci sia l'anzianità del sito ok, sono d'accordo, ma si parla dei soli siti seme... la formula di trasmissione non pare avere poi alcuna relazione con l'anzianità dei siti a legger il brevetto... quindi non ha senso parlare di rapporto con la Sandbox (ma esiste davvero? :D) a mio giudizio ne parlare di "Test e prove effettuate"... )

    **- sulla distanza dai siti seme e sulla propagazione del TrustRank
    **Qui possiamo sbizzarrirci con idee e proposte, ma ripeto ... come è possibile fare test?

    - Su eventuali nuovi elementi che potrebbero aver modificato la formula originale....
    Cosi' come ipotesi sono state fatte sul pagerank, possiamo anche fare supposizioni su eventuali elementi che influiscano sul sistema di propagazione del Trustrank ... ma parliamo sempre di supposizioni soggettive...

    - sulle "varianti" già espresse all'interno del Brevetto... "Topic TrastRank" e necessità di avere siti seme differenziati per settore e localizzaizone geografica

    Sperando di aver contribuito a rimettere in carreggiata il Thread ripasso la parola alla discussione... 🙂

    :ciauz:
    Nicola


  • User Attivo

    Ciao nbriani,
    Effettivamente, rileggendo quello che ho scritto, ho capito di aver esteso un pò troppo l'intento della discussione.
    Quotando in pieno e ringraziandoti per il contributo che mi ha permesso di comprendere meglio il funzionamento del TrustRank, permettimi di scusarmi per l'atteggiamento poco educato che potrei aver avuto nella esposizione.
    Avanti con gli interventi 🙂
    Saluti
    Luca


  • User Attivo

    Fatemi capire allora parlare del trustrank significa parlare di qualcosa che non è misurabile?