• Super User

    [LEFT]Però, ad esempio, un motore di ricerca può trarre delle conclusioni, se la percentuale relativa della spinta che riceve un sito proviene per la maggior parte da siti che spammano.

    http://infolab.stanford.edu/~zoltan/publications/gyongyi2006link.pdf
    [/LEFT]


  • User

    In merito ai link provenienti da spam engine, la cosa che mi ha più colpito l'ho scoperta l'altro giorno.

    Nella serp dello spammatore c'era un link verso una nostra pagina che non aveva più di un mese.

    Dove l'avrà pescata ?

    Ma i risultati li "tirano fuori" con i robots ?

    Non è che riusciamo ad individuarli nei file di log ?


  • Super User

    @"marcuzzer" said:

    Ritengo quindi che il valore più basso attribuibile a un backlink sia 0, non un valore minore di zero. Se poi la somma dei "valori" dei backlink è 0 allora può essere che il sito venga considerato spazzatura e quindi bannato. Ti ostini a parlare di "valore". 0, 1, -34, +78, 90... e quindi non ci troviamo.

    Il valore di un link, nel senso numerico del termine, non è mai negativo quando parliamo di Pagerank (quello della barretta verde o quello reale).

    Ma il posizionamento di un documento non dipende esclusivamente dal PR, ma anche dalle informazioni (kerouac3001 docet) che i link portano con sè: topic, lingua, trust, e chissà quante altre variabili che non sono date conoscere.

    La domanda quindi non dovrebbe essere: "un link può avere valore negativo?" ---no, non può avere valore negativo, bensì "l'Untrustness -ad esempio- è trasferibile tramite link?" 🙂

    Cordialmente,
    Stuart


  • User Attivo

    Grazie beke, il documento che hai aggiunto alla conversazione è molto interessante.

    Ciaooo:D


  • Super User

    @Stuart said:

    La domanda quindi non dovrebbe essere: "un link può avere valore negativo?" ---no, non può avere valore negativo, bensì "l'Untrustness -ad esempio- è trasferibile tramite link?"
    Si, è trasferibile, però funziona a rovescio.

    Se vieni linkato da un sito che fa parte di una white-list (il seed set nel caso specifico del trustRank) ti può venire trasferita una parte del suo trust.
    Se linki un sito che fa parte di una black-list si può pensare di addossarti una frazione di untrust.

    Dopodichè attraverso vari criteri di splitting ed attenuazione la propagazione fa il suo lavoro.

    Non ho nessuna prova specifica nè soffiate sul fatto che algoritmi di questo tipo siano già integrati in Google, nè ho fatto test specifici, ma dopo aver letto alcuni studi a riguardo ci scommetterei qualcosa.

    Ancora diverso, ma altrettanto plausibile, è il discorso della massa di spam.

    Secondo me trust ed untrust sono fattori che possono servire sia ad aggiustare gli ordinamenti, per esempio variando il damping factor del pageRank (e dando così origine ad un valore diverso da quello che è reso pubblico), sia ad alimentare liste di siti da controllare a scopo ban o penalizzazioni del tipo "minus thirty".

    Ovviamente sono solo congetture 🙂

    @Fabri: figurati, quel documento è conosciuto da oltre un anno, è stato segnalato per la prima volta si www.motoricerca.info.


  • User

    @Stuart said:

    Ti ostini a parlare di "valore". 0, 1, -34, +78, 90... e quindi non ci troviamo.

    ...

    La domanda quindi non dovrebbe essere: "un link può avere valore negativo?" ---no, non può avere valore negativo, bensì "l'Untrustness -ad esempio- è trasferibile tramite link?" 🙂

    Essendo che le macchine parlano solo con i numeri, e che qualsiasi algoritmo di ordinamento usera' degli operatori di confronto (minore, maggiore, uguale), ritengo di parlare di valore non a sproposito.
    Concordo pienamente quando dici che esistono tanti fattori che concorrono alla creazione di questo valore.

    La formula, e i pesi dell'algorimo di ordinamento non sono noti (a differenza della formula del pagerank) ma sono concorde a ritenere che possano esistere addendi negativi.

    Questo post, estremamente interessante, riguarda se volete un po' questo: puo' un link marcio penalizzare un sito? E se si, in che misura.

    Quello che sto cercando sono degli effetti, con plausibili cause, che possano dimostrare l'ipotesi qui sopra descritta. Il link postato "kerouac3001" è di imperdibile lettura e arricchisce questa discussione di modelli matematici indispensabili a mio avviso per una comprensione di ciò cha accade. Ma ancora non fornisce cause ed effetti. Sono solo teorie, piacevoli, plausibili, interessanti, ma solo teorie. Questo post vuole consentrarsi sugli esempi, sulla pratica...

    Grazie a tutti,
    *M


  • Super User

    @"marcuzzer" said:

    Essendo che le macchine parlano solo con i numeri, e che qualsiasi algoritmo di ordinamento usera' degli operatori di confronto (minore, maggiore, uguale), ritengo di parlare di valore non a sproposito. E infatti non ne parli a sproposito. Anche riconducendo tutto a valori (o vettori), possiamo tralasciare del tutto o in parte la teoria, purchè si sia d'accordo su due punti fondamentali:

    1. Un link non ha un valore singolo positivo o negativo che sia, ma diversi, perchè diverse sono le informazioni (numeri, vettori...) che porta con sè.
    2. Alcuni di questi valori sono noti (Pagerank), altri li si può dedurre dall'esperienza e dai test. Altri sono ignoti.

    La chiave del discorso, e in questo siamo d'accordo credo, è capire se esiste, tra le informazioni vettoriali contenute in un link, un'informazione che può essere "negativa", o deleteria per il sito linkato.

    @"marcuzzer" said:

    Sono solo teorie, piacevoli, plausibili, interessanti, ma solo teorie. Questo post vuole consentrarsi sugli esempi, sulla pratica... Ok, any ideas?

    Cordialmente,
    Stuart


  • User Attivo

    @Stuart said:

    Ok, any ideas?

    Yes Ai ev 😄

    Riportiamo le nostre esperienze,
    da quelle lette nei vari post e le mie, possiamo dire che:

    1 Se il tuo sito è ben posizionato e ben tematizzato, i link provenienti dagli spam engine non influsicono assolutamente sul sito.


  • User Attivo

    @Stuart said:

    Ok, any ideas?

    Yes Ai ev 😄

    Riportiamo le nostre esperienze,
    da quelle lette nei vari post e le mie, possiamo dire che:

    1 Se il tuo sito è ben posizionato e ben tematizzato, i link provenienti dagli spam engine non influsicono assolutamente sul sito.


  • User

    @Hotshot said:

    Yes Ai ev 😄
    Se il tuo sito è ben posizionato e ben tematizzato, i link provenienti dagli spam engine non influsicono assolutamente sul sito.

    Sull'assolutamente non sarei d'accordo.
    Se si inserice un valore negativo in una formula bisogna prestare attenzione che questa non ci si ritorca contro. Ossia ci deve essere un tetto, un massimo che il prodotto tra coefficiente (peso) e valore negativo possono raggiungere. Altrimenti scoperto il fattore negativo si potrebbero costruire macchine da guerra per far crollare anche la home page di Apple.

    Probabilmente c'e' anche un threshold, un livello minimo, sotto al quale questi link spammoni non vengono nemmeno considerati. Anche nel documento linkato da beke si dice che vengono considerati solo i link provenienti da siti spam con alto pagerank, perche' usare siti spam con basso pagerank introdurrebbe "falsi positivi" nei risultati dell'"algoritmo antispam" (che personalmente trovo un po' macchinoso... le cose semplici a mio avviso son quelle che funzionano).

    Per rispondere alla domanda di Stuart... no, no ideas so far...