[Brevetti Google] Google PhraseRank

cineasta

E il buon senso?

pierfrancesco99

E il buon senso?

Quello è sottointeso:D

cineasta

Agoago, "Le frasi buone sono quelle frasi che contengono termini in tema con l'argomento trattato dal sito. Rinforzano le key a tema che le frasi contengono al loro interno."

Io mi chiedo se una scelta del genere non si sia la strada maestra per agevolare la proliferazione di spam engine tematici.

====

Secondo voi l'algoritmo in questione è già stato introdotto?
Ciao

micky

@"Nbriani" said:

E , lo dice il brevetto, non è la ripetizione di keyword a determinare cio' che è spam o meno (quei doc semplicemente non emergono) ma il "Phrase stuffing" (:D ) concetto con cui credo dovremmo confrontarci alla svelta... cioè documenti che contengono un immensità di frasi comuni correlate ad un argomento a rischiare il flag per Spam!

@"Everfluxx" said:

a spam document will have an excessive number of related phrases ;););)

Quindi secondo la vostra interpretazione o secondo il brevetto stesso, rischierebbe il flag per spam anche chi si dilunga, si ripete e "allunga il brodo" in un testo?

nbriani

Ciao Micky,

no, il mio parere è che il brevetto si riferisca a documenti che contengono una moltitudine di frasi "valide" (nel senso del brevetto) ma che molto probabilmente (cioè attraverso il raffronto con un valore standard) evidenziano proprio che non riguardano un solo argomento... tipico ad esempio degli spam engines...

In sostanza, se si identificano delle regole per definire un frase come "BUONA" (good phrases) , google è in grado di definire un numero medio di "frasi buone" per documento... (nel far questo prenderà in considerazione anche i documenti dove gli argomenti sono ben spiegati e pure ben "allungati" come dici tu) ... quindi penso che l'asticella per definire un documento come SPAM attraverso un algo del genere (ricordati che gg ne utilizza molti altri di metodi) debba essere necessariamente molto alta ...

A normal, non-spam document will generally have a relatively limited number of related phrases, typically on the order of between 8 and 20, depending on the document collection. By contrast, a spam document will have an excessive number of related phrases, for example on the order of between **100 and 1000 **related phrases.E' il concetto di "frase buona" che devi tenere bene in mente... probabilmente anche se tu infioretti un argomento quanto vuoi... difficilmente supererai un certo numero medio di "frasi buone" (ti ricordo che le buone sono quelle che anche ricorrono piu' di altri documenti semanticamente vicini)

Imho,

Nicola

micky

ciao Nicola :), non sono sicuro di aver capito bene; solo che se si setta un "limite" di frasi buone anche gli spammer possono regolarsi di conseguenza e tarare i loro algoritmi di costruzione testi proprio limitandone ad un numero ragionevole le frasi buone stesse.
Probabilmente sono io che continuo a non capire cosa voglia dire sostanzialmente questo phrase rank. Possiamo provare a spiegarlo e a ricapitolarne gli aspetti salienti in maniera semplice per i comuni mortali come me :)?

nbriani

@micky said:

... solo che se si setta un "limite" di frasi buone anche gli spammer possono regolarsi di conseguenza e tarare i loro algoritmi di costruzione testi proprio limitandone ad un numero ragionevole le frasi buone stesse.

embè? vorrà dire che avrai fatto proprio cio' che gg voleva.. Perchè dici questo come fosse una critica a quel sistema? anche il Keyword stuffing puo' essere determinato da un "limite" in qualche modo "settato" dal Mdr a cui dobbiamo stare attenti ad attenerci per non incorrere in effetti contrari..no? Se una keyword non ce l'hai nel testo ne in anchor non appari, se cè l'hai qualche migliaio di volte dappertutto sei in OOP ... sicuro !

Quindi non vedo cosa ci sia di diverso... solo che mentre attenersi alle "regole" del Keywords stuffing puo' essere abbastanza fattibile (vedasi l'uso dell'arma segreta del SEO... cioè il "buon senso" la cosa non è altrettanto immediata per il "Brevetto sul Phrase Rank" ....
[/QUOTE]

@micky said:

Probabilmente sono io che continuo a non capire cosa voglia dire sostanzialmente questo phrase rank. Possiamo provare a spiegarlo e a ricapitolarne gli aspetti salienti in maniera semplice per i comuni mortali come me :)?

Sai bene che quando fai di questi "assist" tu mi inviti a nozze... ma poi non ti lamentare degli pseudo "SEO" che fanno i post didascalici, definitivi e che si fanno "belli" attraverso forum e blog ....

Stavolta pero' ti consiglio di rileggere questo thred da cima a fondo perchè penso che contenga ed esprima molto bene il senso del brevetto (almeno per quanto riguarda me...) ... e gli interventi a volte di getto altre volte ben ponderati che vi sono da parte di molti dei piu' esperti e appassionati utenti del forum ne sono una conferma.

Comunque ci provero' a farti un riassunto lampo che vada nella direzione dell'aspetto che stiamo dibattendo cioè sulla rilevazione dello spam (che è solo una delle implicazioni del brevetto)

Si parla di "indicizzazione per frasi"

quindi di come possa essere diversa la fase di "indicizzazione" di un MDR se viene fatta per frasi e non per singole parole

Indicizzazione intendo proprio la creazione degli indici ... cioè dello strumento che consente al MDR di collegare la query al documento ...

ok?

Sono quindi indici di frasi non di parole

Per costruirli si individuano le frasi buone e le frasi non buone (diciamo trascurabili)

"Frasi buone" hanno tra l'altro la caratteristiche di prevedere la presenza di un certo numero medio di altre "frasi buone" (si parla in termini di media)

.. fra le varie implicazioni e caratteristiche che ha o avrebbe una tale architettura c'è n'è una nel brevetto che riguarda la rilevazione dello spam :

"un documento che contenga un grande numero di frasi buone, in una forma molto superiore alla media calcolata su l'indicizzazione di tutta la rete puo' essere flaggato come sospetto spam"

esattamente come avviene in una indicizzazione normale con le parole.. ma mentre prima si ragionava in termini di numero di volte in cui singole parole erano presenti oggi si parla (parlerebbe) di "Related good Phrases" ....

Insomma se parli di cani , di macchine o di pere userai un certo numero di frasi "tipiche" rispetto a tutti i documenti in rete che parlano di quegli stessi argomenti.... se il tuo doc pero' si discosta enormemente dalla media ... rischi di incorrere in penalizzazioni per spam....

Pensa all'esempio del Brevetto: argomento: "La casa Bianca" ora immagina tutti i documenti in rete che parlano della "La casa Bianca" quante related phrases avranno mediamente? (cioè quanti e quali altri argomenti vi sono collegati?) diciamo i presidenti, washington, clinton, i sigari (:D) e via e via ... concordi che sia ragionevole pensare che mediamente è possibile trovare un certo numero medie di frasi "buone presenti" ?
Ok.. allora immagina un doc parli della casa Bianca ma che contenga qualche migliaio di frasi buone in piu'.... spam?

Bo', sono stato abbastanza ermeticamente chiaro e riassuntivo sul mio punto di vista ?

Nicola

micky

sì Nicola sei stato chiarissimo :). Il topic l'avevo letto per intero intervento di Agoago compreso :D! Quello che mi lascia/lasciava perplesso era il fatto che se mentre uno "scrittore reale" deve proprio impegnarsi in negativo per incorrere nel keyword stuffing, lo stesso "scrittore reale" in un eccesso di verve potrebbe scrivere naturalmente un botto di frasi correlate ad un argomento ed essere erroneamissimamente tacciato come spammer. Tu mi dirai: no micky, guarda che per un numero alto di frasi correlate intendo proprio alto alto; e micky dice: benissimo allora cari spammer, invece di usare il 100% delle frasi correlate che il vostro algoritmo riesce a pescare, fermatevi al 66%, sparato a caso, soglia "ottima" di un documento ottimizzato per x keyword o phrases. Ma non può essere così semplice il discorso: probabilmente dietro c'è altro che ancora non riesco a comprendere :).

nbriani

@micky said:

s Ma non può essere così semplice il discorso: probabilmente dietro c'è altro che ancora non riesco a comprendere :).

Mah.. secondo me non è cosi' semplice nel senso che **tutti **i brevetti intorno al "Phrase Rank" hanno ben altro da dire che "semplicemente" segnalare lo Spam
... insomma si tratta di brevetti che modificano fortemente la struttura "classica" dell'indicizzazione per andare nella direzione della **qualità dei risultati e della semantica... ** poi puo' essere naturale che un brevetto del genere preveda anche aspetti legati alla individuazione dello Spam... ma mi pare **non **determinante ne decisivo rispetto al resto delle possibili novità...

Imho..

Nicola

paocavo

@nbriani said:

Mah.. secondo me non è cosi' semplice nel senso che **tutti **i brevetti intorno al "Phrase Rank" hanno ben altro da dire che "semplicemente" segnalare lo Spam
... insomma si tratta di brevetti che modificano fortemente la struttura "classica" dell'indicizzazione per andare nella direzione della **qualità dei risultati e della semantica... ** poi puo' essere naturale che un brevetto del genere preveda anche aspetti legati alla individuazione dello Spam... ma mi pare **non **determinante ne decisivo rispetto al resto delle possibili novità...

Imho..

Nicola

Quoto in pieno