Iniziato Update PR

nbriani

Ho un sito super spammoso, linkato da cani e porci anche tramite tecniche black hat (estreme) e con inserimenti automatici in commenti wordpress (in siti anche di lingue diverse), in web dir ecc. Roba che di affinita di argomenti c'entra MENO di 0 con il sito in questione. Anzi non ho nemmeno un sito neanche LONTANAMENTE affine che mi linka in tutto il web. Nemmeno 1. Risultato?
Pr5. E non solo.. per quelli che pensano che il pr non conti nulla, che ci voglia affinità di siti linkanti ecc... sono anche in cima a quasi tutte le serp settoriali.

Che dire.... Complimenti!

Ma nessuno pensa che Google sia tanto sofisticato o infallibile... se no non esisterebbero i quality Rater, no?

Certo che leggendo la storia, i documenti originali, i testi di studio e i paper dei vari ingegneri, se si pensa alla struttura ingegneristica , alle menti e alle persone coinvolte, alle decine di brevetti registrati intorno al motorone californiano (ma anche agli altri) , forse non sarà "sofisticato" come dici tu, ma io lo trovo "idealmente" e "intellettualmente" affascinate ... Google, ma anche gli altri big searcher, incarnano la frontiera tecnologica dell'information retrieval in rete, che ritengo un argomento davvero interessante e di forte impatto con il ns futuro prossimo cosi' ormai legato alla rete...

Per questo mi piace fare "supposizioni" e applicare il mio "modestissimo" pensiero e ragionamento teorico ...:D

Si fanno supposizioni "x.filesiane" in questo caso, semplicemente perchè colpisce un calo tanto diffuso di PR.... cosi' cercavo di ragionare a voce alta sulle possibili motivazioni...

Nicola

paocavo

@superdan said:

Secondo me state facendo supposizioni X.Filesiane. ...

forse...

LowLevel tempo fa parlava di Google come un pentolone in cui ogni tanto (spesso IMHO) salta fuori qualche carota...

Quello che osservo nasce dall'analisi di molti siti e sono sempre discorsi generali, è ovvio che ci sono sempre eccezioni ...ma è solo questione di tempo...poi risistema tutto...

superdan

Ti dirò che a tutt'oggi Mister G si pappa ancora testo nascosto (invisibile ecc.), link nascosti, cloacking ecc. ecc. ecc. Ma alla grande proprio altro che filtri fantascientifici ecc. Ovvio può capitare che si venga bannati (ma non è detto, ci sono siti che sono cosi da anni e viaggiano ancora da dio..) ma SOLO dopo che un umano ne verifica la presenza (il cosiddetto cutt's antispam team). E quasi sempre SOLO dietro una segnalazione umana (cioè qualcuno che riempie il modulo e fa diciamo "la spia"). Secondo me G è sopravvalutato dai molti in realtà è molto ma molto piu semplice e "pistola" di quanto il 99% della gente creda. Anche queste supposizioni si basano su osservazioni (gestisco una 300ina di siti) e a mio parere basta sapere quelle 2-3 cose per muoversi abbastanza bene. Ovvio pero, quelle poche vanno sapute molto bene, in primis la struttura cosa che praticamente in Italia non conosce quasi nessuno e che invece è fondamentale. Saluti

nbriani

Puoi spieare meglio il concetto e fornirci qualche riferimento? thanks

Cercavo soltanto di immaginare quali possibili cambiamenti potessero essere stati introdotti nel calcolo del PR.. e ripensavo ai vari documenti letti in passato ... cosi' mi era rivenuto in mente il "Trust Rank" ... con quel suo meccanismo di "documenti seme" di partenza che diffondono un parametro di Trust vero i siti linkati... cos' supponevo (ma non ho certamente riferimenti) che il Page Rank potesse aver avuto un simile sviluppo (cioè documenti autorevoli di partenza che hanno un valore aggiuntivo di page rank da distribuire) ma è senza dubbio una idea un po' forzata e tirata in ballo cosi' di sana pianta..

Mentre mi par piu' credibile l'ipotesi della "freschness" dei BL ai fini del conteggio del PR e l'introduzione del fattore temporale nella considerazione di un BL ... che mi pare un concetto ormai a 10/15 anni di distanza dal calcolo originario del PR e ad olltre 20 anni dalla nascita della rete che possa avere un qualche fondamento reale... (visti anche appunto i nuovi brevetti)

Nicola

nbriani

**Secondo me G è sopravvalutato dai molti in realtà è molto ma molto piu semplice e "pistola" di quanto il 99% della gente creda. **

Mah... non so cosa sei abituato a considerare "complesso" visto che ritieni un MDR come Google "semplice"

A me pare invece che non solo la documentazione prodotta in questi anni sulla sua infrastruttura informatico/organizzativa, ma anche i risultati che sono sotto gli occhi di tutti (almeno i miei) quotidianamente in termini di prestazioni e qualità nello svolgimento del suo "lavoro" (l'information retrieval appunto) , di fronte ad un mare cosi' complesso, enormemente vasto e soprattutto cosi' poco "collaborativo" (vedi gli esempi che tu citi) , siano una prova inequivocabile della incredibile complessità della struttura necessaria a sostenere la qualità attuale... (penso lo stesso anche di ask, msn, yahoo, ecc eh, non fraintendermi)

Nicola

netdream

Io posso dire di aver perso un punto di pr ma il sito è salito tra i primi nelle serp per molte key.

Quindi non so a questo punto che valore dare al numeretto sulla barra...

nbriani

@netdream said:

...Quindi non so a questo punto che valore dare al numeretto sulla barra...

Le due cose non hanno relazione.. i documenti in serp NON SONO SEMPLICEMENTE ORDINATI PER PAGERANK.

Nicola

must

la cosa bella è che parliamo un po' tutti per ipotesi basate su qualche paper (che non necessariamente ha reale valore) e per empirismo.

secondo me, il pagerank in sè mangia tutti i link. il fatto è che i link danno molto più del pagerank. ed è per questo motivo che dico che non bisogna puntare al pagerank, ma al ranking. se si lavora bene, il pagerank sale lo stesso, ma sicuramente il ranking ha maggiori chance di fare altrettanto, ed anche in tempi più rapidi.

sulle possibili cause del calo del PR, io non ci metto il fatto che google abbia smesso di valutare il pr di directory o altro. il PR secondo me è un dato molto grezzo. le cause le ho scritte qui e preferisco spammare che creare contenuto duplicaton

nbriani

@must said:

le cause le ho scritte qui e preferisco spammare che creare contenuto duplicaton

Ciao Must!

avevo letto il tuo articolo ieri... (ho il tuo blog nel mio reader da sempre )

La cosa pero' effettivamente "strana", "nuova" è che se fosse per cause fisiologiche e naturali (come supposto anche da noi in questo thred) ... perchè prima non era mai successo?

o meglio perchè prima non era mai successo in maniera cosi' diffusa?

Possibile che solo in questi ultimi tre mesi ci sia stato un incremento cosi' incredibile di documenti in rete? ..non credo proprio... o forse era diverso tempo che non veniva ripesato il Pr ai dieci scalini della barretta in toolbar? possibile che sia un evento "discontinuo" e "manuale" ?

Mah.. io avevo dei dubbi, e quindi consideravo plausibile che fosse stato introdotto un qualche cambiamento...

Nicola

p.s vieni su con Cavone al raduno? o devo venire a prenderti io....:():

cineasta

Quando si parla di google come del "massimo", andrebbero fatti dei debiti distinguo.

Ingurgida miliardi di pagine spam che solo grazie alle nostre "lamentele" poi elimina. Non si pone alcuna domanda per stringhe come questa "ag345734573wjdasdjasdkas0rw90er9w00xc0zx9csxc90z9zxcxckjzxc9zx" usata nei domini. Non sa distinguere tra sito normale e sito pornografico. Il safesearch nel mio settore funziona solo grazie alle mie continue e stucchevoli segnalazioni (si poi qualcuno corregge).

Non riconosce il testo nascosto, non riconosce la lingua usata, non distinguendo molte volte tra il cinese e l'italiano (lo giuro e senza scomodare la semantica).

I brevetti ? Secondo me rappresentano nel 90% una lista di buone intenzioni e comunque rappresentano un sicuro ostacolo giurdico posto contro l'innovazione della concorrenza.

La toolbar? Ma avete mai provato a vedere se davvero comunichi con un qualche datacenter? Io l'ho fatto, e dalla mia esperienza l'unica toolbar che davvero pinga è quella di Alexa.

must

@nbriani said:

Ciao Must!

avevo letto il tuo articolo ieri... (ho il tuo blog nel mio reader da sempre )

lo so. lo spam era per il popolo

La cosa pero' effettivamente "strana", "nuova" è che se fosse per cause fisiologiche e naturali (come supposto anche da noi in questo thred) ... perchè prima non era mai successo?

per quel che mi riguarda, è successo anche in passato (anzi, a pensarci bene, solo in passato. a questo giro penso di essere rimasto costante). e cmq capita sempre con i siti che non acquistano nuovi BL.

o meglio perchè prima non era mai successo in maniera cosi' diffusa?

beh, magari è una mia errata opinione, ma se non sono aumentati i documenti, sicuramente lo sono i link.

Possibile che solo in questi ultimi tre mesi ci sia stato un incremento cosi' incredibile di documenti in rete? ..non credo proprio... o forse era diverso tempo che non veniva ripesato il Pr ai dieci scalini della barretta in toolbar? possibile che sia un evento "discontinuo" e "manuale" ?

per quel che mi riguarda, ovvero parlando di quella fettina di web che frequento io, c'è stato sicuramente un aspetto che si è affermato con molta più prepotenza di prima: link a nastro da tutte le parti. ad esempio, a causa di molto più viral. ora un blog parla di una cosa, e a ruota 100 blog fanno altrettanto.

Mah.. io avevo dei dubbi, e quindi consideravo plausibile che fosse stato introdotto un qualche cambiamento...

magari il nofollow su en.wikipedia può aver cambiato qualche equilibrio, ma secondo me non c'è stata nessuna novità lato Google.

Nicola

p.s vieni su con Cavone al raduno? o devo venire a prenderti io....:():

non so manco di che stai parlando

nbriani

@Cineasta said:

Quando si parla di google come del "massimo", andrebbero fatti dei debiti distinguo.

Hai ragione, ma a me piace pensare sempre con la mia testa.. quindi ho provato piu' volte ad immaginarmi nei panni di un ingegnere informatico che deve costruire un Mdr...(ho anche provato a collaborare con chi tentava di farne uno), ho anche immaginato su che cosa avrei strutturato io una tesi di laurea legata ad un metodo di ranking tipo quella ideata da Brin e Page.... (è divertente provaci! )

... evidentemente non sono ne un grande ingegnere, ne una grande mente ... perchè a me il livello generale raggiunto dai MDR di oggi (e non solo google , lo ridico per la terza volta) ela complessità di struttura necessaria a supportare miliardi di documenti e centinaia di milioni di utenti, pare davvero qualcosa di "incredibile"..

Che ti devo dire... sono un ingenuo? ... bè puo' darsi...

Certo anchio saprei trovare problemi e difetti, ingordige e monopoli, ma non era quello il concetto... io pensavo semplicemente allo sviluppo affascinante dell'information retrieval su Internet .. e al livello di complessità TEORICO che ha raggiunto... che ti devo dire? a me piace, affascina...

Se poi mi vuoi mettere in bocca che "google"="il massimo" ...fai pure... ma non l'ho detto...

Nicola

nbriani

@Stuart said:

Tutto ciò però ci porta off topic rispetto al thread in corso, che tratta dell'export del PR del 28/04/07.

Con il permesso di nbriani, paocavo e degli utenti che hanno portato il loro contributo alle speculazioni sul traffico, splitto in nuovo topic in modo che se ne possa discutere meglio.

.Stuart

ooops! hai ragione ... sei tu il Mod qui... sorry ci siamo lasciati trasportare... e io che pensavo pure.. "guarda un po' una volta tanto il thred sull' update del PR che piega interessante ha preso stavolta..."

Nicola

stuart

Nessun problema, Nicola :), sono il primo ad essersi lasciato trasportare ... del resto i discorsi sul traffico sono a dir poco affascinanti e suggestivi.

Magari fossero tutti così gli OT...

@"nbriani" said:

guarda un po' una volta tanto il thred sull' update del PR che piega interessante ha preso stavolta...

Infatti, proprio perchè non voglio che una discussione così interessante si "perda" nelle paranoie sulla barretta verde, ho proposto lo split

Procedo.

.Stuart

stuart

Info: post riguardanti traffico e affini splittati qui:
http://www.giorgiotave.it/forum/posizionamento-nei-motori-di-ricerca/37696-google-traffico-come-parametro-di-rilevanza-per-le-risorse-web.html

.Stuart

netdream

@nbriani said:

Le due cose non hanno relazione.. i documenti in serp NON SONO SEMPLICEMENTE ORDINATI PER PAGERANK.

Nicola

Certo Nicola, hai ragione... Anche io concordo con te e so che i documenti non sono ordinati in base al pr.

Volevo riflettere su un punto però. Se per ranking si intende popolarità ed attinenza di una pagina, questo vuol dire che se in una serp molto affollata io con un sito a pr3 supero tanti siti che hanno anche pr6, vuol dire che la "popolarità" intesa come link ricevuti, ha perso di valore per il posizionamento ??

Io credo che per i link che ho e per la posizione che occupo (ed i link non sono certo quelli delle pagine di scambi link etc.. ma di qualità) il pr sarebbe dovuto salire e non scendere negli ultimi 4-5 mesi...

Quindi se ho preso link spontanei e di qualità , ho superato siti a pr elevato e ricchi anch'essi di contenuti, non mi spiego questo calo di pr.. tutto qui..

paocavo

@nbriani said:

ooops! hai ragione ... sei tu il Mod qui... sorry ci siamo lasciati trasportare... e io che pensavo pure.. "guarda un po' una volta tanto il thred sull' update del PR che piega interessante ha preso stavolta..."

Nicola

Vai pure Stuart, mi hai preceduto perchè ti stavo mandando un pvt proprio per scindere il 3D a partire dal mio post #78 di questo 3D. Ma và bene così.

Pietro Mantovani

@nbriani said:

Le due cose non hanno relazione.. i documenti in serp NON SONO SEMPLICEMENTE ORDINATI PER PAGERANK.

Nicola

Sono abbastanza daccordo. I documenti in SERP non paiono ordinati per PR, questo lo si può constatare, ma che relazione ci sarà a livello di algoritmo di G. fra PR e Pertinenza.. Nessuna? Mi parrebbe davvero strano.

nbriani

@Webtronic said:

ma che relazione ci sarà a livello di algoritmo di G. fra PR e Pertinenza.. Nessuna? Mi parrebbe davvero strano.

Io la vedo cosi': alla fine dei salmi l'algoritmo (se per approssimazione lo consideriamo "uno") di ranking di un MDR è una miscela di molti elementi, alcuni legati "contestualmente" alla query cercata (pertinenza del documento rispetto a cio' che cercava l'utente) altri "assoluti" , legati all'"autorevolezza", al "valore" , all'importanza, (chiamala come vuoi) del documento stesso in senso generale, oggettivo, assoluto appunto in rete... di questo secondo gruppo fa parte il PR.... **quindi NON c'è un legame diretto fra PR e pertinenza.... **

Ti faccio un esempio chiarissimo: Home page di adobe.com PR 10 , nel body della pagina c'è <h1>Solutions and products</h1>

Eppure cercando "Solutions and products" su google di adobe.com non c'è traccia fra i primi risultati...

Questo vuol dire che quel documento con PR 10, pur contenendo la keyword esatta , addirittura dentro tag h1, non è stato giudicato dall'algoritmo pertinente per quella query... è ovvio che i fattori "contestuali" alla keyword cercata hanno avuto di gran lunga la meglio rispetto al boost dato dal PR 10 di quel documento che pure conteneva le keyword...

Cio' dimostra che i fattori "contestuali" sono molti e molto importanti... gli anchor e i "contesti" dei Back link, su tutti, hanno un valore di pertinenza molto piu' elevato del valore apportato da un PR...

Nicola

cineasta

@nbriani: il tuo esempio riguardo l'Adobe è spiegabile (ingenuamente ed io ci provo comunque con un po' di buon senso) in questa maniera:

Ci sono ben 5 tag <h1>:

<h1>Solutions and products</h1>
<h1>Announcements</h1>
<h1>Purchase</h1>
<h1>Designer and developer</h1>
<h1>Customer success</h1>

Credo che non faccia bene a nessun algoritmo di catalogazione un disatro semantico del genere.

Inoltre quella parola chiave è abusata nei commenti. Si dice che google li ignori, ma potrebbe essere anche che in questo caso tolga un po' di punteggio.

Scommetto però che se quella parola chiave campeggiasse nel TITLE, quella pagina schizzerebbe al "number one".