• User Attivo

    web 2.0, risultati 0.2

    Mi ha fatto sorridere e pensare lo sdegno (l'inca..atura?) del mio collega in ufficio.

    "Ma cavolo, cerco i drivers per la mia scheda video.. e sto (omissis) di google mi da roba del 2003?"

    Tanti backlinks naturali,nel tempo= sei un figo.
    Tanti backlinks, veloci = occhio che ti butto fuori.
    Avro tanti backlinks perche sono un figo= ok, per ora stai giu e non dare fastidio.

    Quante volte vi è capitato di trovare pagine con contenuti datati, che spesso vanificano la rilevanza stessa delle informazioni?

    e ancora, possibile che se cerco info su un , che ne so, palmare della HTC... mi escono tonnellate di pagine di ebay con inserzioni scadute?

    Chissa se implementeranno un filtro che, inquadrato l'argomento, alzi il peso del parametro "messa on line", tenendo meno conto del numero di links.. dato che è fisiologico che un documento nuovo ne avra di meno!
    Ad esempio, se cerco appunto un software free sarebbe carino trovare in prima pagina le versioni piu nuove e non quelle piu spammate...perche piu vecchie!

    Che vi risulti, esiste un meccanismo di questo genere?


  • Moderatore

    il filtro c'è e ne parlò l'ingegnere capo che coordina lo sviluppo degli algoritmi di Google....

    anch'io per alcuni topic trovo roba di 4-5 anni e francamente fa un pò sorridere visto l'enfasi con cui Google afferma che le pagine vanno aggiornate....che poi aggiornare un sito ok, ma aggiornare una pagina, mi pare assurdo....se ho trattato un dato argomento, l'ho trattato e basta

    però c'è da dire che i filtri non vengono applicati ovunque allo stesso modo, credo che i topic e le key relative vanno identificati a mano e quindi i risultati migliori li hai per l'inglese e man mano scadono....

    per esempio Google.sk tollera una quantità di cose che google.it non tollera da almeno 2 anni, quindi il raggio di applicazione dei filtri varia di parecchio da un lingua all'altra e da una nazione all'altra....

    motivo per cui Google in Cina non se lo fila nessuno 😄


  • User Attivo

    Il fatto che per certe classi di utenza ci sian certi (in numero e qualita) algoritmi non mi sorprende in un ottica di risparmio di risorse.

    Pero son sollevato dal fatto che effettivamente i parametri non hanno una valenza assoluta (se ho capito bene dal "il filtro c'è" almeno come lo intenderei io).
    Come hai detto tu, un articolo su giulio cesare, che sia stato scritto un anno fa o 10 poco o nulla cambia.
    Ma se cerco "tariffe telefoniche" e mi escon cose scritte 3 anni fa... la cosa diventa inutile almeno quanto un sito spammoso.

    E cmq mi rendo conto della difficolta , oggettiva, di assegnare ad ogni argomento una "data di scadenza".
    Anche se, qualora venisse fatto in questo modo, renderebbe davvero le serp fresche, per argomenti freschi, e autorevoli, per ricerche di argomenti assodati dove l'unica discriminante è la sviscerazione dell'argomento stesso.

    Magari ci si arrivera!


  • User

    @Evi|A|ivE said:

    Il fatto che per certe classi di utenza ci sian certi (in numero e qualita) algoritmi non mi sorprende in un ottica di risparmio di risorse.

    Pero son sollevato dal fatto che effettivamente i parametri non hanno una valenza assoluta (se ho capito bene dal "il filtro c'è" almeno come lo intenderei io).
    Come hai detto tu, un articolo su giulio cesare, che sia stato scritto un anno fa o 10 poco o nulla cambia.
    Ma se cerco "tariffe telefoniche" e mi escon cose scritte 3 anni fa... la cosa diventa inutile almeno quanto un sito spammoso.

    E cmq mi rendo conto della difficolta , oggettiva, di assegnare ad ogni argomento una "data di scadenza".
    Anche se, qualora venisse fatto in questo modo, renderebbe davvero le serp fresche, per argomenti freschi, e autorevoli, per ricerche di argomenti assodati dove l'unica discriminante è la sviscerazione dell'argomento stesso.

    Magari ci si arrivera!

    Basterebbe confrontare la categoria dell'articolo con l'andamento dei backlink. Molti tutti insieme: news volatile, costanti nel tempo: approfondimento. E' cosi' semplice che mi sorprenderei se non l'avessero gia' fatto.


  • Moderatore

    Ciao,
    sul fattore "freshness" (freschezza) delle pagine web ci stanno lavorando...
    Leggete questo articolo (in particolare la 2 pagina) pubblicato sul NYT:

    Google Keeps Tweaking Its Search Engine

    (tradotto in buona parte sul mio blog)

    :ciauz:


  • Super User

    Google -> Ricerca avanzata -> Data: Restituisci solo pagine web visitate -> seleziona 3 mesi|6 mesi|ultimo anno e trovi la pagina recente.


  • User Attivo

    @must said:

    Google -> Ricerca avanzata -> Data: Restituisci solo pagine web visitate -> seleziona 3 mesi|6 mesi|ultimo anno e trovi la pagina recente.

    Il filtro che hai indicato purtroppo non da sempre i risultati decenti. Come abbiamo detto prima, sicome google deve usare lo stesso algoritmo per cercare offerte di lavoro, driver per i computer e biografia di paris hilton, e estremamente difficile, ed infatti infattibile che suo algoritmo potrebbe essere cosi preciso come algoritmo di qualche motore di ricerca verticale che si occupa solamente d'una tematica. Per quello google comincia a creare motori di ricerca verticali tipo google news, o google video. Chissa, magari in futuro preparera qualcosa per la ricerca di software.


  • User Attivo

    il fatto è che la freschezza o meno non credo possa ridursi alla data di rilevamento da parte di google o di messa on line.

    Esistono categorie! Prendiamo un driver, una versione di directX, voci come "vincitore san remo", tutte ricerche cui rilevanza è legata a filo doppio con il parametro "quando".

    a certi argomenit.. cosa si dovrebbe fare? legare un coefficente che va scemando nel tempo?
    diciamo che la relazione (che sia una moltiplicazione o una funzione piu complessa poco importa) tra freschezza dell'argomento*data di emissione darebbe una buona idea della rilevanza reale del documento.

    Se scrivo oggi un documento su un argomento dell'anno scorso, che li si è fermato, ben venga il boost dei links.
    Ma se scrivo ora un articolo sulla classifica del campionato di calcio, dovrebbe avere piu valore rispetto ad una classifica di 5 anni fa, anche se ha 4000 links!

    Troppo forte l'incidenza dei backlinks, cmq.

    Sul fatto dei motori tematici, è quello che auspico/pronostico per il futuro.
    Troppi dati, troppe pagine. non si puo pensare alla costruzione di un sistema di algoritmi che valutino tutto!

    So per certo che a mountain view ci stanno pensando.. son curioso di sapere cosa sforneranno 😄


  • Super User

    il bello è che mentre qui ci si lamenta dei risultati troppo vecchi, altrove c'è chi si lamenta dei risultati troppo nuovi :lol:

    mettiamo che vogliamo sapere chi è Cosimo Mele e andiamo su Google a cercare [url=http://www.google.it/search?source=ig&hl=it&q=cosimo+mele&btnG=Cerca+con+Google&meta=]Cosimo Mele. la prima pagina offre praticamente solo la notizia del recente festino a base di coca e mignotte. e Google nulla offre relativamente al carcere che il suddetto s'è fatto nel '99 😉


  • Moderatore

    no un momento.....

    Google fa gli interessi dei suoi utenti e i suoi ovviamente, questo implica capire quali settori sono ascrivibili al ramo delle news e quali al ramo più prettamente descrittivo e didattico

    nel primo caso è importante che la notizia sia fresca, sarebbe strano leggere: "Ieri un DC-9 Itavia si è inabissato..."

    nel caso dei contenuti a fini divulgativi, invece, vale il loro valore assoluto, in quanto sono contenuti che cambiano in un periodo lunghissimo....la seconda legge della dinamica sempre quella è

    il problema è riuscire a capire tutto questo da banali keyphrase....una keyphrase può appartenere ai due mondi e allora che si fa? ok si opera in maniera fuzzy, stabilendo a quale dei due mondi si avvicina di più.....in questo Google è abbastanza bravo....

    il problema è che tutto ciò va studiato a fondo per ogni lingua....sono rimasto scioccato leggendo un articolo riguardo Google e Baidu e la totale incapacità di Google a scalzare l'avversario....questo perchè Google non è culturalmente vicino ai cinesi ( nonostante si sia accucciato al volere del regime 😄 )

    è chiaro che ci sono cose che algoritmicamente non si possono fare o almeno non sono così banali da fare......bisogna a questo punto usare degli umani, ma gli umani hanno costi decisamente superiori alle macchine e quindi vanno usati solo quando il gioco vale la candela.....

    è ferma politica di Google implementare feature e filtri solo se necessario, per esempio google.sk non applica un mucchio di filtri che qui in Italia o negli USA sono invece quelli che ci fanno venire il mal di testa

    infine esiste un problema insito nello stabilire se premiare o meno la freschezza dei contenuti, un problema che non può essere risolto senza capire di cosa parla un documento


  • Super User

    ottimo post, Paolino 😉