• User Attivo

    @pieru said:

    Almeno questi numeri sulle ricerche USA

    Ma sugli utenti Google continua a mantenere tuttora un discreto vantaggio, raccogliendo il 36,9 per cento delle ricerche online eseguite negli Stati Uniti, contro il 30,4 del contendente nel mese di giugno.
    hanno un senso?

    Se qualcuno ricorda prima della modifica l'articolo diceva esattamente il contrario (yahoo 36,0 per cento contro il 30,4 di Google). Via email ho chiesto chi fosse l'istituto di statistica ad aver emesso questi dati, vediamo se rispondono...

    Per curiosità vi quoto l'email (abbreviata un po') che ho mandato un'ora prima della modifica dell'articolo:

    Gentile redazione di Repubblica,

    mi chiamo XXXX e sono un autore che vive a Genova, vostro assiduo lettore da numerosi anni. Vi scrivo per avere alcuni chiarimenti in relazione ad alcuni articoli tecnici sui Motori di Ricerca apparsi sul vostro sito internet www.repubblica.it [...].
    La mia esperienza in materia è pluriennale, ho scritto sull'argomento articoli per riviste nazionali quali XXX e XXX, per numerosi forum e pubblicazioni on line (XXX, XXX...), [...]

    Per non essere troppo prolisso citerò i punti sui quali ho maturato qualche dubbio seguiti da un commento, anticipandovi la mia totale non volontà di usare polemica; [...]

    *> Titolo articolo: Yahoo-Google, sfida sul motore "Vi abbiamo superato". "E' falso" (link)

    Estratto: La caccia è partita da quando Google, all'inizio dell'anno, ha introdotto il suo motore di ricerca autonomo. Nei tre anni e mezzo precedenti aveva usato - su licenza - lo stesso motore Yahoo, che tuttora appare nella main page Google, in alternativa al suo proprio motore. Quest'ultima, mantiene tuttora un discreto vantaggio, raccogliendo il 36,9 per cento delle ricerche online eseguite negli Stati Uniti, contro il 30,4 del contendente nel mese di giugno.*

    Rimango piuttosto stupito da quanto affermato in questo articolo: Google è motore di ricerca da quasi dieci anni, nato con una tecnologia proprietaria [...] progettata inizialmente presso la Stanford University dai due ex studenti ora multimilionari Sergey Brin e Larry Page (quest'ultimo ideatore anche del celebre Page Rank, l'algoritmo in uso da Google che dona un punteggio a ogni pagina sul web in base al numero di link che essa riceve dagli altri siti). Il fatto che il motore Yahoo appaia sulla home page di Google non è vero ed è un fatto facilmente controllabile. I dati citati percentualmente non risultano realistici se confrontati con quelli presenti in numerosi siti di istituti di statistica internazionali, è possibile conoscere cortesemente il nomitavo dell'istituto che ha promulgato tale dati?

    *> Titolo articolo: Google, Yahoo! e Msn è sfida all'ultimo video di ALESSANDRO LONGO

    Estratto: Come fanno allora Msn, Yahoo e Google a trovare il video che l'utente sta cercando? Sfruttano i sottotitoli, che le emittenti americane inseriscono in molti dei programmi trasmessi. Sulla televisione sono invisibili; [...] Dopo che l'utente ha inserito le parole chiavi, quindi, il motore le cerca all'interno dei titoletti e dei sottotitoli dei video che ha raccolto nel proprio database. Così è possibile individuare un video inserendo nella barra di ricerca parole che sono pronunciate durante il programma in questione.*

    In realtà gli algoritmi dei Motori Video utilizzano spesso una tecnologia differente per il reperimento dei filmati. Innanzi tutto analizzano il nome del file, poi cercano il testo presente nelle specifiche del file, in seguito controllano il testo presente nella pagina che presenta il link a tale video, al quale danno buona importanza. Secondo la teoria proposta tutti quei video che non possiedono sottotitoli non sarebbero reperibili dai motori di ricerca, cosa evidentemente non vera.

    *> Titolo articolo: Motori di ricerca super intelligenti quasi pronti "a fare opinione" di CLAUDIO ZAMBONI

    Estratto: l'IBM comincerà a vendere applicazioni di [...] una tecnologia [...] in grado di leggere e capire il testo del Web, usando un liguaggio naturale per operare delle correlazioni tra le parole. In poche parole, un motore di ricerca incredibilmente utile.*

    Su questo argomento ho redatto un articolo di una decina di pagine per la rivista XXX. Non è corretto affermare che la tecnologia di IBM utilizzi un linguaggio naturale per operare delle correlazioni tra le parole. Utilizza un thesaurus, una sorta di grande enciclopedia che contiene migliaia di termini e i sinonimi ad essi legati, plurali o singolari che siano. Una volta effettuata una ricerca in un motore, la tecnologia IBM, sfruttando alcune regole logico-grammaticali di base presenti in ogni lingua al mondo, presenterà i documenti che più risultano attinenti semanticamente (in quanto a significato) alle parole cercate. Superando il più grande limite dei motori di ricerca attuali: l'incapacità di interpretare il senso delle parole cercate e di distinguere tra singolari, plurali, forme flesse dei verbi, ecc. In pratica con la tecnologia fornita da IBM (ma anche in fase di studio da innumerevoli concorrenti, tra i quali l'onnipresente Google) le parole "meteo", "previsioni del tempo" e "previsioni meteorologiche", saranno interpretate come parole che esprimono pressappoco lo stesso concetto, e le ricerche effettutate con tali parole presenteranno più o meno i medesimi documenti: cosa impossibile per i motori attuali che analizzano solo le parole e non i significati ad esse legati.

    [...]

    un grazie sentito per l'attenzione, cordiali saluti,

    ciauz,
    Lucas 😉

    ps: so bene che i commenti non sono nè strettamente tecnici nè precisi, ma non era quello lo scopo dell'email... 🙂


  • User Attivo

    Dall'inizio dell'email sembra che più che suggerire correzioni suggerisci una tua candidatura a scrivere per loro, è lampante l'uscita allo scoperto del tuo super-ego, con questo non voglio assolutamente sminuire quello che hai scritto, è semplicemente uno studio della tua email. 😄


  • Super User

    @pieru said:

    Almeno questi numeri sulle ricerche USA

    Ma sugli utenti Google continua a mantenere tuttora un discreto vantaggio, raccogliendo il 36,9 per cento delle ricerche online eseguite negli Stati Uniti, contro il 30,4 del contendente nel mese di giugno.

    hanno un senso?Per quello che vale un istituto di statistica "abbastanza" serio riporta dati diversi, aggiornati a Maggio 2005.

    http://searchenginewatch.com/reports/article.php/2156451

    Dubito che, vista la professionalità di chi ha redatto l'articolo, i dati riportati siano più recenti o più esatti di questi...


  • Super User

    Estratto: Come fanno allora Msn, Yahoo e Google a trovare il video che l'utente sta cercando? Sfruttano i sottotitoli, che le emittenti americane inseriscono in molti dei programmi trasmessi. Sulla televisione sono invisibili; [...]

    Qui non hanno del tutto torto. Le meta-informazioni relative al documento video sono estrapolate dai contenuti elencati da te, Lucas, ma è vero anche che sfruttano i sottotitoli, se presenti.

    L'errore sta nell'aver scritto "Sfruttano i sottotitoli" invece di "Sfruttano anche i sottotitoli" e nel non aver elencato le altre meta-informazioni.

    Se non avessero ristretto la cerchia a MSN, Yahoo! e Google, allora avrebbero dovuto fare riferimento anche ad alcune tecniche usate da altri motori, in grado di analizzare l'audio e trascrivere automaticamente le parole pronunciate.

    Dall'inizio dell'email sembra che più che suggerire correzioni suggerisci una tua candidatura a scrivere per loro

    All'inizio ero tentato anche io di fare una cosa simile, ma alla fine ho trovato molto più gusto a scrivergli una e-mail canzonatoria. Probabilmente non avranno apprezzato il sarcasmo.


  • User Attivo

    @GrazieMamma said:

    Dall'inizio dell'email sembra che più che suggerire correzioni suggerisci una tua candidatura a scrivere per loro, è lampante l'uscita allo scoperto del tuo super-ego, con questo non voglio assolutamente sminuire quello che hai scritto, è semplicemente uno studio della tua email. 😄

    Carissimo GrazieMamma potresti fare lo psicologo: mi hai beccato (le parti tagliate sono parte del curriculum e propongono una collaborazione)... Sto morendo dal ridere :sbonk:

    Qui non hanno del tutto torto. Le meta-informazioni relative al documento video sono estrapolate dai contenuti elencati da te, Lucas, ma è vero anche che sfruttano i sottotitoli, se presenti.

    Verissimo low... infatto ho scritto "In realtà gli algoritmi dei Motori Video utilizzano spesso"... visto che credo che i video sottotitolati siano una piccola parte del tutto...

    ciauz,
    Lucas 🙂


  • Community Manager

    L'importante è che ora abbiano eliminato il tutto.

    Prossimo passo: assumere qualcuno 😄

    Confermo quanto scrive Beke e capisco cosa ha scritto Lucas (Che in materia è molto preparato)


  • Super User

    Carissimo GrazieMamma potresti fare lo psicologo
    Lui e' uno psicologo 😄


  • Bannato Super User

    Be ragazzi, non finisce mica qui....

    Adesso scatta l'indotto dei giornali di provincia, che raccolgono il giorno dopo, notizie varie stampate dai loro fratelli maggiori nei giorni precedenti, per aggiornare la loro pagina di attualità dal mondo.

    Oggi sulla prealpina ( quotidiano locale di Varese Verbania Novara ) ho trovato la brutta copia di quello citato da Low.

    🙂


  • Super User

    @Lucas said:

    Verissimo low... infatto ho scritto "In realtà gli algoritmi dei Motori Video utilizzano spesso"... visto che credo che i video sottotitolati siano una piccola parte del tutto...

    Dipende molto dall'indice. Google Video, ad esempio, ha iniziato le proprie attività indicizzando le trasmissioni dalle emittenti televisive americane, dove i "closed caption" (i testi invisibili codificati nel segnale video) sono uno standard. Sono pertanto portato a pensare che la percentuale di video con i closed caption presente nell'indice di Google Video sia maggiore del 50%.


  • User Attivo

    @LowLevel said:

    nell'indice di Google Video sia maggiore del 50%.

    su google la penso anche io così... ma è attivo da troppo poco tempo per parlarne nell'articolo (che è di un anno fa, se non ricordo male)... su yahoo ad esempio creado che le percentuali siano sensibilmente diverse proprio in considerazione del fatto che prende i video un po' ovunque dal web.

    ciauz,
    Lucas


  • Community Manager

    Fabio ha ragione.... 🙂

    Mi hanno risposto, ma non vi posso dire cosa mi hanno detto. Però conferma che non è un esperto chi scrive.

    Ho risposto fornendo tutte le informazioni possibili in inglese per metterli al corrente dell'attuale situazione e di quella di anni fa 🙂

    Giorgio


  • Super User

    Si, hanno risposto pure a me.

    Confermano l'impressione di Giorgio, tuttavia nella risposta si accenna alla giornata ferragostana ed a redazioni semideserte e decimate, e ... "uno deve saltabeccare tra una notizia di tecnologia, lo shuttle che non si sa come atterra e fiona may che finisce la carriera" ... e quindi un po' di comprensione sembra dovuta in questo caso. 😄

    Ho fornito pure io un po di dati, ora vediamo se aggiorna in modo adeguato.


  • Super User

    Il senso della risposta inviata a me è simile a quella di Andre@.

    Continuo a sostenere che se si fosse trattato di calcio, persino fiona may e il resoconto della sagra della mortazza non sarebbero comunque riusciti a fargli scrivere che il Milan è approdato in serie A solo nel 2005.


  • Super User

    @beke said:

    @pieru said:
    Almeno questi numeri sulle ricerche USA

    Ma sugli utenti Google continua a mantenere tuttora un discreto vantaggio, raccogliendo il 36,9 per cento delle ricerche online eseguite negli Stati Uniti, contro il 30,4 del contendente nel mese di giugno.

    hanno un senso?Per quello che vale un istituto di statistica "abbastanza" serio riporta dati diversi, aggiornati a Maggio 2005.

    http://searchenginewatch.com/reports/article.php/2156451

    Dubito che, vista la professionalità di chi ha redatto l'articolo, i dati riportati siano più recenti o più esatti di questi...

    Grazie Beke. In effetti mi sembra "un filino" più attendebile questa fonte


  • Super User

    ... Gli ultimi dati Nielsen, pubblicati da Search Engine Watch e relativi a maggio, indicano invece un 48 per cento per Google contro il 21,4 di Yahoo.
    Hanno [url=http://www.repubblica.it/2005/h/sezioni/scienza_e_tecnologia/searchengine/searchengine/searchengine.html]editato, riportando anche i dati citati da Beke 😄

    Ed hanno pure inviato un cordiale commento:

    Gentile Andre@,
    ho fatto un ulteriore upgrade, citando la fonte utilizzata dal San francisco chronicle, ma riportando anche i dati nielsen
    Purtroppo e' una di quelle cose che io ho segnalato perche' - pur da non competente, trovavo comunque 'carina' (nei giornali si cerca 'un titolo', e comunque yahoo che dichiara di aver superato google, vero o falso, e' una notizia per chiunque abbia un'infarinatura - come posso essere io - del web). In condizioni normali, in un giornale, uno segnala una notizia, il caporedattore dice 'si' o 'no' e se si' cerca la persona adatta. Purtroppo siamo a ferragosto... e la cosa mi e' rimbalzata tra altre due cose - stavo seguendo lo shuttle e fiona may... - Da li' il refuso e la cattiva traduzione di una frase del 'chronicle' che parlava di 'licensed...' ( www.sfgate.com ) e tutto il resto e comunque citava quel 36 contro 30 per cento... di cui ho appena trascritto la provenienza sull'articolo (comScore network). Insomma, tutti quelli che fanno il mio mestiere (o quasi tutti) sanno come si fa ad evitare le toppate, anche su argomenti che non si conoscono - io scrivo di medicina che mi e' anche meno nota del web, e normalmente non faccio casini... - ma poi ogni tanto capita

    Spero di aver minimamente rimediato alla toppata
    cordiali saluti /il redattore di Repubblica/

    Tutto sommato delle persone serie. 😄


  • User Attivo

    in effetti sembrano davvero persone serie... oneste... manca solo la risposta a me 🙂

    Lucas 😉


  • Community Manager

    Si si sono persone serie, anche io ho mostrato il link di Beke in risposta a loro.


  • User Attivo

    @Lucas said:

    in effetti sembrano davvero persone serie... oneste... manca solo la risposta a me 🙂

    Lucas 😉

    Tranquillo probabilmente il direttore di Repubblica è a Porto Cervo, vedrai che gli hanno messo un appunto sulla scrivania con scritto importantissimo rispondere.

    Sono certamente persone serie ed avranno capito che sei su un altro livello e meriti una risposta dai vertici.

    Mi raccomando se ti propongono un contratto facci sapere! :lol:


  • Super User

    si esatto, facci sapere, che ti diciamo esattamente che link mettere sul footer di www.repubblica.it :lol: :lol:


  • User Attivo

    :lol: me state a pigghià per u cule?

    Lucas :fumato: