• Community Manager

    [Disambiguazione] Google e il significato delle parole

    La settimana scorsa su Research.googleblog.com hanno pubblicato un articolo dal titolo A Large Corpus for Supervised Word-Sense Disambiguation.

    Uno dei problemi maggiori del Machine Learning applicato alla comprensione di un linguaggio è la disambiguazione.

    Negli ultimi anni i ricercatori di Google si sono aperti e impegnati molto nel condividere le loro informazioni per cercare di far progredire il settore e si è creata una bella comunità aperta.

    Molti materiali sono disponibili.

    Nell'articolo i ricercatori di Google annunciato un set di dati molto interessante che dovrebbe aiutare la ricerca proprio per la disambiguazione: aggettivi, pronomi, avverbi, verbi, typo e via dicendo.

    Si spera, insomma, che con l'avanzare degli algoritmi si possa migliorare questi aspetti ora complessi:

    "Kanye West is a star? implies that he is a celebrity, but ?Sirius is a star? implies that it is an astronomical object.

    Disambiguating words in queries, so that results for ?date palm? and ?date night? or ?web spam? and ?spam recipe? can have distinct interpretations for different senses

    Dal mio punto di vista queste informazioni saranno molto importanti per la comprensione della ricerca e quindi del tipo di risposta che Google farà.

    Per noi, per come la vedo io, quando si arriverà ad una comprensione del linguaggio avanzata, ci sarà semplicemente una maggiore precisione nel presentare le nostre pagine nei risultati di ricerca.

    So che in molti sperano in un'esplosione di posizionamenti perché i testi sono scritti bene, ma no, non avverrà. Una maggiore precisione significa un migliore match tra la pagina, la query e l'utente.

    Meglio no?

    Saremo presenti a chi ci cerca davvero. Ma siamo ancora lontani da quel giorno.