• Moderatore

    Google: verso un motore di ricerca semantico

    Ciao a tutti,
    Sto disegnando una infografica/timeline per riportare i passaggi fondamentali (non necessariamente update dell'algoritmo) della trasformazione, ancora in corso, di big G in un motore di ricerca semantico.
    Lascio da parte volutamente voice search e ricerca per immagini per concentrarmi sulle evoluzioni legate alla ricerca testuale e al natural language processing (NLP).
    A questa timeline potrebbe corrisponderne un'altra dedicata ai brevetti che già Bill Slawsky ha raccolto sotto la categoria "semantic-search" del suo sito https://www.seobythesea.com/category/semantic-search/
    Penso che proporrò la mia top 10 fra i circa 60 articoli presenti, tenendo presente che molti brevetti sono fra loro correlati se non veri e propri update l'uno dell'altro.

    In fondo alla time line riporto i servizi di Google (stavolta non limitati alla SERP) basati sulle entità, il bit o mattoncino nell'ambito della rappresentazione e organizzazione della conoscenza.
    Non sono in ordine cronologico stavolta.

    Gradita segnalazione di eventuali mancanze importanti 😉

    How Google is Remaking Itself as a “Machine Learning First” Company (per citare il titolo di un noto articolo di Wired che chi si è perso dovrebbe recuperare!)
    2011 Google Brain team
    2011 Schema.org: a shared, machine-readable, vocabulary to describe the world
    2012 The Knowledge Graph: a modern incarnation of a Semantic Web pillar
    2013 Hummingbird: first moves towards context understanding
    2013 Word2Vec (Sentence2Vec, Doc2Vec, Seq2Seq - 2014): multidimensional vector space and words operationalization, an important step for NLP
    2015 RankBrain: built upon Vectors not Entities
    2015 TensorFlow: a free and open-source software library for machine learning and artificial intelligence
    2016 Google NLP API (demo discontinued in August 2021)
    2016 Google Translate moving to the new Google Neural Machine Translation (GNMT) algorithm
    2017 Transformers architechture
    2017 Colaboratory: python sharable and collaborative notebook made easy
    2018 Topic Layer: a new topical resource in the Knowledge Graph
    2018 BERT, the revolution: from the NLU model
    2019 to the Search Algorithm update for better context understanding
    BERT’s brothers and sisters (Roberta, Filiberto...)
    2018 Neural Matching
    2020 Feb, T5 a language model 1000 times more powerful than BERT
    2020 Nov, Subtopics ranking
    2021 Passage Ranking (leveraging BERT)
    2021 MUM first announcement
    2021 LaMDA (from Meena, 2020): welcome to the new era of conversational agents

    How Entities appear in SERPs and Services
    Rich Results
    Knowledge Panels
    Image Search labels
    Google Discover
    Google Trends
    Google Play
    Google Market Finder
    Google Assistant


  • Community Manager

    Io credo che la prima grande novità di Google, quella reale, sia MUM

    @gfiorelli1 ne ha parlato al Search Marketing Connect.

    Le caratteristiche che sintetizzo al massimo:

    • è in grado di rimuovere le barriere linguistiche, quindi può cercare e fornire informazioni indipendentemente dalla lingua di partenza. Mentre prima per usufruire delle informazioni in Italiano dal Giapponese si doveva passare dall’Inglese, oggi avviene direttamente;
    • è in grado di essere trasversale sulla ricerca: comprende sia il testo che le immagini e sta per comprendere anche video e audio;
    • capisce se la frase è scritta bene, se dice la stessa cosa di altre frasi ed è in grado di effettuare riassunti in modo così preciso che in alcuni box il testo non è più preso da Wikipedia, ma è direttamente Google a crearlo.

    Link qui MUM, il post ufficiale di Google.

    Per LaMDA, è stato ufficilizzato!


  • User

    Nella cronologia mi manca l’acquisto nel 2010 di Metaweb da parte di Google, il cui CEO John Giannandrea sarebbe poi diventato il capo del Search di Google e al quale si deve la rivoluzione Machine Learning in G.
    Adesso è Senior Vice President dell’area di ML e IA di Apple.