• Community Manager

    "Come funzionano gli algoritmi della Ricerca". Google secondo Connect.gt

    Come largamente spiegato qui c'è un disastro in lingua italiana per l'iniziativa How Search Works.

    La Community SEO Italiana, ma anche tutte le persone e aziende che cercano informazioni su Google, si ritrovano, dopo 1 anno e 3 mesi dall'update, ad avere in mano INFORMAZIONI FUORVIANTI.

    L'idea è quindi di farne una versione nostra. Che possa poi in futuro avere dei link di approfondimento magari. Vi chiedo una mano per farla insieme.

    Sopra trovate il link della versione Inglese USA. Fate attenzione perché anche in altre versioni ci sono degli errori. In quella en_uk manca una parte e anche in quella es_es.

    Io faccio riferimento alla en_us che mi è sempre sembrata quella ufficiale.
    Quella dalla quale partono le altre.

    Di seguito quindi vi proponiamo una Riscrittura in Italiano della parte più importante, ovvero quella della Voce Algoritmi di Ricerca. Si trova qui https://www.google.com/search/howsearchworks/algorithms/

    ECCO LO SCREEN

    Schermata 2020-07-13 alle 16.10.10.png

    C'è una parte introduttiva (How Search algorithms work) e poi 5 voci sotto che sono

    • Meaning of your query
    • Relevance of webpages
    • Quality of Content
    • Usability of webpages
    • Context and settings

    L'introduzione va quasi bene quella in italiano per quanto mi riguarda e cambio giusto due cose, il resto ne soffre parecchio, specialmente la voce 2 e 3.

    Vi faccio la mia proposta, metto le note e aggiungeremo link. Criticate al massimo il lavoro in modo da migliorarlo 🙂

    Come funzionano gli algoritmi della Ricerca

    Con la quantità di informazioni disponibili sul Web, trovare ciò di cui hai bisogno sarebbe quasi impossibile senza un aiuto nel selezionarle. I sistemi di ranking di Google sono progettati proprio per fare questo: ordinare centinaia di miliardi di pagine web dal nostro indice di Ricerca per fornire i risultati più pertinenti e utili in una frazione di secondo e li presentano in modo da aiutarti a trovare quello che stavi cercando.

    Questi sistemi di ranking sono costituiti non da uno, ma da un'intera serie di algoritmi. Per fornirti le informazioni più utili, gli algoritmi della Ricerca prendono in esame diversi fattori, tra cui le parole che hai usato nella query, la pertinenza (1) e l'usabilità delle pagine, l'affidabilità delle fonti, la tua posizione e le tue impostazioni. L'importanza attribuita a ogni fattore cambia in base al tipo di query; ad esempio, la data di pubblicazione dei contenuti ha un ruolo più incisivo nel rispondere a query relative ad argomenti di attualità rispetto a query riguardo a definizioni del dizionario.

    Per assicurarci che gli algoritmi della Ricerca soddisfino elevanti standard di rilevanza (2) e qualità, disponiamo di una procedura rigorosa che include sia test in tempo reale che migliaia di Search Quality Raters (3) provenienti da ogni parte del mondo. Tali Quality Raters seguono delle precise linee guida che definiscono i nostri obiettivi per gli algoritmi della Ricerca e sono disponibili al pubblico affinché tutti possano consultarle.

    Di seguito trovi ulteriori informazioni sui fattori principali che determinano quali risultati vengono restituiti per la tua query.

    Note:
    1 e 2. La parola Relevance può significare sia Pertinenza che Rilevanza. Nel primo caso mi appare corretto usare Pertinenza come anche nelle linee guida in Italiano di Google. Nel secondo, credo che il significato sia più ampio in quanto si riferisce ai test in tempo reale che sono una questione di Rilevanza negli algoritmi, non di pertinenza. Potrei sbagliarmi ovviamente. Su questa si veda qui.
    3. I Quality Rater sono persone che hanno un contratto a tempo determinato, non sono dei veri e propri impiegati di Google.

    Significato della tua ricerca

    Per restituire risultati pertinenti per la tua query, dobbiamo prima stabilire quali informazioni stai cercando ー l'intento che si trova dietro la tua query. Comprendere l'intento è fondamentalmente sulla comprensione del linguaggio ed è un aspetto critico della Ricerca. Costruiamo modelli linguistici per cercare di decifrare quali stringhe di parole dovremmo cercare nell'indice.

    Ciò implica dei passaggi apparentemente semplici come l'interpretazione degli errori di ortografia e si estende al tentativo di comprensione del tipo di query che hai inserito applicando alcune delle ultime ricerche nell'ambito della comprensione del linguaggio naturale. Ad esempio, il nostro sistema di sinonimi aiuta la Ricerca a capire cosa intendi stabilendo se una parola ha più definizioni. Questa funzionalità consente alla Ricerca di far corrispondere la query "Come cambiare una lampadina" alle pagine che descrivono come sostituire una lampadina. Per sviluppare tale sistema ci sono voluti più di cinque anni e siamo riusciti a migliorare in modo significativo i risultati in oltre il 30% delle ricerche in tutte le lingue.

    unnamed.png

    Al di là dei sinonimi, gli algoritmi di Ricerca cercano inoltre di capire quale categoria di informazioni stai cercando. È una ricerca molto specifica o una query generica? Ci sono parole come "recensione" o "immagini" o "orari di apertura" che indicano il bisogno di un'informazione specifica dietro la ricerca? La query è scritta in francese, suggerendo che desideri risposte in quella lingua? Oppure stai cercando un'attività nelle vicinanze e vorresti informazioni sulla zona?

    Una dimensione particolarmente importante di questa categorizzazione delle query è la nostra analisi per stabilire se la tua query è alla ricerca di contenuti aggiornati. Se cerchi parole chiave di tendenza, i nostri algoritmi legati alla freschezza lo interpreteranno come un segnale che informazioni aggiornate potrebbero essere più utili di pagine con informazioni vecchie. Ciò significa che quando cercherai gli ultimi "Risultati Serie A", "X Factor" o "Ricavi Juventus", vedrai le informazioni più aggiornate

    Pertinenza delle Pagine

    In seguito, gli algoritmi analizzano il contenuto delle pagine per valutare se la pagina contiene informazioni che potrebbero essere pertinenti con ciò che stai cercando.

    Il segnale più semplice che indica che le informazioni sono rilevanti è quando una pagina contiene le stesse parole chiave della tua query di ricerca. Se le parole chiave sono presenti nella pagina, nelle intestazioni o nel corpo del testo, è più probabile che le informazioni siano pertinenti. Oltre alla semplice corrispondenza delle parole chiave, utilizziamo dati aggregati e anonimi sulle interazioni sulle interazioni per valutare quali risultati di ricerca sono pertinenti rispetto alle query. Trasformiamo quei dati in segnali che aiutano i nostri sistemi di machine learning a valutare meglio la pertinenza.

    unnamed1.png

    Questi segnali di pertinenza aiutano gli algoritmi di Ricerca a valutare se una pagina contiene una risposta alla tua query, piuttosto che ripetere semplicemente la stessa domanda. Pensa: quando cerchi "cani", probabilmente non vuoi una pagina dove la parola "cani" è ripetuta centinaia di volte. Tenendo a mente ciò, gli algoritmi valutano se una pagina contiene altri contenuti pertinenti oltre alla parola chiave "cani" - come immagini di cani, video o persino un elenco di razze.

    È importante notare che, mentre i nostri sistemi cercano questo tipo di segnali quantificabili per valutare la pertinenza, non sono progettati per analizzare concetti soggettivi come opinioni o l'orientamento politico dei contenuti di una pagina.

    Qualità del Contenuto

    Oltre ad abbinare le parole della tua query con i documenti pertinenti sul Web, gli algoritmi di Ricerca mirano anche a dare la priorità alle fonti più affidabili disponibili. Per fare ciò, i nostri sistemi sono progettati per identificare segnali che possono aiutare a determinare quali pagine dimostrano competenza, autorevolezza e affidabilità su un determinato argomento (4).

    Cerchiamo siti che molti utenti sembrano apprezzare per query simili. Ad esempio, se altri siti di rilievo linkano una pagina (ciò che è noto come PageRank) (5), questo è un buon segnale che dimostra che l'informazione è affidabile. Il feedback aggregato del nostro processo di valutazione della qualità della ricerca viene utilizzato per perfezionare ulteriormente il modo in cui i nostri sistemi discernono la qualità delle informazioni.

    unnameda.png

    Gli algoritmi di spam svolgono un ruolo importante nel determinare se una pagina è di bassa qualità e aiutare la Ricerca a garantire che i siti non salgano nei risultati di ricerca attraverso comportamenti ingannevoli o manipolativi. Le linee guida per i webmaster di Google indicano le tecniche che caratterizzano tali siti di spam di bassa qualità, incluso l'acquisto di link che passano PageRank o l'inserimento di testo invisibile sulla pagina.

    I contenuti sul web e l'ecosistema informativo sono in costante evoluzione, misuriamo e valutiamo continuamente la qualità dei nostri sistemi per garantire il giusto equilibrio tra pertinenza delle informazioni e autorevolezza, e fare in modo che la fiducia che riponi nei risultati di ricerca rimanga invariata.

    Note
    4. Scusate, è l'E-A-T. Google dichiara di usarlo.
    5. A questo punto, visto che nella frase vedo sia il TrustRank (affidabile) che il Topical Trustrank (siti di rilievo), ho fatto questa ipotesi di aggregazione sotto il Pagerank.

    Usabilità delle Pagine

    In LAVORAZIONE, qui il testo in inglese (la versione Italiana non fa riferimento a questo)
    When ranking results, Google Search also evaluates whether webpages are easy to use. When we identify persistent user pain points, we develop algorithms to promote more usable pages over less usable ones, all other things being equal.

    These algorithms analyze signals that indicate whether all our users are able to view the result, like whether the site appears correctly in different browsers; whether it is designed for all device types and sizes, including desktops, tablets, and smartphones; and whether the page loading times work well for users with slow Internet connections.

    Since website owners can improve the usability of their site, we work hard to inform site owners in advance of significant, actionable changes to our Search algorithms. For example, in January 2018 we announced that our algorithms would begin to consider the “page speed” of sites, six months before the changes went live. To aid website owners, we provided detailed guidance and tools like PageSpeed Insights and Webpagetest.org so site owners could see what (if anything) they needed to adjust to make their sites more mobile friendly.

    You can find more information on the tools and tips Google provides to site owners here .

    unnamedaa.png

    Contesto e Impostazioni

    IN LAVORAZIONE

    Information such as your location, past Search history and Search settings all help us to tailor your results to what is most useful and relevant for you in that moment.

    We use your country and location to deliver content relevant for your area. For instance, if you’re in Chicago and you search “football”, Google will most likely show you results about American football and the Chicago Bears first. Whereas if you search “football” in London, Google will rank results about soccer and the Premier League higher. Search settings are also an important indicator of which results you’re likely to find useful, such as if you set a preferred language or opted in to SafeSearch (a tool that helps filter out explicit results).

    unnamedaaaa.png

    In some instances, we may also personalize your results using information about your recent Search activity. For instance, if you search for “Barcelona” and recently searched for “Barcelona vs Arsenal”, that could be an important clue that you want information about the football club, not the city.

    Search also includes some features that personalize results based on the activity in your Google account. For example, if you search for “events near me” Google may tailor some recommendations to event categories we think you may be interested in. These systems are designed to match your interests, but they are not designed to infer sensitive characteristics like your race, religion, or political party.

    You can control what Search activity is used to improve your Search experience, including adjusting what data is saved to your Google account, at myaccount.google.com. To disable Search personalization based on activity in your account, turn off Web & App Activity.