• User

    @kal proprio nel caso di quella newsletter (sono andato a vedere, la numero 3), avevo letto il contenuto sul browser per puro caso. Il giorno successivo l'ho trovata in discover.
    Non mi è più capitato di leggerle sul browser ne di trovarle in discover.

    Secondo me il volume dei dati clickstream su un URL ha il suo valore se correlato ad un trend in corso.

    Tutta la spazzatura che trovo costantemente su discover con titoli clickbait ad esempio, quali query possono anticipare?
    Hanno la quasi totalità del traffico proveniente dai social e gli articoli sono inesistenti. Se non per la mole di traffico che ricevono per un argomento in trend (calciatore, gossip, e simili) quali altre caratteristiche li spingono in discover?

    Ora non dico sia determinante, ma non riesco ad escluderlo totalmente.
    Poi, se entriamo in discover, con o senza volume, festeggio volentieri 🍻


    kal 1 Risposta
  • Contributor

    @brum ha detto in Il Test su Discover di Connect.gt:

    Tutta la spazzatura che trovo costantemente su discover con titoli clickbait ad esempio, quali query possono anticipare?

    Questa è un'ottima domanda. Provo a fare qualche ragionamento.

    Sicuramente su Discover non c'è SOLO contenuto correlato a trend in corso. Ci sono anche articoli "nuovi" ma correlati al segmento di interesse delle varie coorti in cui ti ritrovi.

    Io ad esempio ho un flusso costante di notizie astronomiche, che è una delle mie passioni. Oppure ad esempio i videogiochi in generale.

    Quindi sicuramente c'è una meccanica per i contenuti di "ricerca latente" (chiamiamola così, è quella che mi è appena capitata con la storia dell'aggiornamento di Windows) e una per i contenuti legati al semplice interesse.

    In entrambi i casi abbiamo comunque:

    1. contenuto fresco
    2. correlato ad un interesse (costante o emergente) di un pubblico sufficientemente ampio

    EDIT: parlando di coorti di utenti, ho appena avuto un'illuminazione...

    FLoC

    https://github.com/WICG/floc

    È la proposta di Google per sostituire i cookie di terze parti per il targeting della pubblicità. Ma ha moltissime cose in comune con i discorsi che abbiamo fatto fin qua... e non credo per caso. Su Discover dopotutto ci sono gli annunci pubblicitari...

    Questa frasetta è secondo me importante:

    The browser uses machine learning algorithms to develop a cohort based on the sites that an individual visits. The algorithms might be based on the URLs of the visited sites, on the content of those pages, or other factors.

    In altre parole: FLoC fa sì che sia il browser ad utilizzare i dati clickstream per generare delle coorti tramite machine learning.

    Cioè ESATTAMENTE quello che abbiamo notato che fa Google.


    brum 1 Risposta
  • User

    @kal ha detto in Il Test su Discover di Connect.gt:

    https://github.com/WICG/floc

    È la proposta di Google per sostituire i cookie di terze parti per il targeting della pubblicità. Ma ha moltissime cose in comune con i discorsi che abbiamo fatto fin qua... e non credo per caso. Su Discover dopotutto ci sono gli annunci pubblicitari...

    Questo documento è interessantissimo. Ora, noi come infiliamo il nostro contenuto in queste righe?

    if cohorts can be used for tracking, then having more interest cohort samples for a user will make it easier to reidentify them on other sites that have observed the same sequence of cohorts for a user.

    Sostanzialmente descrive la tua esperienza con il "windows update".
    Ma dice anche che oltre a questo:

    1. contenuto fresco
    2. correlato ad un interesse (costante o emergente) di un pubblico sufficientemente ampio

    il nostro contenuto dovrà essere identificabile, tra gli altri contenuti che appartengono alla stessa sequenza di coorti.

    Nel caso del windows update, la selezione era semplice, perché l'articolo di computer world è l'unico fresco in relazione al trend e rispecchia le altre linee di cui abbiamo parlato.

    Curati gli aspetti di cui sopra, se trovassimo bassa concorrenza sul contenuto fresco potrebbe essere un grosso aiuto per il nostro test. 😓

    Cosa dici, possiamo iniziare ad organizzare idee per il contenuto?


    kal 1 Risposta
  • Contributor

    @brum ha detto in Il Test su Discover di Connect.gt:

    Cosa dici, possiamo iniziare ad organizzare idee per il contenuto?

    Sotto con le idee!

    Anzi, sicuramente ne parliamo in live questo pomeriggio assieme a Giorgio, Alessio e Matteo.


  • User

    @alex-mi cerca Internet Crazy Researchers e lo trovi subito --> https://pasteboard.co/JU6DKBd.png

    Come non detto ho visto ora che hai già trovato


  • User

    @alex-mi il gruppo è aperto e posso invitare membri per cui se mi vuoi dare il tuo nick provo ad aggiungerti


  • User

    @alex-mi ha detto in Il Test su Discover di Connect.gt:

    @alexmob

    vedo che usi APPLE.
    Chissà magari c'è qualche limitazione.
    Comunque ora ho provato ad invitarti e, purtroppo, non ho quel diritto (https://pasteboard.co/JU726Gj.png) 😞
    MEA CULPA credevo di poterlo fare


  • Contributor

    @alex-mi ha detto in Il Test su Discover di Connect.gt:

    Quello che mi infastidisce non poco è notare che su Discover si trovano troppo spesso i classici titoli acchiappa clic.

    Questa osservazione l'abbiamo fatta anche nella Live con Giorgio e bisogna mettersela via: Discover È UN SOCIAL. Le dinamiche di comunicazione predominanti sono assolutamente quelle del clickbait.


    barretta luqweb 2 Risposte
  • User

    @kal tu puoi aggiungere alex al gruppo telegram?


    kal 1 Risposta
  • Contributor

    @barretta ha detto in Il Test su Discover di Connect.gt:

    @kal tu puoi aggiungere alex al gruppo telegram?

    No, dobbiamo chiedere a @giorgiotave


  • User Attivo

    @kal ha detto in Il Test su Discover di Connect.gt:

    @alex-mi ha detto in Il Test su Discover di Connect.gt:

    Quello che mi infastidisce non poco è notare che su Discover si trovano troppo spesso i classici titoli acchiappa clic.

    Questa osservazione l'abbiamo fatta anche nella Live con Giorgio e bisogna mettersela via: Discover È UN SOCIAL. Le dinamiche di comunicazione predominanti sono assolutamente quelle del clickbait.

    Non so esattamente cosa sia per te clickbait (o meglio quale sia la tua sensibilità sul tema), però direi che nel mio Discover solo il 20% degli articoli proposti è clickbait.

    Gestendo però i miei interessi può essere che lo influenzo fin troppo.


    kal 1 Risposta
  • Contributor

    @luqweb ha detto in Il Test su Discover di Connect.gt:

    Non so esattamente cosa sia per te clickbait (o meglio quale sia la tua sensibilità sul tema), però direi che nel mio Discover solo il 20% degli articoli proposti è clickbait.

    Io lo intendo in senso esteso, ovvero: ottimizzare il copy delle anteprime per stimolare al massimo il clic dell'utente. Questo può essere fatto in modo onesto od in modo disonesto da parte del produttore del contenuto.

    Ne abbiamo parlato anche in live, c'è sicuramente un algoritmo INTERNO a Discover che usa il CTR (o un più generale "interaction rate") come metrica per decidere se un contenuto vada spinto ulteriormente o se vada invece segato sul nascere.

    Facebook, Twitter e tutti i principali social media hanno implementato un algoritmo analogo.


  • Contributor

    Mi è appena tornato sotto gli occhi il Whitepaper di Google su FLoC

    https://github.com/google/ads-privacy/blob/master/proposals/FLoC/FLOC-Whitepaper-Google.pdf

    A parte una spiegazione lampante dei processi di machine learning utilizzati nella definizione delle coorti, credo sia INTERESSANTISSIMO andare a rileggere quello che viene riportato a pagina 14 quando parlano di "Google Display Ads Dataset"

    The dataset consists of a de-identified collection of URLs from publishers i n the Google Display Network collected across 7 days.

    Quindi usano le URL per determinare le coorti di FLoC. Per la precisione, le URL della Display Network. Questo fra parentesi mi accende una lampadina nel cervello: e se davvero dessero la priorità in Google Discover ai siti web che già utilizzano la Display di Google?

    Sarebbe una cosa illegalissima (è un abuso di posizione dominante), ma Google è una vecchia volpe. Non sarebbe così sorprendente.

    Ad ogni modo, andrebbe testato più a fondo e fatta un'indagine specifica.

    Andiamo avanti che ci sono altre cose interessanti...

    In particolare quello che viene riportato in "Feature extraction":

    Domain One-hot encoding

    Under this feature extractor, each URL visit i s encoded by i ts domain only. The feature vector

    representing a user i s simply a one-hot encoding of all the domains they visited. That i s, i t i s a

    sparse vector where all domains visited by a user get assigned a 1, regardless of the number of

    times the domain was visited.

    Utenti clusterizzati sulla base del DOMINIO che visitano, a prescindere dall'URL

    Domain TF-IDF encoding

    Here again we encode each URL visit by i ts domain. However, i nstead of weighting all websites

    in the same way we use TF-IDF scoring. That i s, i f a user visits a domain frequently i t gets a

    higher score but i f the domain i s very popular - multiple users visit the same domain - i t i s

    assigned a l ower weight. The feature vector representing a user i s simply the sparse vector of

    scores associated with each domain visited by the user.

    Questa è una bomba: la popolarità delle URL viene pesate sulla base della popolarità del dominio stesso, con la stessa logica di TF-IDF.

    È se vogliamo la conferma che:

    1. esiste un valore soglia per considerare un URL "popolare"
    2. questo valore soglia è proporzionale alla popolarità del dominio

    Topic categories

    A better way of generating feature vectors i s by categorizing the websites i nto topics. For

    instance expedia.com i s a travel website. Categorization i s done using a tool similar to the topic

    categorization API of Google Cloud4 . This categorization corresponds to a hierarchy of 3 l evels,

    where each l evel describes a more specific category.

    Ed ecco di nuovo nominata la categorizzazione dei siti web.

    Alla pagina successiva, infine, c'è questo:

    Evaluation

    We measure the viability of using cohorts as a targeting tool as follows:

    1. Building interest profiles. For each cohort we categorize all websites that would be tagged by the same cohort i d and aggregate all topic category weights. We then define the cohort i nterest profile as the top 10 categories.

    Che è ESATTAMENTE quello di cui abbiamo discusso fin qua.


    giorgiotave 1 Risposta
  • Community Manager

    @kal non so fino a che punto dovremmo aprire un'altra discussione o raccogliere in modo diverso le informazioni che abbiamo...

    In questa non si capisce più niente ahhahaah

    Comunque: TANTA ROBA


    kal 1 Risposta