• Contributor

    @brum ha detto in Il Test su Discover di Connect.gt:

    Continuo a vedere il volume come un elemento a corredo, ma non insignificante.

    Il problema è il volume di cosa.

    Il volume dei dati clickstream su un URL? Probabilmente basso. Abbiamo la newsletter di Giorgio che prova questa cosa. La newsletter normalmente non viene visualizzata sul web... ma è entrata in Discover nel momento in cui ha avuto risonanza su Twitter. Ma IN QUEL CONTESTO sono bastate poche decine di clic...

    Il volume di ricerca sulle query che Discover prova ad anticipare?

    Probabilmente questo è più rilevante.

    Ma sono idee, non sappiamo davvero se esista una soglia e quanto grande.


    brum 1 Risposta
  • User

    @kal proprio nel caso di quella newsletter (sono andato a vedere, la numero 3), avevo letto il contenuto sul browser per puro caso. Il giorno successivo l'ho trovata in discover.
    Non mi è più capitato di leggerle sul browser ne di trovarle in discover.

    Secondo me il volume dei dati clickstream su un URL ha il suo valore se correlato ad un trend in corso.

    Tutta la spazzatura che trovo costantemente su discover con titoli clickbait ad esempio, quali query possono anticipare?
    Hanno la quasi totalità del traffico proveniente dai social e gli articoli sono inesistenti. Se non per la mole di traffico che ricevono per un argomento in trend (calciatore, gossip, e simili) quali altre caratteristiche li spingono in discover?

    Ora non dico sia determinante, ma non riesco ad escluderlo totalmente.
    Poi, se entriamo in discover, con o senza volume, festeggio volentieri 🍻


    kal 1 Risposta
  • Contributor

    @brum ha detto in Il Test su Discover di Connect.gt:

    Tutta la spazzatura che trovo costantemente su discover con titoli clickbait ad esempio, quali query possono anticipare?

    Questa è un'ottima domanda. Provo a fare qualche ragionamento.

    Sicuramente su Discover non c'è SOLO contenuto correlato a trend in corso. Ci sono anche articoli "nuovi" ma correlati al segmento di interesse delle varie coorti in cui ti ritrovi.

    Io ad esempio ho un flusso costante di notizie astronomiche, che è una delle mie passioni. Oppure ad esempio i videogiochi in generale.

    Quindi sicuramente c'è una meccanica per i contenuti di "ricerca latente" (chiamiamola così, è quella che mi è appena capitata con la storia dell'aggiornamento di Windows) e una per i contenuti legati al semplice interesse.

    In entrambi i casi abbiamo comunque:

    1. contenuto fresco
    2. correlato ad un interesse (costante o emergente) di un pubblico sufficientemente ampio

    EDIT: parlando di coorti di utenti, ho appena avuto un'illuminazione...

    FLoC

    https://github.com/WICG/floc

    È la proposta di Google per sostituire i cookie di terze parti per il targeting della pubblicità. Ma ha moltissime cose in comune con i discorsi che abbiamo fatto fin qua... e non credo per caso. Su Discover dopotutto ci sono gli annunci pubblicitari...

    Questa frasetta è secondo me importante:

    The browser uses machine learning algorithms to develop a cohort based on the sites that an individual visits. The algorithms might be based on the URLs of the visited sites, on the content of those pages, or other factors.

    In altre parole: FLoC fa sì che sia il browser ad utilizzare i dati clickstream per generare delle coorti tramite machine learning.

    Cioè ESATTAMENTE quello che abbiamo notato che fa Google.


    brum 1 Risposta
  • User

    @kal ha detto in Il Test su Discover di Connect.gt:

    https://github.com/WICG/floc

    È la proposta di Google per sostituire i cookie di terze parti per il targeting della pubblicità. Ma ha moltissime cose in comune con i discorsi che abbiamo fatto fin qua... e non credo per caso. Su Discover dopotutto ci sono gli annunci pubblicitari...

    Questo documento è interessantissimo. Ora, noi come infiliamo il nostro contenuto in queste righe?

    if cohorts can be used for tracking, then having more interest cohort samples for a user will make it easier to reidentify them on other sites that have observed the same sequence of cohorts for a user.

    Sostanzialmente descrive la tua esperienza con il "windows update".
    Ma dice anche che oltre a questo:

    1. contenuto fresco
    2. correlato ad un interesse (costante o emergente) di un pubblico sufficientemente ampio

    il nostro contenuto dovrà essere identificabile, tra gli altri contenuti che appartengono alla stessa sequenza di coorti.

    Nel caso del windows update, la selezione era semplice, perché l'articolo di computer world è l'unico fresco in relazione al trend e rispecchia le altre linee di cui abbiamo parlato.

    Curati gli aspetti di cui sopra, se trovassimo bassa concorrenza sul contenuto fresco potrebbe essere un grosso aiuto per il nostro test. 😓

    Cosa dici, possiamo iniziare ad organizzare idee per il contenuto?


    kal 1 Risposta
  • Contributor

    @brum ha detto in Il Test su Discover di Connect.gt:

    Cosa dici, possiamo iniziare ad organizzare idee per il contenuto?

    Sotto con le idee!

    Anzi, sicuramente ne parliamo in live questo pomeriggio assieme a Giorgio, Alessio e Matteo.


  • User

    Scusate, qual è il gruppo Telegram citato più volte dove siete in contatto per questi test, vorrei aggiungermi nel caso anche io.

    Come non detto, trovato 🙂


    barretta 1 Risposta
  • User

    @alex-mi cerca Internet Crazy Researchers e lo trovi subito --> https://pasteboard.co/JU6DKBd.png

    Come non detto ho visto ora che hai già trovato


    A 1 Risposta
  • User

    @barretta ha detto in Il Test su Discover di Connect.gt:

    @alex-mi cerca Internet Crazy Researchers e lo trovi subito --> https://pasteboard.co/JU6DKBd.png

    Come non detto ho visto ora che hai già trovato

    No a quanto pare ho confuso il gruppo FFCommunityGroup con questo che citi e non trovo, è forse chiuso e solo su invito?


    barretta 1 Risposta
  • User

    @alex-mi il gruppo è aperto e posso invitare membri per cui se mi vuoi dare il tuo nick provo ad aggiungerti


    A 1 Risposta
  • User

    Vorrei dare il mio piccolo contributo alla discussione su Discover e porre anche qualche quesito aggiuntivo.

    Su diversi blog che gestisco (con Wordpress), tutti presenti in Google News, ho provato anche io come voi ad analizzare un po' quali potrebbero essere i fattori che fanno scattare l'inserimento, ma ad oggi l'unica cosa che avevano in comune gli articoli "premiati" era solo questa: una buona interazione social (oltre 100 tra like e condivisioni Facebook, oltre 150 interazioni su Twitter, di cui tra i 20 e 40 clic sul link presente nel tweet).

    L'unica eccezione, un articolo che aveva ottenuto sì molti Like e condivisioni su Facebook, ma perché era stata attivata una campagna adv su quello specifico post.

    Leggendo le varie ipotesi, ho fatto caso agli ultimi inserimenti e credo sia giusta l'osservazione di una correlazione con argomenti nei trends di Google.

    Quello che non so spiegarmi è come mai un contenuto pubblicato magari il martedi pomeriggio, venga inserito in Discover il giorno successivo. Anche qui, sempre legato al discorso di eventuali picchi di ricerche su un determinato argomento e vengono scansionate le pubblicazioni più recenti?

    Confermo quanto ricorda giustamente Martino, ovvero che se si finisce in Discover non vuol dire automaticamente in quello di tutti tutti. Più volte collaboratori mi hanno segnalato articoli che hanno visto su Discover che io sul mio smartphone non vedevo.

    Quello che mi infastidisce non poco è notare che su Discover si trovano troppo spesso i classici titoli acchiappa clic. Speravo che nel corso degli anni Google avrebbe cercato di arginare questo fenomeno ma a quanto pare... E anche qui, un titolo che attira l'attenzione genera clic da Twitter e altri social e torniamo a quanto discusso fino ad ora, che potrebbe essere uno dei fattori "scatenanti" per entrare in Discover.

    Se si vorranno fare ulteriori prove/test, mi aggiungo volentieri. Su tre blog di proprietà, due entrano relativamente spesso su Discover, nei prossimi giorni cercherò di monitorare un po' meglio la situazione e se trovo qualche ulteriore "indizio" vi faccio sapere.


    kal 1 Risposta
  • User

    @barretta ha detto in Il Test su Discover di Connect.gt:

    @alex-mi il gruppo è aperto e posso invitare membri per cui se mi vuoi dare il tuo nick provo ad aggiungerti

    Boh... non lo trovo https://pasteboard.co/JU6X1Su.png
    Se vuoi, invitami pure
    Grazie


    barretta 1 Risposta
  • User

    @alex-mi ha detto in Il Test su Discover di Connect.gt:

    @alexmob

    vedo che usi APPLE.
    Chissà magari c'è qualche limitazione.
    Comunque ora ho provato ad invitarti e, purtroppo, non ho quel diritto (https://pasteboard.co/JU726Gj.png) 😞
    MEA CULPA credevo di poterlo fare


    A 1 Risposta
  • User

    @barretta ha detto in Il Test su Discover di Connect.gt:

    @alex-mi ha detto in Il Test su Discover di Connect.gt:

    @alexmob

    vedo che usi APPLE.
    Chissà magari c'è qualche limitazione.
    Comunque ora ho provato ad invitarti e, purtroppo, non ho quel diritto (https://pasteboard.co/JU726Gj.png) 😞
    MEA CULPA credevo di poterlo fare

    Sì Telegram su Mac ha qualche bug (devo ancora capire come mai non salva le immagini che gli dico di scaricare e ogni volta devo farlo con il tasto destro e "salva come..".. Ho provato a cercare lo stesso gruppo anche su app Android ma non me lo trova lo stesso. Boh.


  • Contributor

    @alex-mi ha detto in Il Test su Discover di Connect.gt:

    Quello che mi infastidisce non poco è notare che su Discover si trovano troppo spesso i classici titoli acchiappa clic.

    Questa osservazione l'abbiamo fatta anche nella Live con Giorgio e bisogna mettersela via: Discover È UN SOCIAL. Le dinamiche di comunicazione predominanti sono assolutamente quelle del clickbait.


    barretta A luqweb 3 Risposte
  • User

    @kal tu puoi aggiungere alex al gruppo telegram?


    kal 1 Risposta
  • User

    @kal ha detto in Il Test su Discover di Connect.gt:

    @alex-mi ha detto in Il Test su Discover di Connect.gt:

    Quello che mi infastidisce non poco è notare che su Discover si trovano troppo spesso i classici titoli acchiappa clic.

    Questa osservazione l'abbiamo fatta anche nella Live con Giorgio e bisogna mettersela via: Discover È UN SOCIAL. Le dinamiche di comunicazione predominanti sono assolutamente quelle del clickbait.

    Ahimè 😞 Come ammazzare il lavoro di chi cerca di produrre contenuti di qualità.


  • Contributor

    @barretta ha detto in Il Test su Discover di Connect.gt:

    @kal tu puoi aggiungere alex al gruppo telegram?

    No, dobbiamo chiedere a @giorgiotave


  • User Attivo

    @kal ha detto in Il Test su Discover di Connect.gt:

    @alex-mi ha detto in Il Test su Discover di Connect.gt:

    Quello che mi infastidisce non poco è notare che su Discover si trovano troppo spesso i classici titoli acchiappa clic.

    Questa osservazione l'abbiamo fatta anche nella Live con Giorgio e bisogna mettersela via: Discover È UN SOCIAL. Le dinamiche di comunicazione predominanti sono assolutamente quelle del clickbait.

    Non so esattamente cosa sia per te clickbait (o meglio quale sia la tua sensibilità sul tema), però direi che nel mio Discover solo il 20% degli articoli proposti è clickbait.

    Gestendo però i miei interessi può essere che lo influenzo fin troppo.


    kal 1 Risposta
  • Contributor

    @luqweb ha detto in Il Test su Discover di Connect.gt:

    Non so esattamente cosa sia per te clickbait (o meglio quale sia la tua sensibilità sul tema), però direi che nel mio Discover solo il 20% degli articoli proposti è clickbait.

    Io lo intendo in senso esteso, ovvero: ottimizzare il copy delle anteprime per stimolare al massimo il clic dell'utente. Questo può essere fatto in modo onesto od in modo disonesto da parte del produttore del contenuto.

    Ne abbiamo parlato anche in live, c'è sicuramente un algoritmo INTERNO a Discover che usa il CTR (o un più generale "interaction rate") come metrica per decidere se un contenuto vada spinto ulteriormente o se vada invece segato sul nascere.

    Facebook, Twitter e tutti i principali social media hanno implementato un algoritmo analogo.


  • Contributor

    Mi è appena tornato sotto gli occhi il Whitepaper di Google su FLoC

    https://github.com/google/ads-privacy/blob/master/proposals/FLoC/FLOC-Whitepaper-Google.pdf

    A parte una spiegazione lampante dei processi di machine learning utilizzati nella definizione delle coorti, credo sia INTERESSANTISSIMO andare a rileggere quello che viene riportato a pagina 14 quando parlano di "Google Display Ads Dataset"

    The dataset consists of a de-identified collection of URLs from publishers i n the Google Display Network collected across 7 days.

    Quindi usano le URL per determinare le coorti di FLoC. Per la precisione, le URL della Display Network. Questo fra parentesi mi accende una lampadina nel cervello: e se davvero dessero la priorità in Google Discover ai siti web che già utilizzano la Display di Google?

    Sarebbe una cosa illegalissima (è un abuso di posizione dominante), ma Google è una vecchia volpe. Non sarebbe così sorprendente.

    Ad ogni modo, andrebbe testato più a fondo e fatta un'indagine specifica.

    Andiamo avanti che ci sono altre cose interessanti...

    In particolare quello che viene riportato in "Feature extraction":

    Domain One-hot encoding

    Under this feature extractor, each URL visit i s encoded by i ts domain only. The feature vector

    representing a user i s simply a one-hot encoding of all the domains they visited. That i s, i t i s a

    sparse vector where all domains visited by a user get assigned a 1, regardless of the number of

    times the domain was visited.

    Utenti clusterizzati sulla base del DOMINIO che visitano, a prescindere dall'URL

    Domain TF-IDF encoding

    Here again we encode each URL visit by i ts domain. However, i nstead of weighting all websites

    in the same way we use TF-IDF scoring. That i s, i f a user visits a domain frequently i t gets a

    higher score but i f the domain i s very popular - multiple users visit the same domain - i t i s

    assigned a l ower weight. The feature vector representing a user i s simply the sparse vector of

    scores associated with each domain visited by the user.

    Questa è una bomba: la popolarità delle URL viene pesate sulla base della popolarità del dominio stesso, con la stessa logica di TF-IDF.

    È se vogliamo la conferma che:

    1. esiste un valore soglia per considerare un URL "popolare"
    2. questo valore soglia è proporzionale alla popolarità del dominio

    Topic categories

    A better way of generating feature vectors i s by categorizing the websites i nto topics. For

    instance expedia.com i s a travel website. Categorization i s done using a tool similar to the topic

    categorization API of Google Cloud4 . This categorization corresponds to a hierarchy of 3 l evels,

    where each l evel describes a more specific category.

    Ed ecco di nuovo nominata la categorizzazione dei siti web.

    Alla pagina successiva, infine, c'è questo:

    Evaluation

    We measure the viability of using cohorts as a targeting tool as follows:

    1. Building interest profiles. For each cohort we categorize all websites that would be tagged by the same cohort i d and aggregate all topic category weights. We then define the cohort i nterest profile as the top 10 categories.

    Che è ESATTAMENTE quello di cui abbiamo discusso fin qua.


    giorgiotave 1 Risposta