• Moderatore

    Hai dimenticato alcune meta description sulle pagine del tuo sito? Falle scrivere a BERT!

    Voglio condividere un colab molto utile, fatto da Andrea Volpini, che permette utilizzare BERT per la generazione automatica delle meta description mancanti. https://colab.research.google.com/drive/1TeASgjfCGiZY7VjxcQmHIHHjy5L9Z-j1
    Si comincia col caricare un csv esportato da Screamingfrog (collegato alle API di Analytics e GSC), e vengono individuate tutte le pagine senza meta description (o con una troppo corta) e che soddisfino alcuni requisiti (includere o escludere aree del sito, un certo posizionamento o CTR, ecc.).
    Una volta creato il dataset si lancia BERT (versione multilangual se il sito è in italiano) per la generazione della meta. Ricordiamo che BERT usa la abstractive text summarization che al contrario di quella estrattiva prevede non l’individuazione delle frasi salienti nel testo ma la generazione di un nuovo testo, di solito combinazioni di parti di frasi estratte – ovviamente semplifico.
    Qualche indicazione fondamentale per usare il colab:
    Una volta esportato il csv da screamingfrog direttamente in Google sheet, è necessario pubblicare lo stesso csv sul web (da menu file e poi selezionando il nome del foglio e la modalità csv separato da virgole). L’url ottenuto andrà inserito nel blocco “using screaming frog” subito dopo !wget
    Copiare la stringa completa pub?gid ottenuta dopo aver eseguito il codice (play)
    E inserirla nel blocco successivo subito dopo pd.read_csv
    Fondamentale, nello stesso blocco, indicare il numero delle colonne del csv (la prima è numerata 0) su cui si vogliono applicare i filtri per l’estrazione.
    Sicuramente le colonne 0, ossia URL, e 2 (lo Status code, così da filtrare solo le pagine che restituiscono 200), 10 o 11 per meta description length o la pixel width, e poi il numero delle colonne coi valori estratti da Analytics e/o GSC, per esempio la Posizione (per risparmiare tempo se le pagine sono molte potremmo filtrare solo quelle che si posizionano in pagina 1, o fino alla ventesima posizione).
    Infine play su l’ultima libreria permette di salvare il nuovo csv contenete gli URL delle pagine e relativa meta description. Come sempre quando si parla di generazione automatica di testi (NLG) bisogna controllare e fare le proprie valutazioni. In generale se una pagina è molto importante meglio scrivere la description a mano ma del resto questo colab serva a lavorare sulla description “dimenticate” e quindi, si spera, su pagine non fondamentali.
    Appena capisco come caricare screenshot qui su Connect, faccio un vero tutorial 😉


    sermatica 1 Risposta
  • Moderatore

    @maxxg

    Ciao Max,
    grazie per l'info. Aggiungo che la funzione usata è "Bert Extractive Summarizer", https://pypi.org/project/bert-extractive-summarizer/ e qui trovate una demo https://smrzr.io/

    P.s.
    Da quello che ho visto non riscrive i testi, almeno non nei test che ho fatto io.