Ho deciso di scrivere questa breve guida (ma a mio avviso utile) per rispondere ad una esigenza particolare che ho riscontrato parlando con chi si occupa di SEO da qualche anno e non è più un principiante.
Poniamo il caso di avere già una lista pronta di 300 URLs e aver bisogno di conoscerne il tag <title> per fare le nostre considerazioni.
Per svolgere questo compito, abbiamo sostanzialmente 3 opzioni:
- Usare un servizio API esterno (probabilmente a pagamento)
- Creare il nostro web scraper in Python o Go
- Senza saper programmare né acquistare crediti per utilizzo di API, possiamo scrivere una semplice formula in Google Spredsheet.
Analizzando la terza soluzione, basta usare una XPath query (in questo caso //title) all'interno della formula:
=IMPORTXML(A2;"//title")
Riporto un esempio di uso di questa formula applicata a 2 URLs.

Utilizzando le XPath queries ci sono moltissimi altri utilizzi possibili in chiave SEO.
Potremmo voler recuperare la meta description e sarà sufficiente usare la seguente formula:
=IMPORTXML(A2;"//meta[@name='description']/@content")
Se invece ci servisse il tag H1, basterà usare:
=IMPORTXML(A2;"//h1")
E se volessimo estrarre un tag particolare, quale query andrebbe usata?
Ci viene in aiuto Google Chrome, perché basta selezionare l’elemento che ci interessa nella pagina e poi andare su “Ispeziona elemento > Clic con tasto destro > Copia > Copia XPath”. In questo modo abbiamo davvero una grande flessibilità nell’estrare quello che ci interessa dalla pagina.

Spero che queste funzionalità possano facilitare il lavoro SEO di qualche lettore se non ne fosse ancora a conoscenza. 