- Home
- Categorie
- Digital Marketing
- SEO
- Come non indicizzare porzione di una pagina
-
Come non indicizzare porzione di una pagina
@Hawnk Ciao, qui sul forum qualche anno fa si diceva che non era possibile, ma non so se è cambiato qualcosa da allora.
Ti confermo però che Googleon e Googleoff funzionano (per quanto ne so) solo per la google search appliance
-
Non indicizzare non puoi (l'unico modo rispettoso delle linee guida per non far indicizzare un contenuto è non metterlo), ma puoi far sì che un determinato contenuto non appaia nella snippet in SERP, con il tag <span data-nosnippet>
Fonte: https://support.google.com/webmasters/answer/79812#data-nosnippet
-
@Hawnk Un'idea che mi viene in mente, forse non la migliore in assoluto ma funziona, è questa:
Il crawler di Google fa fatica a leggere un codice JavaScript, quindi...
scrivi un contenuto dinamico, normalmente sembra assurdo, ma per il tuo scopo funziona!
Più precisamente, puoi fare:<div id="nome_cose_noindex"></div>
Poi includi uno script esterno (poi spiego meglio il motivo), quindi:
<script scr="...nomefile.js"></script>
Nel file JavaScript puoi scrivere:
document.getElementById("nome_cose_noindex").innerHTML="tutto_il_tuo_testo";
NB: non ti serve qualcosa come addEventListener, il testo fai in modo che venga visualizzato subito grazie al rendering del browser, il discorso è che deve essere "scomodo da leggere" per il crawler.
Tornando a prima, il file JavaScript è bene che sia esterno, così lo puoi bloccare dal robots.txt!
Ribadisco che questa non è la strategia migliore del mondo, bloccare CSS e JavaScript non rientra di certo nelle best practices, ma per quello che ti serve... funziona!
1 Risposta
-
@giulio-marchesi ha detto in Come non indicizzare porzione di una pagina:
@Hawnk Un'idea che mi viene in mente, forse non la migliore in assoluto ma funziona, è questa:
Il crawler di Google fa fatica a leggere un codice JavaScript, quindi...
scrivi un contenuto dinamico, normalmente sembra assurdo, ma per il tuo scopo funziona!
Più precisamente, puoi fare:<div id="nome_cose_noindex"></div>
Poi includi uno script esterno (poi spiego meglio il motivo), quindi:
<script scr="...nomefile.js"></script>
Nel file JavaScript puoi scrivere:
document.getElementById("nome_cose_noindex").innerHTML="tutto_il_tuo_testo";
NB: non ti serve qualcosa come addEventListener, il testo fai in modo che venga visualizzato subito grazie al rendering del browser, il discorso è che deve essere "scomodo da leggere" per il crawler.
Tornando a prima, il file JavaScript è bene che sia esterno, così lo puoi bloccare dal robots.txt!
Ribadisco che questa non è la strategia migliore del mondo, bloccare CSS e JavaScript non rientra di certo nelle best practices, ma per quello che ti serve... funziona!
Questa cosa:
- funziona
- se la vede un dipendente di Google che naviga con un browser con user agent Googlebot ti sgama subito
E' una pratica rischiosa.
Occorre giocare di fino.
Su questo argomento c'è un post molto tecnico e molto SEO nerd di Oliver H.G. Mason (a.k.a. ohgm), la trascrizione del suo bell'intervento al Brighton SEO di quest'anno:
https://ohgm.co.uk/esoteric-seo-tips-i-hope-you-dont-already-know/
Leggere alla voce "Robots.txt Cloaking"
1 Risposta
-
@kal in effetti assomiglia al cloaking, anche se rispetto a quello classico qui sembra che stiamo facendo l'esatto opposto (nascondi a Google e non all'utente). Certo senza dubbio è una procedura rischiosa! Interessante il link.
1 Risposta
-
@giulio-marchesi ha detto in Come non indicizzare porzione di una pagina:
Interessante il link.
ohgm è decisamente uno in gamba. Tutto il suo blog è pieno di spunti interessanti e pensiero laterale.
-
Come sopra: https://connect.gt/post/1275772