Ciao Stealth.
Il bot di G.N. scansiona la pagina e cerca di trovare l'articolo in mezzo al "mare di codice" presente.
Quel messaggio di errore sta a significare che nel totale del testo della pagina (esclusi tag e immagini), i Kb riservati all'articolo (o meglio il numero di caratteri) sono troppo pochi.
Tu dirai, che importa al googlebot se nel resto della pagina inserisco 20 link a notizie correlate e altri 20 alle notizie dell'ultim'ora: che prenda l'articolo ed escluda il resto.
Purtroppo, il bot funziona quasi con gli stessi principi del mediapartners di adsense, quindi non è perfetto e si confonde alla grande quando deve estrarre un qualcosa da una maggiore quantità di dati del previsto.
Parlando in modo pratico, se hai una pagina con html head body ARTICOLO /body /html, basta un articolo lungo almeno 300 caratteri e l'indicizzazione avverrà senza problemi.
Aumentando il codice "estraneo" alla notizia nella pagina, devi aumentare in proporzione la lunghezza dell'articolo: in media articoli di almeno 1000 battute vengono indicizzati senza problemi. Senza esagerare perché articoli molto lunghi soffrono lo stesso del problema dell'indicizzazione ma per diversi motivi.
Per ovviare al problema, se hai la possibilità di intervenire sul codice del CMS, potresti calcolare la lunghezza dell'articolo e presentare pagine con meno informazioni di contorno se questi è minore di 500 battute.
Non conoscendo il sito in questione non posso scendere ulterormente nei dettagli.
ciao
Cristiano