Vedo che excite.it usa le cloud tags.
Edit:
Per non rischiare la pagina che raccoglie tutti i cloud tag l'ho impostata come
Disallow: /component/option,com_tag/Itemid,0/page,cloud/ , così almeno sto sicuro di non essere penalizzato cosa che sembra possibile leggendo qui
Così non avrò molti link nelle pagine, e i tag porteranno ad una pagina che raccoglie tutti gli articoli di quel dato tag. Fammi sapere se ho impostato bene anche il robots.txt
E' disponibile qualche tool che simula uno spider per verificare se viene bloccato l'accesso degli spider alla pagina http://www.neohw.com/component/option,com_tag/Itemid,0/page,cloud/ ?