@a-petrucci said:
Certo che può leggerlo, il robots.txt di cui ti parlo io è quello che sta alla radice del server.
Avrai sicuramente una situazione di questo tipo:
website .com/ <- Sito web principale
website .com /test <- seconda piattaforma di test
In questo caso nel robots.txt dovrai mettere:
User-agent: **
Disallow: /test/
*
L'htaccess non interviene perchè limita l'accesso alla cartella /test/ non alla root del server 
no, il guaio è che si tratta di un altro sito... non è una sottocartella, è un altro dominio, per questo ho paura che google scambi per un tentativo di siti-satellite o cose del genere 







Da quello che sò, il canonical va inserito, in caso di contenuti duplicati, sulla pagina duplicata e non su quella originale...
