Ci riprovo con degli esempi reali.
In "Google strumenti per webmaster" tra gli Errori di scansione mi vengono segnalate tantissime pagine non trovate (errore 404) i cui link sono generati da pagine come queste:
riflessioni.it/senso-della-vita/corrado-augias.htm/feed
riflessioni.it/senso-della-vita/corrado-augias.htm/forum
come potete notare dopo l'estensione .htm compare uno slash e in questo caso i termini feed o forum, URL che non sono generate dal sito.
Se fate un confronto tra le pagine esatte come ad esempio nel primo caso riflessioni.it/senso-della-vita/corrado-augias.htm con quella "misteriosa" riflessioni.it/senso-della-vita/corrado-augias.htm/feed noterete che in quest'ultima i link interni all'articolo perdono i percorsi assoluti, ad esempio il primo collegamento ipertestuale all'interno della prima risposta applicato al termine "male" che rimanda al link riflessioni.it/enciclopedia/male-concetto.htm diventa riflessioni.it/senso-della-vita/enciclopedia/male-concetto.htm generando quindi una pagina inesistente, noterete inoltre che perde i collegamenti al css e quindi la formattazione della pagina.
Per ovviare a questi due errori (pagine inesistenti ma soprattutto pagine duplicate) pensavo di risolverlo attraverso il file .htaccess dicendogli di reindirizzare i link che terminano senza estensione o meglio con l'aggiunta di un termine dopo l'estensione, ad una pagina 404.
Cosa ne pensate? Sapete aiutarmi?
Grazie