• User Newbie

    Eliminare termini presenti dopo l'estensione .htm

    Salve,
    spero di riuscire a spiegare il mio problema, ho scoperto attraverso "Google strumenti per webmaster" che in moltissimi link del mio sito alla fine delle URL sono presenti altri termini e questi vengono a creare nuove pagine copie della pagina principale ma con i link interni sballati, mi spiego con degli esempi.
    Il link www .mio-sito.it/storia/mia-pagina.htm
    diventa www .mio-sito.it/storia/mia-pagina.htm/xyz
    quest'ultima pagina è identica nei contenuti a www .mio-sito.it/storia/mia-pagina.htm ma i link interni sembrano perdere i percorsi assoluti, ovvero il link www .mio-sito.it/geografia/pagina.htm diventa www .mio-sito.it/storia/geografia/pagina.htm
    Come posso evitare tutto questo? Ho pensato attraverso il file .htaccess dicendogli di reinderizzare i link che terminano senza estensione (nel mio esempio www .mio-sito.it/storia/mia-pagina.htm/xyz) ad una pagina 404 oppure alla homepage, ma cosa scrivere?
    Avete ulteriori suggerimenti? Inoltre qualcuno sa spiegarmi come può accadere tutto questo?
    Grazie


  • User Newbie

    Ci riprovo con degli esempi reali.

    In "Google strumenti per webmaster" tra gli Errori di scansione mi vengono segnalate tantissime pagine non trovate (errore 404) i cui link sono generati da pagine come queste:

    riflessioni.it/senso-della-vita/corrado-augias.htm/feed
    riflessioni.it/senso-della-vita/corrado-augias.htm/forum

    come potete notare dopo l'estensione .htm compare uno slash e in questo caso i termini feed o forum, URL che non sono generate dal sito.

    Se fate un confronto tra le pagine esatte come ad esempio nel primo caso riflessioni.it/senso-della-vita/corrado-augias.htm con quella "misteriosa" riflessioni.it/senso-della-vita/corrado-augias.htm/feed noterete che in quest'ultima i link interni all'articolo perdono i percorsi assoluti, ad esempio il primo collegamento ipertestuale all'interno della prima risposta applicato al termine "male" che rimanda al link riflessioni.it/enciclopedia/male-concetto.htm diventa riflessioni.it/senso-della-vita/enciclopedia/male-concetto.htm generando quindi una pagina inesistente, noterete inoltre che perde i collegamenti al css e quindi la formattazione della pagina.
    Per ovviare a questi due errori (pagine inesistenti ma soprattutto pagine duplicate) pensavo di risolverlo attraverso il file .htaccess dicendogli di reindirizzare i link che terminano senza estensione o meglio con l'aggiunta di un termine dopo l'estensione, ad una pagina 404.
    Cosa ne pensate? Sapete aiutarmi?
    Grazie