• User Attivo

    Indicizzare url pagina con caratteri "stranieri".

    Salve a tutti!

    Mi spiego meglio.

    Devo realizzare una versione del sito in lingua straniera, in particolare in Ungherese.

    Questa lingua presenta molti caratteri come: à, é, ecc...

    Ad esempio il termine "Toscana" si dice/scrive "Toszkáná". Il codice di questa parola è: "Toszkáná"

    Secondo voi, nel testo è meglio scrivere - ai fini di una corretta indicizzazione nei motori di ricerca - Toszkáná oppure Toszkáná ?

    Avete avuto esperienze del genere? Come vi siete comportati? E quale esperienza vi ha dato maggiori risultati?

    Grazie in anticipo per il vostro aiuto!

    d-force


  • Bannato Super User

    dal mio punto di vista è meglio scrivere "Toszkáná"...perchè lo spider legge il codice e non quello che viene stampato a video; nel caso in cui "Toszkáná" sia una keyword, se la scrivi così "Toszkáná", la perdi, cioè non viene considerata dallo spider come tu vorresti che fosse considerata, in quanto, alla fin fine, hai scritto un'altra cosa.


  • User Attivo

    @cibino said:

    dal mio punto di vista è meglio scrivere "Toszkáná"...perchè lo spider legge il codice e non quello che viene stampato a video; nel caso in cui "Toszkáná" sia una keyword, se la scrivi così "Toszkáná", la perdi, cioè non viene considerata dallo spider come tu vorresti che fosse considerata, in quanto, alla fin fine, hai scritto un'altra cosa.

    Ciao,

    da quanto mi risulta è totalmente indifferente


  • User Attivo

    Grazie per le vostre risposte!

    Spero tuttavia che sia indifferente, perchè mi sono accorto che MM Dreamweaver converte automaticamente Toszkáná" in "Toszkáná"...

    Ciao!


  • Bannato Super User

    @d-force said:

    Grazie per le vostre risposte!

    Spero tuttavia che sia indifferente, perchè mi sono accorto che MM Dreamweaver converte automaticamente Toszkáná" in "Toszkáná"...

    Ciao!

    sì, ma se scrivi "Toszkáná" nella parte del codice e non nella parte della progettazione, rimarrà "Toszkáná" anche nel html...
    😉
    a questo punto, sulla questione che sia indifferente o meno, attendo il parere di qualcuno di più esperto...:)


  • Super User

    Per ragioni che vanno aldilà dei motori di ricerca, ti consiglio di usare la rappresentazione sotto forma di entità dei caratteri e non direttamente i caratteri.

    Questo per la piena accessibilità delle pagine.
    Vale lo stesso non solo per i caratteri russi, ma anche per le lettere accentate italiane. ( leggi questo topic à oppure à?)

    @cibino said:

    dal mio punto di vista è meglio scrivere "Toszkáná"...perchè lo spider legge il codice e non quello che viene stampato a video; nel caso in cui "Toszkáná" sia una keyword, se la scrivi così "Toszkáná", la perdi, cioè non viene considerata dallo spider come tu vorresti che fosse considerata, in quanto, alla fin fine, hai scritto un'altra cosa. Mi dispiace ma devo smentirti.
    Gli spider proprio come i browser, sanno come tradurre quei codici nei corrispondenti caratteri.
    Lo sanno perchè anche loro, come i webmaster, devono attenersi a ciò che viene stabilito dal W3C, e non il contrario.


  • Bannato Super User

    @claudioweb said:

    Per ragioni che vanno aldilà dei motori di ricerca, ti consiglio di usare la rappresentazione sotto forma di entità dei caratteri e non direttamente i caratteri.

    Questo per la piena accessibilità delle pagine.
    Vale lo stesso non solo per i caratteri russi, ma anche per le lettere accentate italiane. ( leggi questo topic à oppure à?)

    Mi dispiace ma devo smentirti.
    Gli spider proprio come i browser, sanno come tradurre quei codici nei corrispondenti caratteri.
    Lo sanno perchè anche loro, come i webmaster, devono attenersi a ciò che viene stabilito dal W3C, e non il contrario.

    ok...capito!
    gli spider, come i browser, sanno come tradurre i codici...
    perfetto!
    grazie...;)


  • Moderatore

  • User

    @paocavo said:

    How search results may differ based on accented characters and interface languages

    😉

    L'articolo non mi sembra molto in tema con la questione: lì si parla di differenza tra lettere accentate e non, non della differenza (inesistente) tra lettere inserite direttamente o stesse lettere sotto forma di entità HTML