• User

    Problemi da impaginazione

    Salve,

    vorrei chiedervi un consiglio quanto riguarda questo:

    Pagina dinamica basata su mysql, tipo: miosito.index.php dove vengono inserite delle news. Diciamo circa 5000.
    Sulla index.php si visualizza 15 news, il resto è ordinato tramite impaginazione. (con i numeretti delle pagine seguenti alla fine delle pagine).
    Non abbiamo mai usato nessun tipo di rewrite (per ottenere seo friendly urls), quindi abbiamo i cosidetti url "sporchi" e le pagine impaginate, tipo la seconda pagina qui come esempio, hanno questo tipo di Url:
    miosito.it/index.php?pageNum_rsDvv=1&totalRows_rsDvv=4990

    Purtroppo Google li ha indicizzato molti. Dico purtroppo, perchè solo ora ce ne rendiamo conto che può causare (e sta causando) un incredibile quantità di duplicazione della stessa pagina per via del TotalRows che l'url indica alla fine.
    Pensate, ogni volta che si inserisce una nuova news questa seconda pagina (ma anche tutte le altre ovviamente !) guadagnerà un altro url, tipo : miosito.it/index.php?pageNum_rsDvv=1&totalRows_rsDvv=4991, -poi 4992, poi 4993 ... e via cosi ....

    Ora abbiamo trovato il modo per eliminare il finale TotalRows quindi possiamo modificare l'url cosi: miosito.it/index.php?pageNum_rsDvv=1, .... Il che, potrebbe anche andare ...., ma ecco, ora sono arrivata al problema attuale: come faccio ad eliminare dall'inicizzazione tutti gli url che invece sono già stati indicizzati anche 10-15 volte per la stessa pagina? (Infatti, VWT mi indica come url "duplicati")

    Per cancellare quelli già indicizzati, dovrei produrre il 404 (o 410) che però capiterebbe solo se cancellassi l'index.php stessa, il che non è possibile.

    Nei robots.txt forse? Tipo Disallow: /index.php?pageNum_rsDvv=1&totalRows_rsDvv=
    Ma questo, per quanto ne sappia io non li cancella (per quello ci vuole sempre e solo il 404 o 410) al massimo non li indicizza nel futuro quelli non ancora indicizzati.... però ... come si fa con gli url che invece, sono già stati indicizzati ?

    Cosa mi consigliate di fare ?

    Grazie mille


  • User Attivo

    Dovresti fare dei 404 di sicuro, ma poi, se non erro anche da strumenti per Webmaster di Google puoi comunicare che l'url non esiste più.


  • User

    Si, lo so, ma gli Urls esistono. Solo se cancellassi l'index.php sparirebbero. ... Poi, pensa anche alla credibile combinazione di urls che si sono formati in quel modo ... praticamente ogni pagina impaginata multiplicata per il "totalRows" ...
    Cmq, sto provando delle altre soluzioni, spero di poter bypassare in qualche modo il problema. In tutti i casi, grazie per qualsiasi suggerimento.


  • User Attivo

    Questo può esserti utile?
    http://www.regole-seo.com/url-rewrite-htaccess-nozioni-esempi
    non puoi costruire una regola ad hoc che se trova la & nell'url ti genera un 404? in questo modo sei sicura di avere solo un parametro..(premetto che non sono un grande esperto di url rewriting)