• User

    Cambio url

    Salve,
    sono nuovo del forum e non riesco a capire perchè non mi fa creare una discussione nella sezione "Indicizzazione", comunque..
    ho un problema che mi affligge da un bel po', e ancora non riesco a venirne a capo: da circa 6 mesi ho deciso di aggiungere un parametro a diversi link del mio sito, e voglio che questo nuovo parametro spunti nei risultati di ricerca: quindi ho aggiunto un Redict 301 alle pagine che non possedevano quel parametro, e ho modificato la sitemap.
    Da allora Google ha mantenuto indicizzate le vecchie pagine, senza quel parametro: sicuramente li ha considerati duplicati, ma il redict 301 non avrebbe dovuto risolvere questo problema?
    Ho anche impostato nel Google Webmaster Tools di scansionare tutte le pagine con quel dato parametro (che cambia di pagina in pagina), ma nulla.
    Non so più che fare.
    Sto anche pensando di "bloccare" le pagine senza quel parametro, dando un messaggio d'errore: in questo modo Google sarebbe costretto a usare le pagine con quel parametro; è comunque una soluzione che vorrei evitare, in quanto temo che potrebbe notevolmente peggiorare la situazione, dato che quasi tutte le pagine attualmente indicizzate sono senza quel parametro e quindi agendo in quel modo bloccherei quasi tutto il sito.
    Aiuto!!


  • Moderatore

    Ciao lordams, Benvenuto nel Forum GT
    @lordams said:

    da circa 6 mesi ho deciso di aggiungere un parametro a diversi link del mio sito, e voglio che questo nuovo parametro spunti nei risultati di ricerca: quindi ho aggiunto un Redict 301 alle pagine che non possedevano quel parametro, e ho modificato la sitemap.
    Da allora Google ha mantenuto indicizzate le vecchie pagine, senza quel parametro: sicuramente li ha considerati duplicati, ma il redict 301 non avrebbe dovuto risolvere questo problema?
    Senza un URL da esaminare (puoi condividerlo?) posso fare solo delle congetture.
    Il parametro è presente nella struttura di link interni? Usi il meta link Canonical?

    @lordams said:

    Ho anche impostato nel Google Webmaster Tools di scansionare tutte le pagine con quel dato parametro (che cambia di pagina in pagina), ma nulla.
    Scusa, non mi è chiaro, cosa hai fatto di preciso in GWT?

    P.S.: confesso sono un po' incuriosito sullo scopo del parametro...


  • User

    Il sito è questo: corsoinglese.altervista.org e la pagina in questione è lezione.php, che ha due parametri: id e grammatica. Su Google solo le ultime 50 pagine hanno il parametro grammatica, ma solo perchè le ho aggiunte recentemente e quindi Google le ha viste già con quel parametro. Comunque il parametro è presente nella struttura interna dei link, ma non uso il meta link canonical (non ne conoscevo l'esistenza! Ora, cercando in rete, ho scoperto a cosa serve e quindi lo userò).

    Comunque il parametro ha il solo scopo di migliorare la posizione su Google: facendo diverse prove ho scoperto che lezione.php?id=3&grammatica=present-simple è molto meglio rispetto a lezione.php?id=3 !! Ho notato che grazie al parametro grammatica si recuperano tantissime posizioni, è per questo che voglio risolvere il problema.

    In ogni caso grazie molte per la disponibilità.

    Edit: dimenticavo: avevi chiesto cosa avessi fatto col Webmasters Tools: lì è presente una sezione che permette di decidere quale comportamento deve assumere Google in presenza dei parametri degli url: io ho impostato che deve scansionare tutte le pagine con il parametro "grammatica".


  • Moderatore

    ciao lordams,
    @lordams said:

    ... il parametro ha il solo scopo di migliorare la posizione su Google: facendo diverse prove ho scoperto che lezione.php?id=3&grammatica=present-simple è molto meglio rispetto a lezione.php?id=3 !! Ho notato che grazie al parametro grammatica si recuperano tantissime posizioni, è per questo che voglio risolvere il problema.
    Ah, chiaro. In pratica stai usando un parametro in querystring per trasformare l'URL non una forma più "SEO/User friendly".
    Di solito si preferiscono tecniche di URL-rewriting in cui uno slug, l'equivalente del valore del tuo parametro grammatica, sostituisce completamente la prima parte del percorso (nel tuo caso "lezione.php?id=xxx&grammatica=").

    La tua tecnica non ha motivo di non funzionare, è di sicuro un miglioramento rispetto al solo codice numerico. Ha il difetto di rendere l'URL un po' più verboso e di avere la parte di percorso corrispondente alle keyphrase un po' troppo a destra.
    Se non intendi implementare un rewrite completo dell'URL (non uso php, non saprei indicarti come fare), potresti lenire il problema sia riducendo il secondo parametro a un singolo carattere, sia antecedendo il parametro parlante rispetto all'id.

    Un altro piccolo suggerimento: cerca di evitare di chiamare dei parametri di querystring semplicemente "id".
    Google sicuramente gestisce bene il tuo caso, ma il nome "id" è (era?) usato da alcune piattaforme server come parametro di sessione cookieless, e i motori di ricerca devono capire se ignorarlo o no.
    Nota: è un "di più", e probabilmente ormai non causa più problemi.

    @lordams said:

    Edit: dimenticavo: avevi chiesto cosa avessi fatto col Webmasters Tools: lì è presente una sezione che permette di decidere quale comportamento deve assumere Google in presenza dei parametri degli url: io ho impostato che deve scansionare tutte le pagine con il parametro "grammatica".
    Probabilmente ti è già chiaro, lo esplicito per sicurezza:
    La sezione "Scansione -> Parametri URL" di GWT indica come trattare i parametri di querystring una volta incontrati, non permette di "ordinare" la visita di URL con tali parametri.

    Il "prenotare" (non "ordinare) una visita a degli URL è compito delle xml sitemaps.
    Però hai - giustamente - aggiornato la sitemap con gli URL nella nuova forma. Il problema è che Google non ha modo di scoprire i 301 se non operando un periodico controllo sugli URL indicizzati (e non è facile sapere quando lo farà). Non possiamo quindi controllare quando incontrerà i redirect e così capire di dover aggiornare l'indice trasferendo l'equity dei vecchi URL ai nuovi.

    Dalla sezione "Scansione -> Statistiche di scansione" puoi farti un'idea di quanto sovente googlebot visita il tuo sito, e quanti URL visita ogni volta. Se i numeri sono piccoli, potrebbe necessitare di diversi giorni prima di riuscire a rivisitare i vecchi URL e apprendere dei redirect 301 (anche se vedo solo 124 pagine indicizzate, sei mesi dovrebbero essere sufficienti).

    Una tecnica che uso in questi casi - non incoraggiata da Google - è creare una sitemap temporanea sitemap-old.xml (poi avere quante sitemap vuoi) con i vecchi URL, ne faccio il submit, così da accelerare il processo.

    Spero d'esserti stato utile


  • User

    Ciao Federico e grazie per aver risposto,
    come hai capito il parametro "grammatica" ha l'unico scopo di migliorare la posizione in ricerca, e non è quindi funzionale dal punto di vista del codice.

    Mi hai consigliato di scegliere un secondo parametro più corto, ma ho scelto "grammatica" perchè spesso le queries degli utenti contengono proprio quella parola, e quindi anche questa scelta è finalizzata a migliorare il posizionamento.

    Grazie per avermi spiegato il funzionamento della sezione "Parametri URL" del GWT, ma comunque sapevo già a cose servisse.

    In ogni caso, controllando la cache di Google, ho visto che gli ultimi aggiornamenti delle pagine risalgono a metà Luglio, quindi Google ha avuto tutto il tempo di accorgersi del 301; tuttavia non ha funzionato.

    Ora sto provando a giocare un'altra carta: ho bloccato una delle pagine che su Google non hanno il parametro "grammatica", dando un messaggio d'errore; teoricamente, in questo modo, Google sarà costretto a indicizzare l'altra pagina (quella contenente il parametro in questione). Ovviamente ho usato una delle pagine meno visitate, per prova. Vedrò se funziona..


  • Moderatore

    ciao lordams,
    mi fa piacere vedere che "te le pensi tutte" 🙂

    @lordams said:

    In ogni caso, controllando la cache di Google, ho visto che gli ultimi aggiornamenti delle pagine risalgono a metà Luglio, quindi Google ha avuto tutto il tempo di accorgersi del 301; tuttavia non ha funzionato.
    Hai provato a diagnosticare la correttezza del response con "Crawl -> Fetch as Google"?
    E' il modo più affidabile per togliersi il dubbio. Puoi anche scegliere "Send to index" (se ben ricordo dovrebbe funzionare anche se il response è diverso da 200, p.es. un redirect, sennò alla peggio non te lo fa fare).

    @lordams said:

    Ora sto provando a giocare un'altra carta: ho bloccato una delle pagine che su Google non hanno il parametro "grammatica", dando un messaggio d'errore; teoricamente, in questo modo, Google sarà costretto a indicizzare l'altra pagina (quella contenente il parametro in questione).
    Come l'hai bloccato? Ritornando lato server un errore 500?
    Mi sembra un po' pericoloso.
    L'uso del canonical tag è più sicuro (se il 301 per qualche motivo non è correttamente implementabile).

    Facci sapere


  • User

    Ciao Federico,

    Hai provato a diagnosticare la correttezza del response con "Crawl -> Fetch as Google"?
    E' il modo più affidabile per togliersi il dubbio. Puoi anche scegliere "Send to index" (se ben ricordo dovrebbe funzionare anche se il response è diverso da 200, p.es. un redirect, sennò alla peggio non te lo fa fare).

    Avevo già provato usando il tool "Live HTTP Headers" di Firefox, e mi rispondeva correttamente con il 301. Ora per scrupolo ho controllato anche con WGT, e tutto sembra funzionare:

    
    **Visualizza come Google**
    
    Googlebot ha recuperato la pagina in questo modo.
    
    **URL:** corsoinglese.altervista.org/lezione.php?id=3
    **Data:** mercoledì 7 agosto 2013 04:08:16 GMT-7
    **Tipo Googlebot:** Web
    **Tempo di download (in millisecondi):** 402
    
    
    HTTP/1.1 301 Moved Permanently
    Server: cloudflare-nginx
    Date: Wed, 07 Aug 2013 11:08:20 GMT
    Content-Type: text/html
    Transfer-Encoding: chunked
    Connection: keep-alive
    Set-Cookie: __cfduid=d7e1743c6116032d454be04138bc21b351375873699974; expires=Mon, 23-Dec-2019 23:50:00 GMT; path=/; domain=.corsoinglese.altervista.org
    Location: lezione.php?id=3&grammatica=genitivo-sassone
    CF-RAY: 9a38220d453059d
    
    

    Quindi non ho idea di cosa non vada bene..

    Come l'hai bloccato? Ritornando lato server un errore 500?
    Mi sembra un po' pericoloso.
    L'uso del canonical tag è più sicuro (se il 301 per qualche motivo non è correttamente implementabile)

    No, mi sono espresso male; non l'ho bloccato dal server, restituisco solo un messaggio del tipo "L'url cercato è stato spostato a questa pagina: xxx". Se vuoi dare un'occhiata la pagina in questione è questa: corsoinglese.altervista.org/lezione.php?id=28 . So che corro il rischio di non vedere più quella pagina nell'indice di Google, ma ho scelto una delle meno visitate e non mi comporterà problemi. In questo caso, tentar non nuoce!