• Moderatore

    Tutto ok gid, sono le url false generate dai 301 messi male dal primo (vecchio) sito, che hanno appunto fatto indicizzare url sballate sul secondo (e nuovo) sito.

    Ma abbiamo già corretto quella cosa, devi solo attendere che - lentissimamente - GWT aggiorni i suoi dati.

    Stai tranquillo, ora il vecchio sito rediretta bene e il nuovo sito ha tanto di canonical e tutto il necessario per indicizzarsi al meglio.

    :gthi:

    P.S. ... ah, pensavo che fossimo sul vecchio 3d che parlava dell'unificazione dei due siti.

    Per chi legge qui: tutte le url che presentano "?q=" sono state generate da una serie di 301 in ingresso da un altro dominio, redirect che invece di andare giù lisci portavano dei parametri sulla nuova url che riceveva la redirezione.

    Questa cosa è stata risolta in un altro 3D, ma può aiutarvi nella presente discussione.


  • Moderatore

    Grazie WWW per il tuo intervento, io non sapevo tutta la storia, ora si spiegano certi comportamenti 🙂


  • User Attivo

    Grazie WWW
    [URL=http://www.giorgiotave.it/forum/gt-world/101972-forum-gt-disponibile-alle-versioni-per-telefoni-cellulari.html]Postato via Mobile


  • User Attivo

    Riprendo i combattimenti... Intanto siccome con troppi errori non ci capisco molto... mi vorrei concentrare su un insieme di errori minore ed ho suddiviso il sito in cinque siti in funzione della lingua ed adesso mi dice

    bbfandf.com/ Nelle Sitemap ‎(2)‎ Non raggiungibile ‎(1)‎ Non trovato ‎(280)‎ Soggetto a restrizioni da robots.txt ‎(389)‎ Time out ‎(3)‎
    bbfandf.com/it/ Non trovato ‎(60)‎ Soggetto a restrizioni da robots.txt ‎(47)‎ Time out ‎(2)‎
    bbfandf.com/en/ Non trovato ‎(41)‎ Soggetto a restrizioni da robots.txt ‎(54)‎
    bbfandf.com/de/ Non trovato ‎(45)‎ Soggetto a restrizioni da robots.txt ‎(53)‎
    bbfandf.com/fr/ Nelle Sitemap ‎(1)‎ Non trovato ‎(46)‎ Soggetto a restrizioni da robots.txt ‎(51)‎ Time out ‎(1)‎
    bbfandf.com/es/ Nelle Sitemap ‎(1)‎ Non trovato ‎(47)‎ Soggetto a restrizioni da robots.txt ‎(43)‎

    adesso provo ad esaminare a fondo bbfandf.com/en/ che ha solo 41 non trovati

    /en/1140_filomena-e-francesca-bb/
    /en/1237-2/
    /en/643/last-minute-3333.html
    /en/738/english-first-minute.html
    /en/963_hospitals/
    /en/967_streets-and-squares/
    /en/articoli/
    /en/book/recensioni
    /en/camere/balcone
    /en/camere/camera-cortile
    /en/camere/cortile
    /en/category/info/hospitals/
    /en/category/luoghi/piazze-e-vie/
    /en/category/luoghi/streets-and-squares/
    /en/category/streets-and-squares/
    /en/comments/feed
    /en/comments/feed/
    /en/event
    /en/eventi
    /en/events
    /en/fandf-bed-and-breakfast-rome
    /en/fandf-bed-and-breakfast-rome/
    /en/fandf-bed-and-breakfast-rome/feed/
    /en/fandf-bed-and-breakfast-rome?q=rom%2Fzimmer-fandf-bed-and-breakfast%2Fservice.htm
    /en/fandf-bed-and-breakfast-rome/?q=rome%2Fbed-and-breakfast%2Four-services.htm
    /en/information-and-contacts/domande-e-risposte
    /en/informazioni-e-contatti
    /en/informazioni-e-contatti/domande-e-risposte
    /en/informazioni-e-contatti/recensioni
    /en/in-rom
    /en/login
    /en/prenota/domande-e-risposte
    /en/prenota/recensioni
    /en/roma/come-arrivare
    /en/rom/come-arrivare
    /en/rooms/camera-balcone
    /en/rooms/camera-cortile
    /en/rooms/camera-giuliana
    /en/welcome/bb-rome-olympic-stadium/
    /en/xmlrpc.php
    
    

    mi sono scaricato questa tabella come foglio di calcolo ed esamino gli errori che sono successivi al 15 novembre (data di attivazione del robots,txt)

    rilevato il 16 novembre trovo /en/xmlrpc.php che è riferito da www . giorgiotave . it/forum/918504-post9.html

    questo errore me lo darà sempre come non trovato perché il file non esiste...
    non ho capito se è meglio metterlo nel robots.txt o fare altro o tenermelo così e basta... :?:?

    Gli altri errori sono antecedenti al 9 Ottobre e quindi penso siano stati risolti...


  • Moderatore

    Cosa vuol dire che hai suddiviso il sito in 5 siti?

    Per gli altri errori devi avere pazienza, GWT impiega anche mesi per aggiornare gli errori trovati, se invece vedi che (fra qualche tempo) alcuni errori persistono aggiungi le rige al robots.txt come ti ho fatto vedere.

    Ciao
    Enea


  • User Attivo

    @overclokk said:

    Cosa vuol dire che hai suddiviso il sito in 5 siti?

    Vuol semplicemente dire che
    bbfandf.com/it/ bbfandf.com/en/ bbfandf.com/de/ bbfandf.com/fr/ bbfandf.com/es/

    non hanno (almeno lo spero) link che li collegano tra di loro... o meglio li hanno ma col nofollow

    che ho attivato strumenti per il web master per queste cinque cartelle

    e che ho anche 5 analytics diversi per le varie lingue

    posso dire che i risultati di ricerca organici dell'ultimo mese sono

    bbfandf.com/it/ 696
    bbfandf.com/en/ 304
    bbfandf.com/de/ 35
    bbfandf.com/fr/ 27
    bbfandf.com/es/ 27

    infatti mi chiedevo se è meglio che lascio perdere con de fr es per concentrarmi esclusivamente su en ed it:?

    siccome sto cercando di puntare al mercato estero vorrei arrivare almeno al 50% degli stranieri rispetto agli italiani mentre adesso le visite dall'italia sono circa il 75%

    p.s. ci sei dopodomani al gtstudy di roma?


  • Moderatore

    @gdatri said:

    non hanno (almeno lo spero) link che li collegano tra di loro... o meglio li hanno ma col nofollow

    Anche se nofollow è comunque un link.

    @gdatri said:

    che ho attivato strumenti per il web master per queste cinque cartelle

    e che ho anche 5 analytics diversi per le varie lingue

    Cioè in un unico account li hai impostati come se fossero 5 siti separati, sia sul GWT che su analytics?
    Ad ogni modo non ne capisco l'utilità.

    @gdatri said:

    infatti mi chiedevo se è meglio che lascio perdere con de fr es per concentrarmi esclusivamente su en ed it:?

    Questo dipende da te se ti interessa quel particolare mercato.

    @gdatri said:

    siccome sto cercando di puntare al mercato estero vorrei arrivare almeno al 50% degli stranieri rispetto agli italiani mentre adesso le visite dall'italia sono circa il 75%

    Ma a sto punto non ti conviente acquistare direttamente un dominio per ogni nazione di tuo interesse e creare un sito in lingua?

    @gdatri said:

    p.s. ci sei dopodomani al gtstudy di roma?
    No, non ci sarò purtroppo, me lo seguirò via twitter e streaming.

    Ciao
    Enea


  • User Attivo

    @overclokk said:

    non hanno (almeno lo spero) link che li collegano tra di loro... o meglio li hanno ma col nofollow
    Anche se nofollow è comunque un link.

    Avevo capito che era meglio se le pagine straniere venivano linkate dalla pagina italiana con un nofollow

    @overclokk said:

    Cioè in un unico account li hai impostati come se fossero 5 siti separati, sia sul GWT che su analytics?
    Ad ogni modo non ne capisco l'utilità.

    è per seguire meglio come stanno andando le visite relative alle pagine in lingua straniere...

    @overclokk said:

    infatti mi chiedevo se è meglio che lascio perdere con de fr es per concentrarmi esclusivamente su en ed it
    Questo dipende da te se ti interessa quel particolare mercato.

    Il problema è che se c'è tanto lavoro da fare potrei farlo male ed allora mi domandavo se è meglio due lingue fatte bene o cinque lingue fatte peggio..

    @overclokk said:

    siccome sto cercando di puntare al mercato estero vorrei arrivare almeno al 50% degli stranieri rispetto agli italiani mentre adesso le visite dall'italia sono circa il 75%
    Ma a sto punto non ti conviente acquistare direttamente un dominio per ogni nazione di tuo interesse e creare un sito in lingua?

    allora visto che il mio dominio è un punto com... potrei prendere il punto it per la sola lingua italiana... ma mi si complica tutto... per ora mi accontento delle dir separate...


  • User Attivo

    Oggi GWT mi dice...

    mi dice non trovato

    /de/rooms/francys-house-holiday-apartment/function.include-once
    /de/rooms/francys-house-holiday-apartment/function.require
    /de/rooms/francys-house-holiday-apartment/function.include

    richiamati il 26 novembre da

    /de/rooms/francys-house-holiday-apartment/

    ma se faccio visualizza html... quei richiami a funcion non li vedo...


  • Moderatore

    @gdatri said:

    Il problema è che se c'è tanto lavoro da fare potrei farlo male ed allora mi domandavo se è meglio due lingue fatte bene o cinque lingue fatte peggio..

    Ovviamente è meglio due lingua fatte bene 😉

    @gdatri said:

    Oggi GWT mi dice...

    mi dice non trovato

    /de/rooms/francys-house-holiday-apartment/function.include-once
    /de/rooms/francys-house-holiday-apartment/function.require
    /de/rooms/francys-house-holiday-apartment/function.include

    richiamati il 26 novembre da

    /de/rooms/francys-house-holiday-apartment/

    Aggiungi la stringa al robots.txt per bloccare queste pagine.

    Ciao
    Enea


  • User Attivo

    va bene mettere Disallow: /*function. ?

    oppure anche

    Disallow: /*function.include
    Disallow: /*function.require


  • Moderatore
    Disallow: /*function
    

    Questa si usa in caso tu voglia bloccare file che finiscono con function, o che abbiano la parola function in mezzo simile a questo:

    tuosito.com/cartella/file-function.html
    tuosito.com/cartella/file-function-pagina.html
    

    Senza asterisco blocchi tutti i file che iniziano con il termine function.

    Se vuoi bloccare solo quei file la stringa corretta è:

    Disallow: /function
    

    Per le cartelle invece si mette lo / sia all'inizio che alla fine della parola.

    Ciao
    Enea


  • User Attivo

    se ho capito bene...
    devo mettere Disallow: /*function
    e lo metto 😉


  • Moderatore

    No, è l'ultima stringa che ho scritto 🙂


  • User Attivo

    non lo avevo capito...
    adesso ho corretto...
    sono sette giorni che non trova nessuna pagina errata 😉


  • User Attivo

    Caro Enea

    Continuo a cercare di migliorare la situazione...

    nella mia sitemap oggi figurano 171 pagine (che sono le pagine del mio sito degne di essere indicizzate perché hanno dei contenuti)...
    GWT dice che di queste ne ha indicizzate 161...

    se invece faccio site:
    mi da 264 risultati che diventano 641 se si chiedono anche le pagine molto simili...

    alcune pagine non avrebbe dovuto indicizzarle... ed abbiamo modificato il robots.txt perché in futuro non le indicizzi

    ma adesso mi ritrovo pagine uguali come queste due

    http:// www . bbfandf . com/rooms/balcony/?q=rome%2Fbed-and-breakfast%2Fbalcony-room.htm&show=slide
    http:// www . bbfandf . com/en/rooms/balcony/

    me le tengo così (anche considerando che nella pagina che dovrei eliminare c'è un <link rel='canonical' href='http:// www . bbfandf . com/en/rooms/balcony/' />

    oppure mi armo di santa pazienza ed utilizzo lo strumento rimuovi url di GWT:?


  • Moderatore

    Ciao Gdatri

    @gdatri said:

    Continuo a cercare di migliorare la situazione...

    Ottimo.

    @gdatri said:

    nella mia sitemap oggi figurano 171 pagine (che sono le pagine del mio sito degne di essere indicizzate perché hanno dei contenuti)...
    GWT dice che di queste ne ha indicizzate 161...

    Questo è normale, GWT molto spesso non indicizza l'intero sito.

    @gdatri said:

    se invece faccio site:
    mi da 264 risultati che diventano 641 se si chiedono anche le pagine molto simili...

    Queste sono le pagine indicizzate precedentemente ai lavori di ristrutturazione del sito, piano piano verranno tolte dall'indice.

    @gdatri said:

    alcune pagine non avrebbe dovuto indicizzarle... ed abbiamo modificato il robots.txt perché in futuro non le indicizzi

    Bene.

    @gdatri said:

    ma adesso mi ritrovo pagine uguali come queste due

    http:// www . bbfandf . com/rooms/balcony/?q=rome%2Fbed-and-breakfast%2Fbalcony-room.htm&show=slide
    http:// www . bbfandf . com/en/rooms/balcony/

    me le tengo così (anche considerando che nella pagina che dovrei eliminare c'è un <link rel='canonical' href='http:// www . bbfandf . com/en/rooms/balcony/' />

    oppure mi armo di santa pazienza ed utilizzo lo strumento rimuovi url di GWT:?

    Il canonical c'è, ok.
    Con il robots sono state bloccate le url che iniziano con il "?".
    Col tempo verranno deindicizzate, se vuoi accellerare i tempi puoi cominciare ad eliminarle tu, ma non è indispensabile.

    Ciao
    Enea


  • User Attivo

    Domanda....

    Disallow: /roma/

    mi blocca anche

    http:// www . bbfandf . com/it/roma/ ?

    se la risposta è sì... come faccio a bloccare

    http:// www . bbfandf . com/roma/ e tutti i files e le cartelle che stanno sotto a questa cartella ?


  • Moderatore

    Disallow: /roma/ blocca solo la cartella roma e tutti i file ivi contenuti.

    Se tu hai /it/roma/ la cartella /it/ non è bloccata.

    Ciao
    Enea