• User

    Problema con GWT: Sono stati trovati gravi problemi relativi allo stato del tuo sito.

    Buongiorno a tutti, sono nuovo del forum e mi presento subito con un bel problemino da risolvere... 😄

    Qualche mese fa ho costruito il mio sito personale chrissoft.it e, sapendone ancora non troppo di indicizzazioni e SEO, ho lasciato che google facesse il suo lavoro senza indirizzarlo in nessun modo (utilizzo il CMS Joomla). Nel frattempo, siccome parlavo di argomenti molto diversi tra di loro, ho deciso di spostare una parte del sito, che era cresciuta in maniera considerevole (parla di escursionismo), su un nuovo dominio, pesarotrekking.it
    Da questo momento sono iniziati i problemi, infatti le pagine erano state indicizzate con il vecchio url (peraltro pure con versioni diverse, avendo io attivato gli url SEF solo in un secondo momento), e rimanevano presenti nella SERP, peraltro togliendo il posto alle pagine del nuovo sito, le cui pagine venivano scartate come confermato da GWT (non selezionate).
    Ho tentato di risolvere il problema con dei redirect, prima fatti con il componente integrato di joomla (ma purtroppo pare fossero dei 303), poi con dei 301, senza ottenere miglioramenti, anzi si notava una lieve penalizzazione sulle query.
    A questo punto sono intervenuto direttamente con la rimozione degli url dallo strumento apposito in GWT, il risultato è stato si di ottenere (dopo molti tentativi, perchè uscivano in continuazione i doppioni, alla fine ho rimosso 84 url) la sparizione dalla SERP delle pagine indesiderate, e anche l'indicizzazione delle pagine del nuovo sito, MA contemporaneamente sul dominio chrissoft.it è comparsa la scritta "Sono stati trovati gravi problemi relativi allo stato del tuo sito.", più precisamente alla voce "pagine importanti rimosse".

    Sono passati alcuni giorni, non ho trovato modo di far capire a google che quelle pagine in realtà non sono importanti per il sito chrissoft.it ed andavano effettivamente rimosse, peraltro giusto stamattina ho notato una NETTA penalizzazione di pesarotrekking.it in molte pagine su alcune delle query che controllo quasi quotidianamente.... Non vorrei che le due cose fossero correlate :arrabbiato:

    Chiedo quindi se qualcuno si sia mai trovato ad affrontare un problema simile e quale possa essere il metodo per risolverlo, grazie 🙂

    Christian


  • User

    Il problema permane, e quel messaggio di errore del webmaster tool è proprio brutto a vedersi...
    Avevo pensato di bloccare l'accesso a quelle pagine con robots.txt, forse questa mossa potrebbe convincere google che esse non esistono? 😄
    Solo che non vorrei fare un danno ulteriore, quindi non mi sono ancora mosso.... qualche consiglio?
    Grazie


  • Moderatore

    Ciao ChrisSoft e benvenuto sul forumGT,
    la procedura corretta per la rimozione di contenuti su un sito è quella prima di tutto di bloccare le pagine o con il robots (se non più esistenti) o tramite il meta tag robots, quindi fare la richiesta di rimozione dal GWT e attendere.

    Nel caso in cui il contenuto sia stato spostato su un altro dominio allora oltre la procedura che ti ho indicato effettui anche un 301 dalle vecchie pagine alle nuove.

    Ciao
    Enea


  • User

    Ciao e grazie per il benvenuto, io credo di aver un po' invertito i passi, facendo quindi confusione a google...
    Ho già richiesto la rimozione di questi contenuti con il GWT, e la cosa è andata a buon fine, però ho tolto i redirect 301 (perchè per la rimozione mi chiedeva come prerequisito che ci fossero delle pagine con errore 404) e soprattutto non ho bloccato l'indicizzazione mediante robots.
    Al momento dunque i contenuti sono deindicizzati, ma il GWT mi segnala gravi problemi con il sito.... se blocco adesso con robots posso migliorare la situazione?
    Grazie


  • Moderatore

    Allora usa il robots.txt, il 301 uno usalo se quelle pagine hanno link altrimenti lascia il 404.

    Ciao
    Enea


  • User

    Ci provo... spero di non fare n'altro casino perchè già secondo me m'ha penalizzato..... la verità è che non dovevo farlo indicizzare PRIMA ma oramai è tardi, quando sviluppavo il primo sito... non badavo all'indicizzazione e alla SEO 😄
    Ora blocco tutte le index.php e le directory incriminate, grazie 🙂

    Chris


  • User

    Ho inserito nel robots.txt queste righe:

    Disallow: /escursioni/
    Disallow: /monte-catria/
    Disallow: /monte-petrano/
    Disallow: /monte-nerone/
    Disallow: /index.php
    Disallow: /component/

    in questo modo dovrei avergli impedito l'indicizzazione delle directory che non sono più presenti sul sito (perchè spostate sull'altro), inoltre dovrei aver inibito pagine come queste, che sono ancora presenti nella SERP:

    /component/mailto/?tmpl=component&template=a4joomla-winter-free&link=a90afb6c59c311ccb87a05309bed3e8bbe4bf269
    /index.php?view=category&id=5%3Abusiness-general&option=com_newsfeeds&Itemid=49

    o queste, che sono invece state rimosse con il GWT:

    index.php?option=com_content&view=article&id=14:sentiero-53&catid=14:monte-catria&Itemid=122
    index.php?option=com_content&view=article&id=8:sentiero-70&catid=13&Itemid=116

    Ora devo aspettare che google sistemi (lentamente immagino) le cose..... anche perchè ancora se cerco il robots.txt su GWT mi vede quello vecchio...

    La mia domanda è: ho fatto tutto correttamente? 😄

    Grazie

    Chris


  • Moderatore

    Perché hai bloccato la index.php? Forse è meglio fare così:

    Disallow: /*?

    Così blocchi tutte le url con il punto di domanda.

    Poi dal pannello di controllo fai in modo che la pagina index.php punti alla home del sito, onde evitare contenuti duplicati.

    Ciao
    Enea


  • User

    Ok ho sostituito la riga, ora vediamo come la prende google... 😄
    Grazie mille per i consigli

    Chris


  • User

    Scusa Overclokk, oltre alla procedura che spero vada a buon fine su pesarotrekking, sto per replicare l'infausta esperienza con un'altra sezione del mio sito...
    Devo infatti spostare il contenuto della sottocartella "guadagno online" su un nuovo dominio, e questa volta vorrei evitare il casino precedente.
    La procedura giusta è dunque:

    • Blocco l'indicizzazione alla cartella con robots.txt
    • Faccio un redirect 301 al nuovo dominio
    • Chiedo la rimozione delle pagine indicizzate con GWT (ma come posso farlo se mi chiede di avere un errore 404 come prerequisito? se ho fatto il redirect l'errore 404 non esce...)

    E' questa la sequenza giusta? (penso sia l'ultima volta che agisco così, ma oramai il danno è fatto..)

    Grazie;)

    Chris


  • Moderatore

    Con il 301 mantieni i bl che hai su quelle risorse, anche se non hai bl è giusto far sapere a google che i contenuti sono stati spostati.

    Fossero tutti così i danni 😄

    Ciao
    Enea


  • User

    Beh guarda, su pesarotrekking il danno c'è (penalizzato non so perchè), e qualcosa mi dice che c'entra con il casino fatto per spostare i contenuti da chrissoft.... ora spero che questa volta mi vada meglio, anche perchè di la ancora il robots non sta facendo il suo effetto, e la scritta malefica dei gravi problemi permane immutabile:(

    Ciao
    Chris


  • User

    Continuano le mie liti con GWT....
    Dopo aver rimesso i 301, ora ricompaiono nella SERP, anche se con descrizione "indirizzo bloccato da robots.txt", alcune pagine "immondizia" di chrissoft.it
    Ad esempio questa qui:
    chrissoft.it/index.php?option=com_content&view=article&id=17:sentiero-56&catid=14:monte-catria&Itemid=124

    è ricomparsa stamattina, in seconda posizione per la query "sentiero 56 catria", sbattendo fuori dalla SERP la corrispondente (con contenuto identico) di pesarotrekking, che era lei in 2 posizione fino a ieri...

    facendo una interrogazione con site:chrissoft.it ne escono 7 o 8 di queste....... che palle, non si riesce a debellarle, ora richiedo la rimozione di nuovo...

    inoltre nell'elenco dei rimossi mi compaiono alcune delle richieste (prima erano tutte in stato "rimossa") con la dicitura "scaduta"
    se ci clicko mi reindirizza al sito pesarotrekking....

    Possibile che non ci sia modo di fargli capire le cose come stanno? 😄

    Chris


  • User

    Ogni giorno un nuovo aggiornamento dalla terribile lite con l'arcigno strumento di google :rollo:
    Ora che robots.txt blocca i contenuti da me indesiderati, il responso è :** Alcune pagine importanti sono bloccate dal file robots.txt
    Quindi non è che abbia riconsiderato l'importanza, ha solo cambiato il tipo di errore, ma continua a ritenere il mio sito in "gravi condizioni".......

    Esiste una soluzione logica? 😄

    Chris


  • User

    Credevo di aver risolto il problema con GWT e lo spostamento delle pagine dal vecchio al nuovo sito, giusto ieri è sparito il messaggio di "gravi errori relativi al sito" chrissoft.it, pensavo che google, con calma, avesse capito la situazione...
    Invece giusto stamattina è ricomparsa incredibilmente nella SERP una delle pagine che avevo rimosso a suo tempo perchè spostata sul nuovo dominio pesarotrekking.it, con questa descrizione:

    Sentiero 2 - ChrisSoft
    chrissoft.it/monte-nerone/sentiero-2.html
    Non è disponibile una descrizione per questo risultato a causa del file robots.txt del sito.

    Ora non so più come farglielo capire ❌x❌x:x

    Quella pagina era stata rimossa a suo tempo con una richiesta sul GWT ed era sparita dalla SERP, come si può vedere robots.txt la STAREBBE bloccando, la pagina è stata cancellata dal sito chrissoft.it e c'è un redirect 301 attivo che punta al nuovo indirizzo......

    Più di così che devo fare? e lui me la rimette in SERP (al primo posto per giunta), facendo perdere il posizionamento all'omologa su pesarotrekking.it che come d'incanto SPARISCE (la considera un duplicato di quella, visto che ha lo stesso contenuto...)

    Ora dovrò di nuovo A MANO ripassare tutti gli indirizzi e dirgli di rimuoverli... ma non è possibile andare avanti così...
    Se possibile è gradito un consiglio, grazie 😉

    Christian