• User

    Ciao Morettolss, grazie mille per l'analisi e i consigli! Procedo per gradi...

    La modifica del robots.txt relativa ai file css e js é avvenuta dopo il problema dei 7 giorni. Comunque sia, dato che non ho riscontrato nessun giovamento, ora elimino il blocco.

    Come dicevo all'inizio del post, il sito é online da 4 anni. Negli ultimi 2 anni siamo sempre stati attenti a proporre contenuti originali scritti di mano nostra. Nei primi due anni di vita del sito, invece, data l'iniziale inesperienza, come hai giustamente riscontrato nel post (tvdream.net/show-tv/wind-music-awards-2010-in-diretta-streaming/), i contenuti erano di bassa qualità: descrizione brevi e a volte riprese da altri siti web. Questi articoli (circa 500), sono tutt'ora online ma attualmente non vengono linkati più all'interno del nostro sito se non dalla sitemap. Sono rimasti online solo perchè si trovano ben posizioni su Google.

    Se decidessimo di cancellarli tutti, a cosa potremmo andare incontro? Numerosi 404 potrebbero creare altri problemi?


  • User Attivo

    Prendendo sempre come esempio quel link nella sitemap (tvdream.net/sitemap.xml) viene identificata come data di modifica il 2012-07-02 17:14, cioè ieri. Questo contenuto in realtà è fermo da anni, per cui credo ci siano dei problemi nella generazione della sitemap, perché vai a riproporre a Google contenuti vecchi e duplicati.

    I contenuti sono talmente vecchi che Google non ci passerà più, se li rimuovi non dovresti incorrere in problemi, solo tanti 404 che faranno confusione nel webmaster tools, ma le cose si sistemeranno, ma già non linkandoli, nemmeno dalla sitemap, non dovresti avere problemi.
    Puoi eliminare quelle pagine con un noindex o rimuovendole dal Webmaster Tools per stare più sicuro.

    Ma, per me, il problema principale sta nel fatto che li hai riproposti attraverso la sitemap.

    In ogni articolo hai inserito del link esterni senza nofollow, hai controllato i link in uscita che metti?

    Ho notato che sei iscritto ad alcuni aggregatori, controlla se ti sono veramente utili, altrimenti rimuovi l'iscrizione.

    Anche i link in entrata non mi sembrano il massimo, ne ricevi alcuni da siti cinesi come hao0039.com oppure da siti come questo mytechnology.eu/2009/01/19/lista-di-siti-che-offrono-films-in-streaming-gratuitamente/ (controlla gli altri link in uscita che ha messo). Anche qui puoi cercare di fare un po' di pulizia.


  • User

    Ora che ci penso, sai perchè questi articoli vecchi si sono riproposti nella sitemap?

    Qualche mese fà ho voluto dare una ripulita ai tag. Ho iniziato quindi con gli articoli più datati. Tolti i tag in eccesso, ho aggiornato ogni articolo per far prendere le modifiche a Wordpress.

    Il plugin XML-Sitemap, come hai riscontato anche tu, a quanto pare ha riproposto gli articoli in questione a Google, ma in realtà effettivamente una modifica "reale" non c'é stata. Ho fatto questa operazione per centinai di articoli!

    Sarà questo il motivo del problema? Anche come tempi tutto coinciderebbe... Credo che eliminerò tutti gli articoli fisicamente dal database, avendo cura di far restituire un corretto 404. Questo non dovrebbe bastare?

    Nei link in uscita uso il nofollow solo se la fonte non é "autorevole", altrimenti faccio seguire i link a Google tranquillamente.

    Per quanto riguarda gli aggregatori, é la prima cosa a cui ho pensato... sono da settimane che mi sto adoperando in tal senso. Proprio ieri ho fatto rimuovere il sito anche da Liquida....


  • User Attivo

    Potrebbe essere quello il problema, prova a fare la modifica e vediamo.

    Ma perché hai rimosso i tag se avevi già inserito il disallow e comunque non li vedo linkati?


  • User

    Oltre alla puliza, c'é da dire che uso i tag per listare gli articoli nelle pagine (categorie) raggiungibili dal menù.

    Mesi fà avevo intenzione di associare tutti questi articoli vecchi con determinati tag e listarli in delle nuove sezioni. Quindi ho iniziato a modificare i tag e aggiornare gli articoli come ti ho detto prima. Poi per motivi vari ho lasciato tutto in sospeso. A questo punto, credo sia meglio eliminare tutto dato che comunque si tratta di contenuti di bassa qualità.

    Ho un dubbio: se cancello tutti gli articoli, non rischio di generare 404 permanenti a causa di siti esterni che linkano questi URL? Ad esempio, tra questi URL da eliminare, molti sono linkati su Yahoo Answers, Forum, Blog,etc. Chiedere la rimozione di tutti i singoli link é follia pura 🙂 Sui 404 che genero io all'interno del sito posso intervenire, ma per i siti esterni come faccio?

    Ti ringrazio per tutti i consigli che mi stai dando!


  • User Attivo

    Puoi usare i redirect 301 oppure chiedere ai singoli siti di rimuovere o sistemare il link.


  • User

    Il redirect 301 verso dove? In passato l'ho usato quando ho spostato un contenuto da un URL ad un altro... In questo caso l'unica soluzione che mi viene in mente é fare un redirect di massa verso la homepage ma non so se può essere controproducente..


  • User Attivo

    Il 301 lo vedrei come ultima soluzione però, in ogni caso verso la home.

    Un 404 non dovrebbe dare problemi.


  • User

    Oppure potrei procedere cosi per ora...

    Tag "noindex,nofollow" all'interno dell'head negli articoli in questione ( <meta name="robots" content="noindex,nofollow"> )

    Tanto gli articoli si trovano tutti in 4 categorie che non aggiorno da anni. Quindi metto dentro l'header.php una condizione in php che se il post é tra queste 4 categorie compare il "noindex/nofollow" nell' head, altrimenti indicizza.

    Se noto miglioramenti, vuol dire che abbiamo individuato il problema e magari poi passo all'eliminazione della pagine...

    Che ne pensi?


  • User Attivo

    Anche io procederei così, hai sistemato la sitemap invece?


  • User

    Ancora no..spero che il plugin "XML Sitemap Generator" tra le sue opzione dà la possibilità di escludere tutti gli articoli di determinate categorie..


  • Moderatore

    Salve darkos1,
    se hai sperimentato un ritardo di 7 giorni costante nel tempo, probabilmente merita riflettere sulla parte tecnica.

    In particolare ti consiglio di leggere questi 2 post (possibilmente con relativi thread):

    Puoi approfondire la questione a livello tecnico oppure rimpiazzare i due plugin con altri simili ma (a mio modo di vedere) decisamente più performanti: via WP Super Cache (con attenta rimozione di ogni codice) ed al suo posto W3 Total Cache; via All in One SEO Pack ed al suo posto WP SEO by Yoast (che ha la funzione per importare automaticamente tutte le configurazioni in uso da All in One SEO Pack).

    Così facendo, se non altro, avrai migliorato i plugin che utilizzi.
    Puoi anche semplicemente provare a disattivare WP Super Cache coi suoi vari codicilli per vedere se la situazione migliora in qualche giorno.

    Ti auguro buona lettura e buon lavoro.


  • User

    Dopo qualche giorno di lavoro, torno ad aggiornare questo post... Ringrazio nuovamente morettolss e i gli interessanti nuovi consigli di LaBussola.

    Ad oggi ecco le modifiche che ho fatto:

    • Ho inserito il tag "noindex,nofollow" negli articoli di bassa qualità (circa 400). Quindi ho escluso gli URL in questione dalla sitemap e rinviato il tutto a Google. Adesso rimangano solo articoli originali (circa 500), forse un paio da riscrivire... controllerò in seguito.
    • Dopo una attenta documentazione, ho sostituito il plugin "WP Super Cache" con "W3 Total Cache" e riconfigurato il server.
    • In giornata spero di riuscire a sostituire anche "All in One SEO Pack" con "WP SEO by Yoast".

    In attesa di vedere come si evolve la situazione, se avete altri consigli sono ben accetti! 🙂


  • User

    AGGIORNAMENTO 10 LUGLIO

    I cambiamenti effettuati in questi giorni hanno migliorato la situazione:

    • Ieri, pubblicando 1 nuovo articolo, dopo qualche minuto risultava indicizzato e ben posizionato nella SERP di Google.
    • Oggi, pubblicando 2 nuovi articoli, dopo qualche minuto il primo risulta indicizzato e ben posizionato in SERP, il secondo risulta indicizzato ma non ha preso posizione nella SERP. Ricercando il secondo articolo con una query di parole chiavi, invece dell'articolo stesso, compare l'homepage del sito.

    Sicuramente un miglioramento c'é stato... prima anche il primo articolo della giornata prendeva posizione in SERP dopo 7 giorni.

    Domani faremo un altro test, pubblicando altri 2 articoli, in modo da stabile se adesso c'é un problema dal secondo articolo in poi...