• Moderatore

    @Juanin said:

    Dimenticavo....ho visto anche che stai dando in pasto questa roba http://www.naturazen.org/lampada-sale-himalaia-conca-di-fuoco-03/ e non so quanto abbia senso.
    Ciao e mille grazie per il tuo aiuto... prima di tutto rispondo a questa semplice domanda. Questa immagine appartiene ad una pagina perché in passato ho venduto anche questo prodotto ( e probabilmente in futuro lo farò ancora)
    e fa riferimento a questa pagina http://www.naturazen.org/spiritualita/lampade-di-sale-himalaya/
    A tuo avviso possono esserci problemi?


  • Moderatore

    Ciao Ramses Giorgio mi ha segnalato questa discussione e me l'ha sintetizzata perché in questo momento sono incasinato, ma da un'occhiata veloce posso dirti quanto segue:
    Ciao Andrea grazie della tua cortesia! Mi dispiace aver fatto tanto trambusto però, credo sia anche una esperienza utile per tutti quelli che debbano affrontare un cambio di dominio, template, e altri fattori (tra cui anche sicuramente un poca di Negative Seo)

    • il sito ha un Time To First Byte molto alto. Si aggira infatti sui 600 ms e 1 secondo quindi ti consiglio di attivare qualche forma di caching sul tuo Wordpress.
      Probabilmente sei entrato questo pomeriggio quando abbiamo disattivato il CometCache per fare dei test relativi ad un htaccess che non funziona per niente (dopo ti spiego sotto)
    • il sito blocca la cartella /wp-admin/ nel robots.txt, ma è sbagliato per vari motivi. Uno su tutti è che il tuo frontend via JS accede a risorse in quella cartella. Inoltre espone le tue cartelle di admin qui trovi più info http://seoblog.giorgiotave.it/seo/wordpress#robotstxt
      l'abbiamo disabilitita adesso così vediamo se va meglio
    • qualora volessi passare ad HTTPS quello che devi fare è cambiare tutti i redirect dal sito vecchio verso la versione https del sito nuovo + fare tutti i redirect dalla versione http del sito nuovo a quella https. In sostanza il primo redirect deve mandare direttamente all'url finale senza passi intermedi.
      dal sito vecchio intendi http viverezen ---> https naturazen? e se sì, cosa fare di tutti i link che già sono sulla SERP di Google a nome http naturazen? In pratica adesso con questo cambio dominio c'è un bel minestrone pieno di pagine indicizzate su http viverezen e altre su http naturazen. Cosa è opportuno fare a questo punto?

    Fammi sapere se hai bisogno di altro.
    Si, vorrei chiederti un paio di cose: su viverezen avevo delle pagine che attraverso un plugin (magari è quello che ha fatto casini) ho modificato in articoli per organizzarli meglio. Poi su htaccess di viverezen ho messo i redirect 301 tipo così:
    Redirect 301 /semi-di-chia-proprieta-nutrizionali-benefici/ http://www.naturazen.org/alimentazione/semi-di-chia-proprieta-nutrizionali-benefici/
    e testando la pagina con il link www.viverezen.org/semi-di-chia-proprieta-nutrizionali-benefici/ questa indirizzava un bel 404 su questo link: www.naturazen.org/semi-di-chia-proprieta-nutrizionali-benefici/
    Insomma sul sito nuovo ho dovuto usare Yoast Redirect e dargli in pasto le pagine che sicuramente per giorni non sono state viste...

    Robot.txt attuale aggiornato
    User-agent: *

    htaccess sito naturazen

    BEGIN WordPress

    <IfModule mod_rewrite.c>
    RewriteEngine On
    RewriteBase /
    RewriteRule ^index.php$ -
    RewriteCond %{REQUEST_FILENAME} !-f
    RewriteCond %{REQUEST_FILENAME} !-d
    RewriteRule . /index.php

    RewriteCond %{HTTP_HOST} ^89.40.172.48
    RewriteRule (.*) http://www.naturazen.org/$1 [R=301,L]

    </IfModule>

    END WordPress

    <FilesMatch ".(ico|jpg|jpeg|png|gif|js|css|swf)$">
    Header set Expires "Tue, 16 Jun 2020 20:00:00 GMT"
    </FilesMatch>

    <ifModule mod_headers.c>
    Header set Connection keep-alive
    </ifModule>

    <IfModule mod_deflate.c>
    <IfModule mod_setenvif.c>
    BrowserMatch ^Mozilla/4 gzip-only-text/html
    BrowserMatch ^Mozilla/4.0[678] no-gzip
    BrowserMatch \bMSIE !no-gzip !gzip-only-text/html
    BrowserMatch \bMSI !no-gzip !gzip-only-text/html
    </IfModule>
    <IfModule mod_headers.c>
    Header append Vary User-Agent env=!dont-vary
    </IfModule>
    AddOutputFilterByType DEFLATE text/css application/x-javascript text/html text/richtext image/svg+xml text/plain text/xsd text/xsl text/xml image/x-icon
    </IfModule>

    Grazie di tutto Andrea, sarò felice se tutto andrà bene, raccontare della mia bella esperienza in un convegno dove spiegare cosa non fare quando si cambia dominio! 🙂


  • Admin

    Ciao Ramses figurati è un piacere.

    L'indiziato numero uno per questa tua situazione è sicuramente il fatto che avete fato un po' di casino da un punto di vista tecnico durante la migrazione.

    Quello che potresti fare per accelerare la reindicizzazione è sicuramente passare ad HTTPS così da far capire a google che si tratta di un sito completamente nuovo e per cui verrà ignorato il discorso del problema noindex e dunque il delay di reindexing per 30gg.

    A quel punto dovrai fare tutti i redirect che hai su viverezen verso la versione HTTPS di naturazen
    e inoltre come ti ho detto prima dentro la versione HTTP di naturazen fare tutti i redirect verso HTTPS di naturazen.

    Riguardo invece alle regole che hai messo dipende molto dall'ambiente server in cui sei, ma sicuramente questa non ha molto senso

    Header set Expires "Tue, 16 Jun 2020 20:00:00 GMT"

    Perché fissare una data al 2020 quando puoi impostare 365 giorni ad esempio in modo automatico e quindi senza dover poi riaggiornare a mano la cosa.


  • Admin

    Ho notato anche che il tuo sito ha una quantità anomala di redirect 301 interni oltre a qualche 404 e canonicalizzazioni un po' strane.


  • User Newbie

    Ciao Juanin, scusami se intervengo, ma per capire, che cosa intendi per "canonicalizzazioni un pò strane"?
    puoi fare un esempio?


  • Admin

    Vedo che il tuo sito su 900 circa pagine totali ha oltre 450 pagine che fanno redirect linkate internamente (qualcosa relativo a newsletter) e oltre un centinaio di pagine canonicalizzate altrove linkate internamente (es: tag).

    Capisci che se oltre il 50% di pagine del tuo sito fanno redirect non fai altro che creare problemi al crawler che spende il suo tempo a fare redirect invece di concentrarsi sulle pagine importanti.


  • Moderatore

    @Juanin said:

    Vedo che il tuo sito su 900 circa pagine totali ha oltre 450 pagine che fanno redirect linkate internamente (qualcosa relativo a newsletter) e oltre un centinaio di pagine canonicalizzate altrove linkate internamente (es: tag).
    Capisci che se oltre il 50% di pagine del tuo sito fanno redirect non fai altro che creare problemi al crawler che spende il suo tempo a fare redirect invece di concentrarsi sulle pagine importanti.

    Ciao Andrea, allora il Newsletter non è scomparso? avevo trovato un link errato in home
    <a href="./newsletter-info-e-ordini-bacche-di-goji/" rel="nofollow" title="Iscriviti alle newsletter di NaturaZen" style="font-size:12px;"><i class="fa fa-cog"></i>Newsletter</a>
    c'era quel puntino prima della barra che faceva casini...
    Io l'ho corretto due giorni fa e tramite screamfrog sembrava non esserci più... (puoi verificare e confermare che esistono ancora?)

    Poi c'è un problema assurdo:** htaccess di www.viverezen.org **che leggi qui sotto... perché la prima riga dei redirect che ti metto qui sotto "canna" e punta a http://www.naturazen.org/bacche-goji-biologiche/ con un bel 404?
    mentrele altre che vedi funzionano benissimo? Questo mi accade su una decina di link di viverezen (alcune pagine convertite in articoli)
    Questo è un bel mistero... E non so se ci sono comandi htaccess che possano in qualche modo forzare questo problema.
    Ho tolto tutti i redirect da Yoast per lasciare i 404 intanto visibili e "testabili" poi domani rimetterò i redirect perché non so proprio che fare!

    Fin quando non risolvo questi misteri mi risulta difficile la migrazione in https, non vorrei portarmi dietro una marea di casini...

    Hai qualche consiglio?
    Mille grazie del tuo interesse!

    Redirect 301 /bacche-goji-biologiche/ http://www.naturazen.org/alimentazione/bacche-goji-biologiche/
    Redirect 301 / http://www.naturazen.org/
    Redirect 301 /about/ http://www.naturazen.org/chi-siamo/
    Redirect 301 /alimentazione/acerola-biologica-proprieta-usi-controindicazioni/ http://www.naturazen.org/alimentazione/acerola-biologica-proprieta-usi-controindicazioni/
    Redirect 301 /alimentazione/alimentazione-bacche-di-goji-tumori/ http://www.naturazen.org/alimentazione/alimentazione-bacche-di-goji-tumori/
    Redirect 301 /alimentazione/aloe-vera-tutte-le-proprieta-benefici-usi-viverezen/ http://www.naturazen.org/alimentazione/aloe-vera-tutte-le-proprieta-benefici-usi-naturazen/


  • Admin

    Confermo che avevo eseguito il controllo oltre 2gg fa quindi ok.

    Riguardo ai canonical invece continuo a vedere un sacco di pagine tag che canonicalizzano diversamente oltre ad avere un title poco utile che utilizza "Archives" all'interno.

    Riguardo ai 301 invece è probabile che tu abbia dei redirect che in cascata fanno casino. Meglio che usi dei RedirectMatch e imposti il break dopo il primo altrimenti potresti avere dei match inattesi.

    Alternativa è che tu abbia qualcosa che intercetta la pagina prima del redirect prima che hai messo. In che ordine sono le istruzioni dentro il tuo htaccess?
    Che funzione di yoast stai usando per i redirect?


  • Moderatore

    Confermo che avevo eseguito il controllo oltre 2gg fa quindi ok. ok!

    Riguardo ai canonical invece continuo a vedere un sacco di pagine tag che canonicalizzano diversamente oltre ad avere un title poco utile che utilizza "Archives" all'interno.

    Cosa significa canonicalizzano diversamente?
    Questi sono alcuni presi da screamfrog, io su Yoast gli ho dato il NoIndex NoFollow appositamente per evitare duplicazioni
    **Address - ****Canonichal Element 1 - **Meta Robots 1
    http://www.naturazen.org/tag/biennale-di-venezia/ http://www.naturazen.org/tag/biennale-di-venezia/ noindex,follow,noodp
    http://www.naturazen.org/tag/terzo-chakra/ http://www.naturazen.org/tag/terzo-chakra/ noindex,follow,noodp
    http://www.naturazen.org/tag/filosofia-zen/ http://www.naturazen.org/tag/filosofia-zen/ noindex,follow,noodp
    http://www.naturazen.org/tag/ricette-bacche-di-goji/ http://www.naturazen.org/tag/ricette-bacche-di-goji/ noindex,follow,noodp
    http://www.naturazen.org/tag/sciroppo-acero/ http://www.naturazen.org/tag/sciroppo-acero/ noindex,follow,noodp
    http://www.naturazen.org/tag/dada-krsnananda/ http://www.naturazen.org/tag/dada-krsnananda/ noindex,follow,noodp
    http://www.naturazen.org/tag/manipura/ http://www.naturazen.org/tag/manipura/ noindex,follow,noodp
    http://www.naturazen.org/tag/cibi-vegan/ http://www.naturazen.org/tag/cibi-vegan/ noindex,follow,noodp
    http://www.naturazen.org/tag/alimentazione/ http://www.naturazen.org/tag/alimentazione/ noindex,follow,noodp

    Riguardo ai 301 invece è probabile che tu abbia dei redirect che in cascata fanno casino. Meglio che usi dei RedirectMatch e imposti il break dopo il primo altrimenti potresti avere dei match inattesi.

    Ho pulito l'htaccess di viverezen.org che riportava 6 errori su circa 160 redirect
    ho controllato tutti redirect ma, da quello che scrivi forse faccio qualcosa di errato. Quello che tu vedi sopra nel mio post precedente è come inizia il file dell'htaccess. Hai una stringa esempio da darmi per fare un test?
    O hai qualche altro suggerimento sul come scrivere la stringa?

    Alternativa è che tu abbia qualcosa che intercetta la pagina prima del redirect prima che hai messo. In che ordine sono le istruzioni dentro il tuo htaccess?

    Le istruzioni sono solo di questo tipo:
    Redirect 301 /permalink1/ [di viverezen.org] link1 [di naturazen.org]
    Redirect 301 /permalink2/ [di viverezen.org] link2 [di naturazen.org] ecc ecc

    Ho sbagliato qualcosa? Su naturazen invece l'htaccess è quello descritto sopra

    Che funzione di yoast stai usando per i redirect? ho la vesione Yoast Pro su NaturaZen e ho usato la funzione di Yoast Redirect che funziona bene (ma l'ho vuotata adesso per verificare gli errori 404 altrimenti non li vederesti)

    Andrea!!! Grazie di cuore! Speriamo di venirne fuori!!!


  • Admin

    Ciao Lara,

    per me una canonicalizzazione è strana quando è un'anomalia ricorrente.

    Se inserisci all'interno dell'architettura informativa una quantità elevata di pagine che non sono canoniche significa che la tua architettura informativa ha molto probabilmente dei problemi.


    Riguardo invece alla questione canonical Ramses scrivi che hai messo noindex, nofollow, ma poi scrivi sotto noindex, follow.
    Sicuramente il nofollow è da evitare quasi sempre. Non ricordo casi particolari in cui mettere risorse linkate internamente con nofollow porti beneficio.

    Inoltre molto meglio mettere un controllo dove "se un tag non ha più di X elementi non lo mostri nemmeno come link" rispetto a linkarlo e renderlo noindex.

    Per quanto riguarda invece gli htaccess non ci sto più capendo molto.

    Il problema è quando sei su naturazen oppure quando da viverezen rimandi a naturazen?


  • Moderatore

    Ciao Lara,

    per me una canonicalizzazione è strana quando è un'anomalia ricorrente.

    Se inserisci all'interno dell'architettura informativa una quantità elevata di pagine che non sono canoniche significa che la tua architettura informativa ha molto probabilmente dei problemi.


    Riguardo invece alla questione canonical Ramses scrivi che hai messo noindex, nofollow, ma poi scrivi sotto noindex, follow.
    Sicuramente il nofollow è da evitare quasi sempre. Non ricordo casi particolari in cui mettere risorse linkate internamente con nofollow porti beneficio.

    Inoltre molto meglio mettere un controllo dove "se un tag non ha più di X elementi non lo mostri nemmeno come link" rispetto a linkarlo e renderlo noindex.
    Scusa ho fatto un errore di battitura... è solo NOINDEX
    <!-- This site is optimized with the Yoast SEO Premium plugin v3.9 - https://yoast.com/wordpress/plugins/seo/ -->
    <meta name="description" content="Tante novità presenti nei TAG alimentazione vegana"/>
    <meta name="robots" content="noindex,follow,noodp"/>
    <link rel="canonical" href="http://www.naturazen.org/tag/alimentazione-vegana/" />
    <link rel="publisher" href="https://plus.google.com/+MircoDInca"/>
    <meta property="og:locale" content="it_IT" />
    <meta property="og:type" content="object" />
    <meta property="og:title" content="alimentazione vegana Archives - Natura Zen" />
    <meta property="og:description" content="Tante novità presenti nei TAG alimentazione vegana" />
    <meta property="og:url" content="http://www.naturazen.org/tag/alimentazione-vegana/" />
    <meta property="og:site_name" content="Natura Zen" />
    <!-- / Yoast SEO Premium plugin. -->

    Per quanto riguarda invece gli htaccess non ci sto più capendo molto.
    Il problema è quando sei su naturazen oppure quando da viverezen rimandi a naturazen?

    Sulla questione htaccess il problema parte da viveren quando rimanda a naturazen
    in pratica nel file .htaccess abbiamo messo una lista di redirect 301 tipo questo inserito e verificato ma che va in errore:
    Redirect 301 /mappa-del-sito/ http://www.naturazen.org/
    se io digito http://www.viverezen.org/mappa-del-sito/ va in 404 secco su questo link http://www.naturazen.org/mappa-del-sito/

    non è che un redirect possa in qualche modo fare casino? Ad esempio il primo con una / che rimanda in Homepage?

    Comunque prendendo un link di quelli che non andava bene, l'ho messo in cima alla lista e sembra che funzioni...

    Redirect 301 / http://www.naturazen.org/
    Redirect 301 /mappa-del-sito/ http://www.naturazen.org/
    Redirect 301 /offerta-himalaya-clienti-viverezen/ http://www.naturazen.org/
    Redirect 301 /offerte-amici-viverezen/ http://www.naturazen.org/
    Redirect 301 /offerte-telemarketing-viverezen/ http://www.naturazen.org/
    Redirect 301 /bacche-di-goji-biologiche/ http://www.naturazen.org/bacche-di-goji-biologiche/
    Redirect 301 /bacche-di-goji-biologiche-c/ http://www.naturazen.org/bacche-di-goji-biologiche/
    Redirect 301 /bacche-di-goji-biologiche-b/ http://www.naturazen.org/bacche-di-goji-biologiche/


  • Admin

    Io ti consiglio di usare RedirectMatch con delle regexp.

    Ad esempio la mappa del sito dovresti matchare le URL che iniziano con mappa-del-sito quindi ^/mappa-del-sito/ e che finiscono con mappa-del-sito/ quindi

    [html]redirectMatch 301 ^/mappa-del-sito/$ http://www.naturazen.org/[/html]

    Se vuoi matchare invece sia quelle che finiscono con slash e senza /?$

    [html]redirectMatch 301 ^/mappa-del-sito/?$ http://www.naturazen.org/[/html]

    Le ultime 3 invece le risolveresti con una sola regola e dunque quelle che iniziano con /bacche-di-goji-biologiche sempre che tu non abbia altre URL di quel tipo che devono andare altrove.

    Ma poi vedendo che stai facendo dei redirect 1 a 1 mi sembra di capire che il sito vecchio avesse pochissime pagine corretto?
    Altrimenti te la saresti cavata con una sola riga di htaccess con delle esclusioni


  • Moderatore

    @Juanin said:

    Io ti consiglio di usare RedirectMatch con delle regexp.

    Ad esempio la mappa del sito dovresti matchare le URL che iniziano con mappa-del-sito quindi ^/mappa-del-sito/ e che finiscono con mappa-del-sito/ quindi

    [html]redirectMatch 301 ^/mappa-del-sito/$ http://www.naturazen.org/[/html]

    Se vuoi matchare invece sia quelle che finiscono con slash e senza /?$

    [html]redirectMatch 301 ^/mappa-del-sito/?$ http://www.naturazen.org/[/html]

    Le ultime 3 invece le risolveresti con una sola regola e dunque quelle che iniziano con /bacche-di-goji-biologiche sempre che tu non abbia altre URL di quel tipo che devono andare altrove.

    Ma poi vedendo che stai facendo dei redirect 1 a 1 mi sembra di capire che il sito vecchio avesse pochissime pagine corretto?
    Altrimenti te la saresti cavata con una sola riga di htaccess con delle esclusioni
    Ti rispondo che ho 160 link (non so se sono pochi o tanti) di cui una buona parte probabilmente si possono direzionare con poche regole però io non so come farlo.
    Se vuoi posso mostrarti il file e magari tu sai aiutarmi in modo veloce. Per il discorso slash con e senza non posso dire con precisione quali link arrivano in entrata a viverezen (tanti sono backlink o link presenti in email di clienti che per abitudine se li sono salvati sul pc e continuano ad usarli) quindi in questo caso opterei per la soluzione /?$


  • Admin

    Prova e fammi sapere.

    Spesso usare Redirect 301 può causare spiacevoli inconvenienti.


  • Moderatore

    è incredibile... mi sono "smazzato" un sacco per cercare eventuali altri errori...
    ma questo indica che qualcosa proprio non va...
    se da viverezen su htaccess metto...

    redirectMatch 301 ^/mappa-del-sito/$ http://www.naturazen.org/ ---> va in 404 su questo link http://www.naturazen.org/mappa-del-sito/
    redirectMatch 301 ^/mappa-del-sito123/$ http://www.naturazen.org/ ---> allora così funziona il redirect!!!

    questo adesso accade per altri 3 link soltanto, gli altri stranamente adesso funzionano...

    per me è assurdo!!!


  • Admin

    Se accade vuol dire che c'è un conflitto o qualche problema tecnico.

    C'è sempre una spiegazione.

    Ora io vedo corretto anche il primo. Fai attenzione perché i 301 soprattutto Google Chrome se li tiene in cache quindi ti può sembrare che le modifiche non vadano a buon fine mentre invece sono andate a buon fine.
    Usa sempre delle CURL da linea di comando oppure cambia browser o lavora con cache disabilitata.

    Io ora il primo lo vedo corretto.


  • Moderatore

    @Juanin said:

    Se accade vuol dire che c'è un conflitto o qualche problema tecnico.
    C'è sempre una spiegazione.
    Ora io vedo corretto anche il primo. Fai attenzione perché i 301 soprattutto Google Chrome se li tiene in cache quindi ti può sembrare che le modifiche non vadano a buon fine mentre invece sono andate a buon fine.
    Usa sempre delle CURL da linea di comando oppure cambia browser o lavora con cache disabilitata.
    Io ora il primo lo vedo corretto.
    Benissimo quindi, a questo punto sembra intanto che l'.htaccess di viverezen cominci a funzionare.

    Ora ho notato che la search console di NaturaZen mi riporta qualche 404 che provengono da VivereZen (wp-content del tema vecchio, un plugin obsoleto ecc ecc) quindi quando vengono effettuate delle chiamate su viverezen tipo
    www_viverezen_org/wp-content/link-errato-e-non-piu-disponibile/ questo rimbalza in automatico su questo link
    www_naturazen_org/wp-content/link-errato-e-non-piu-disponibile/
    in pratica mantiene la stessa struttura del permalink generando un 404

    La mia domanda è: c'è un comando htaccess per fare in modo che se tra i 160 link inseriti non trova il "MATCH" di dargli una pagina di destinazione o la home del sito_nuovo? Sempre meglio di un 404 no?

    Fatto questo comincio a concentrarmi sul sito_nuovo per pulirlo e metterlo a posto per poi migrare in https (qui credo aprirò un post nuovo) con una lista di "TO DO" per lasciare un valido aiuto per chi in futuro si troverà in situazioni simili


  • Admin

    Si via htaccess puoi fare tutto e gestire tutte le esclusioni che vuoi.

    In ogni caso le pagine che redirigi alla home sono di fatto dei soft 404 per Google.


  • Moderatore

    @Juanin said:

    Si via htaccess puoi fare tutto e gestire tutte le esclusioni che vuoi.
    In ogni caso le pagine che redirigi alla home sono di fatto dei soft 404 per Google.

    Quali sono dei SOFT 404? I 404 che arrivano da VivereZen?

    E quale comando si potrebbe inserire alla fine di HTACCESS affinché vada a fare un redirect alla homepage quando tutti i precedenti redirect 301 verso il nuovo sito non abbiano fatto MATCH?


  • Admin

    il tuo caso non è questo.
    Di fatto attualmente il redirect te lo fa ma tu non lo vorresti.

    Devi usare delle rewriteCond