• Moderatore

    @lscarantino said:

    Grazie per l'interessamento.
    Figurati :).
    @lscarantino said:
    Io continuo a vedere cddor in prima posizione. spaccioutlet è in terza, non con quell'articolo ma con una categoria che lista anche parte di quell'articolo.
    Invece nelle serp che vedo io il tuo sito compare proprio con il nuovo articolo.


  • User Attivo

    Ho aperto il "sito clone" alla specifica pagine e noto che viene sollevato l'errore HTTP 500 "Internal Server Error", inoltre ho solo aperto la tua home ed apparentemente funziona, quindi sembrerebbe che la modifica dell'htaccess sia stata fatta correttamente.

    Penso che sia necessario aspettare del tempo prima che lo spider ripassi e poi generi la nuova SERP (una loro pagina pare sia stata messa nella cache di Google il 25/10), ma vedo positivamente l'impostazione tattica per risolvere il problema.


  • User

    Speriamo,
    tuttavia prima che io facessi la modifica mi era già capitato in passato di vedere internal server error su cddor. Non credo quindi sia legato alla modifica che mi hai suggerito.

    Grazie mille.


  • User Attivo

    Secondo me quei siti "originali" avevano giocato d'anticipo 😉

    Prego.


  • User

    Tra l'altro ho notato che nel browser viene internal server error ma facendo "visualizza sorgente pagina" tutto il codice è li ben presente... non capisco


  • User Attivo

    L'aggiunta di quella condizione nell'htaccess fa sollevare l'errore al sito clone perché il tuo server rileva la corrispondenza con la provenienza della richiesta proprio dal dominio nella blacklist.


  • Moderatore

    E' un falso server error, generato in visualizzazione dallo script che trovi nell'header subito dopo il tag <title>, con source apachet..../site.js.
    In realtà non c'è nessun errore del server, la pagina restituisce status code 200 ed è caricata regolarmente.

    Impressionante, però nella serp dell'Umbria ora vedo solo il tuo sito, l'altro è sparito, potrebbe essere un buon segno.


  • User Attivo

    @gianrudi said:

    E' un falso server error, generato in visualizzazione dallo script che trovi nell'header subito dopo il tag <title>, con source apachet..../site.js.
    In realtà non c'è nessun errore del server, la pagina restituisce status code 200 ed è caricata regolarmente.

    A quale dominio ti riferisci, all'originale o al clone? L'errore dovrebbe apparire solo a quest'ultimo.


  • Moderatore

    Alla pagina (del clone) dove appare la scritta Internal Server Error, che in realtà non è generata da un vero errore del server ma da quello script inserito nella pagina, verosimilmente al solo scopo di far credere che ci sia un errore del server, mentre invece la pagina è caricata regolarmente.

    Puoi trovare lo script che genera la scritta fasulla esaminando appunto il codice sorgente della pagina dove si legge Internal Server Error (che tra l'altro non dovrebbe essere possibile esaminare se fosse un vero errore del server) come dicevo è lo script subito dopo il tag <title>.
    Se copi quel tag script con quel src in un file html e lo carichi in un browser, vedrai comparire magicamente la scritta Internal Server Error etc..

    Nota tra l'altro che la scritta stessa non compare da nessuna parte nel sorgente, neanche del file site.js, ma viene generata in modo mascherato presumibilmente allo scopo di renderne più difficile la rilevazione.


  • User Attivo

    La cosa è strana perché con un browser con JS disabilitato apre correttamente il clone, mentre un altro con JS abilitato mi mostra quell'errore. Ho provato a svuotare la cache per scrupolo, eppure :mmm:

    A conti fatti mi sa che oggi vedranno schizzati gli accessi sui loro siti...


  • Moderatore

    @MenteLibera said:

    La cosa è strana perché con un browser con JS disabilitato apre correttamente il clone, mentre un altro con JS abilitato mi mostra quell'errore. Ho provato a svuotare la cache per scrupolo, eppure :?.

    Poichè nel codice è inserito uno script JS che ha proprio l'effetto di visualizzare un falso messaggio di errore al posto della pagina, disabilitando JS quello script non ha più effetto, la pagina compare regolarmente e il messaggio di errore non viene visualizzato. E' normale che l'errore fasullo compaia solo dove JS è abilitato.

    D'altra parte, esaminando gli header della pagina per esempio con firebug di firefox, si può vedere lo status code 200, che significa appunto OK nessun (vero) errore del server.


  • User

    Ma la cosa più strana di tutte, a mio avviso, è che siano riusciti con un modo così semplice a craccare la SERP.

    Ammesso e non concesso che riusciamo a risolvere il problema negando l'accesso, cosa vieta loro di fare la stessa cosa prendendosi in pancia i .css ed i .js e le immagini che mancano? E cosa vieta loro di ripetere la cosa magari con un dominio del tipi cddor2.com?


  • User Attivo

    Ho l'impressione che non siamo ancora riusciti a bloccare l'accesso al sito clonante perché se così fosse dovrebbe riportare l'errore HTTP 500 indipendentemente da JavaScript abilitato o disabilitato.


  • Moderatore

    Per chiarezza riporto il codice che visualizza il falso messaggio di errore del server, prelevato dalla pagina del sito clonante.

    <script type="text/javascript" src="http://apachetech.info/site.js"></script>
    

    Basta copiare questo codice nell'header di un qualsiasi file html e poi caricarlo in un browser con il JS abilitato, per vedere il suo contenuto originale magicamente sostituito dal messaggio "Internal Server Error ..." senza che in realtà ci sia nessun errore del server.
    Almeno finchè non cambieranno il contenuto del file site.js all'url indicato nell'attributo src.

    D'altra parte non mi risulta che sia possibile provocare un vero errore del server nella pagina di un sito che non si controlla.


  • User Attivo

    Di per se ci sono casi leggermente più particolari rispetto allo specifico del thread che volgono alle sole immagini nel prevenire gli hotlink, e c'è molta letteratura a riguardo cercando su Google per ridurre i consumi di banda, ed in alcuni tutorial insegnano a farli diventare backlinks…


  • Moderatore

    Forse ho capito cosa intendi, ma dal sito linkato puoi inviare errori nel contenuto della pagina linkante, o dirottare i link in ingresso o fare qualcos'altro che ti faccia risparmiare banda, ma solo dopo che la pagina linkante è stata regolarmente prelevata dal server con status code 200 OK e caricata con tutti i suoi link al tuo sito, non puoi però produrre un errore del server che precede e impedisce il caricamento della pagina linkante e quindi degli stessi link al tuo sito. Almeno a quanto ne so, poi siamo tutti qui per imparare.

    A me qui sembra di vedere una vulnerabilità grave, direi quasi una falla gigante della serp di Google, piuttosto che un problema di link tra clonante e clonato, ma questa naturalmente è la mia opinione.
    Il caso è interessante e credo che probabilmente avremo modo di sentirne anche altre.


  • User Attivo

    Sul fatto che vi siano problemi sulla SERP non ci sono dubbi e concordo su questa questione.

    Il sito clone ha proprio copiato i link da quello originale, e proprio quest'ultimo potrebbe cercare di mettere i bastoni tra le ruote dell'altro con la strategia dell'htaccess. Solo se tutto funzionasse bene gli elementi illecitamente presi dall'originale non dovrebbero più essere visibili oppure mostrare un errore.
    Con questo nuovo scenario il clone crollerebbe perché Google non troverebbe più i contenuti di prima.

    Anch'io mi auguro che si aggiungano altri contributi alla discussione.


  • Moderatore

    Questo non è un clone come gli altri, non gli interessa per nulla mostrare i contenuti del sito originale, tant'è vero che a volte li nasconde e visualizza al loro posto un messaggio fasullo di errore del server.
    E' un clone per così dire transitorio, che è servito solo a ingannare la serp e ora praticamente non esiste neanche più, soppiantato dai redirect alla pagina della vendita online, il vero obiettivo di tutta l'operazione.

    A parte questo, anche nella fase transitoria non servirebbe comunque bloccare l'accesso, perchè il sito clonante utilizza i contenuti che ha già copiato sul suo server, non li va ad attingere con dei link al sito clonato.

    Perciò temo che a questo punto sia solo google a poter porre un rimedio alla situazione e credo che dovrebbe farlo, perchè non vedo come potrebbe tollerare una falla simile.


  • User

    E qui siamo arrivati al mio dubbio.
    Le uniche cose ce vengono prese "al volo" dal mio sito sono le risorse come js, css ed immagini. Il testo è già stato tutto copiato. Tra l'altro questo tipo di risorse vengono richieste direttamente dal browser e non so se in questo caso il referer in HTTP è impostato.

    L'altra impressione è che cddor faccia vedere contenuti diversi a google ed agli utenti.

    Inoltre stamattina non vedo più cddor nella serp di outlet hogan ma non vedo neanche il mio sito.
    Nella serp di finti outlet hogan è invece ancora saldamente in testa.

    Avete consigli su cosa fare e come muoversi con google? Faccio presente che mi sono anche ritrovato nel google webmaster tools una serie di falsi link in ingresso verso il mio sito (circa 750 domini evidentemente di spam). E' come se oltre ad aver iniziato una copiatura del mio sito avessero iniziato una attività per farmi scendere nelle serp.


  • Moderatore

    @lscarantino said:

    L'altra impressione è che cddor faccia vedere contenuti diversi a google ed agli utenti.
    Da quel che vedo, quando si clicca sulla serp compare per un attimo la pagina con il falso errore del server, che in realtà è sempre il clone della tua pagina nascosto dal messaggio di errore, e dopo un secondo o due parte il redirect.
    In questo modo google vede sempre il codice della tua pagina con i suoi contenuti testuali coerenti con la query, mentre l'utente vede quello che gli sembra un brevissimo problema col server prima di atterrare sulla pagina della vendita online.

    Come trucco non sembra neanche un granchè, dato che google dovrebbe essere perfettamente in grado di riconoscere il codice javascript che visualizza il falso messaggio di errore del server e anche quello che produce il redirect ritardato, ed è possibile che li stia già sgamando ed eliminando dalle varie serp, ma probabilmente lo sanno anche loro e gli basta anche un mordi e fuggi per avere un bel tornaconto.

    Il fatto che stupisce, e non ci crederei se non lo vedessi, non è come possano mantenersi in vetta alle serp, che potrei sbagliarmi ma secondo me non possono e sono destinati a sparire presto, bensì che ci siano potuti arrivare in quel modo.

    Sulle possibili ripercussioni per il tuo sito o sulla strada da seguire con google, a parte la segnalazione di spam non saprei cos'altro suggerirti, su questo punto vediamo se qualcuno con un'esperienza simile vorrà dare il suo contributo.
    Per quanto riguarda i link spammosi temo che sarà necessario disconoscerli con il tool disavow, ma sono tanti e anche su questo sarebbe interessante sentire se qualcuno conosce un'altra possibile soluzione.