• User Attivo

    strana gestione di errore 404

    Una domandina sull'errore 404

    ho notato che uno dei provider su cui ho dei siti gestisce in maniera diversa l'errore 404

    in particolare noto che c'è una differenza se la pagina è .htm / html o .asp:

    mi chiedevo se c'è differenza tra le due situazione ovviamente dal punto di vista dei mdr


  • Super User

    puoi verificare il ripo di redict fatto controllando l'header http con questo tool, in ogni caso dovresti cercare di limitare i 404 in un sito (lo so è ovvio :))...

    come ti sei accorta di questa cosa? è un errore del cms? linki pagine inesistenti?

    anche se c'è chi consiglia di visualizzare una mappa del sito in caso di NOT FOUND, la cosa è ininfluente per i MdR, sempre NOT FOUND è, al contrario è utile agli utenti che possono continuare la navigazione.. ma come ci capitano gli utenti se ho ben sviluppato il sito ? 😄

    ciao 😄


  • User Attivo

    Ciao Rinzi

    ho provato con il tool e ho questo risultato (modificato il nomereale del sito) per una pagina inesistente:

    questo su una pagina.asp

    HTTP/1.1 302 Object moved
    Server: Microsoft-IIS/5.0
    Date: Mon, 22 Jan 2007 16:06:00 GMT
    X-Powered-By: ASP.NET
    Location: /errori/404/index.asp?404;http://www.sito.net/pagina.asp

    questo su una pagina.htm

    HTTP/1.1 200 OK
    Server: Microsoft-IIS/5.0
    Date: Mon, 22 Jan 2007 16:22:31 GMT
    X-Powered-By: ASP.NET
    Connection: Keep-Alive
    Content-Length: 15131
    Content-Type: text/html
    Set-Cookie: ASPSESSIONIDACBDSSTC=LCEEKPMDKHGPMOIBOJONKAJF; path=/
    Cache-control: private

    sbaglio o c'è qualcosa che non torna ?

    mi sono accorta di questa cosa perchè ho un problema con un sito dove da un mese, mese e mezzo ho messo in rete i nuovi file e sto cercando di capire da cosa possa dipendere per trovare una soluzione... Appena on line i nuovi file il sito ha avuto un sacco di benefici poi negli ultimi giorni la musica è cambiata.

    Si tratta di un sito statico con un numero di pagine limitate in due versioni it e uk. Solo uno script per le news per quanto riguarda pagine dinamiche e la galleria di immagini. I file in versione inglese sono in una cartella uk quelli in lingua italiana it. Ho escluso l'eventualità di prendere dominio .it e .com proprio per via delle dimensioni ridotte del sito. Ho usato la personalizzazione del 404 perchè non mi piaceva la vecchia struttura delle pagine, disordinata, nomi di cartelle poco adatti (ad es. i nomi dei file in lingua inglese erano in italiano). Non essendo le vecchie pagine chissà quanto indicizzate e con poco pr le ho cancellate senza farmi troppi problemi personalizzando la pagina dei errore. Un gruppo di pagine (le news parte dinamica del sito) ho evitato di cancellarle utilizzando un redirect 301 in maniera molto semplice e infatti per queste gg ha assimilato il messaggio in una decina di giorni.

    in seguito ad un suggerimento da parte di Giorgio sono anche passata per il tuo post in cui introduci l'argomento sul phrase rank.

    ho pensato ad una penalizzazione possibile per similarità di contenuti e comunicati stampa pubblicati, ma queste cose non mi convincono abbastanza anche se sono tutte cose da tenere ben presenti.

    poi ho notato sta particolarità nell'errore 404...

    ps. non ho continuato il vecchio post perchè non mi sembrava giusto dato che qui si parla di altro


  • Super User

    ciao scura 🙂
    @scura said:

    sbaglio o c'è qualcosa che non torna ?

    esatto, prima di tutto la configurazione del server/hosting mi sembra errata, se un file non esiste deve essere restituito un headet HTTP simile a questo (contenente l'html peronalizzato)

    HTTP/1.1 404 Not Found
    Date: Mon, 22 Jan 2007 19:29:08 GMT
    Server: Apache
    X-mod-choke: 0.06
    Last-Modified: Sat, 24 Sep 2005 08:55:01 GMT
    ETag: "300008f-556-43351465"
    Content-Length: 1366
    Connection: close
    Content-Type: text/html

    il 302 potrebbe provocarti l'hijack (su cui sto facendo dei test, risultati a voi in futuro 🙂 ) ma fatto da solo ti turberebbe ben poco 🙂

    il 200 dice allo spider che la pagina esiste quando invece è sparita (termine tipico dei puponi de roma... es.: la juve è sparita dalla serie A :lol: ), poco male se non fosse che tutte le n pagine assenti risultano identiche (se ho capito bene)

    @scura said:

    ho pensato ad una penalizzazione possibile per similarità di contenuti e comunicati stampa pubblicati, ma queste cose non mi convincono abbastanza anche se sono tutte cose da tenere ben presenti.

    sinceramente rimane difficile darti risposte fondate, rimene il fatto che il server risponde male (sembra)
    il 301 ha dato i suoi risultati, bene le altre? hai pensato di rimetterle momentaneamente? la situazione va valutata, se vuoi pubblicare l'URL possiamo buttarci un occhio

    ciao 🙂

    p.s.: psss... voi che leggete...si voi.... i vostri siti restituiscono header http corretti 😄


  • User Attivo

    Ciao Rinzi e prima di tutto grazie per la quantità di informazioni che diffondi su questo forum

    per il sito in questione sto indagando, ma preferisco non mettere la url, anche se da una parte potreste darmi una mano, perchè si tratta di un sito cliente, del quale molti cercano anche solo il nome e in pochi giorni uscirebbe fuori questa pagina cerandolo su gg.

    ho un forte dubbio su un eventuale problema legato alla versione multilingua del sito, ho come la sensazione che gg abbia fatto confusione, magari in seguito al link da uno dei siti dove ho pubblicato un comunicato tradotto in lingua inglese, ma anche qui non mi torna tutto tutto.

    Però ho notato una key in lingua inglese di quelle tostissime in 3 pagina su gg.com, posizione acquisita improvvisamente.

    Comunque questa storia della gestione del 404 è una cosa da correggere assolutamente e rimettere online i vecchi file è una cosa semplice alla quale non avevo pensato sulla quale riflettere.

    Con il tool che mi hai segnalato ho cominciato a verificare come anche altri provider gestiscono l'errore ed è incredibile come moltissimi usino il 302 o il 200 al posto del 404. In seguito ad altri problemi purtroppo sono quasi certa che quando aprirò un tiket per segnalare il problema mi risponderanno: è un problema di Google non nostro!!

    Google site map se non sbaglio segnala eventuali problematiche relativamente al 404...


  • User Attivo

    @Rinzi said:

    il 200 dice allo spider che la pagina esiste quando invece è sparita (termine tipico dei puponi de roma... es.: la juve è sparita dalla serie A :lol: ), poco male se non fosse che tutte le n pagine assenti risultano identiche (se ho capito bene)

    p.s.: psss... voi che leggete...si voi.... i vostri siti restituiscono header http corretti 😄

    calcio a parte, stavo ragionando su una cosa:

    io ho chiesto di personalizzare il 404 e a quanto vedo in seguito alla personalizzazione è normale avere al suo posto un 200 pagina trovata.

    Mi chiedo è meglio inserire in questa pagina un response.status = "404 Not found" oppure lasciare una pagina trovata (200) ma fare in maniera tale che sia diversa per ogni pagina eliminata ?


  • Super User

    @scura said:

    io ho chiesto di personalizzare il 404 e a quanto vedo in seguito alla personalizzazione è normale avere al suo posto un 200 pagina trovata.

    Mi chiedo è meglio inserire in questa pagina un response.status = "404 Not found" oppure lasciare una pagina trovata (200) ma fare in maniera tale che sia diversa per ogni pagina eliminata ?

    ciao, non è normale, è un errata usanza 🙂

    modifica tu lo status come hai detto 🙂


  • User

    Anch'io ho suggerito il 404 personalizzato ma ora compare una pagina (uguale per qualsiasi url si digiti) che con quel check fornisce codice 200
    Inoltre rimane visualizzata nella barra l'url errata del tipo

    www.sito.it/nomepaginainesistente.html

    supponfgo che non vada bene

    Devo dire al gestore di inserire un header che dia sempre il 404 ? :mmm:
    Altrimenti che rischi si corrono ?


  • User Attivo

    IO l'ho fatto ho chiesto spiegazioni, ma mi hanno detto che è così che si fa...se leggi sopra Rinzi ci dice che questo non è del tutto vero, che è più una errata usanza...comunque puoi risolvere te con la tua pagina di personalizzazione del 404

    io sono su un server windows e utilizzo una pagina asp per la personalizzazione, quindi ho inserito semplicemente un Response.status = "404 Not Found"


  • Super User

    @scura said:

    io sono su un server windows e utilizzo una pagina asp per la personalizzazione, quindi ho**** inserito semplicemente**** un Response.status = "404 Not Found"

    ottimo 🙂 :fumato:


  • User

    @scura said:

    comunque puoi risolvere te con la tua pagina di personalizzazione del 404
    io sono su un server windows e utilizzo una pagina asp per la personalizzazione, quindi ho inserito semplicemente un Response.status = "404 Not Found"

    Io non ho l'accesso al server, il sito è fatto da altri, e il provider è un terzo.
    Mi potresti far vedere la tua pagina così forse ci capisco qualcosa ?
    Grazie !


  • User Attivo

    neanche io ho l'accesso..

    tu dovresti già avere personalizzato la pagina di errore se non ho capito male, e ora tutte le volte che punti il browser ad una pagina inesistente si visualizza la pagina impostata per la personalizzazione del 404.

    E' così ? se si puoi intervenire su questa pagina inserendo l'opportuno codice

    Che server è, windows o linux?


  • User

    La mia situazione è identica alla tua tranne che è asp.net

    Quello che non capisco è: che cosa è stato fatto materialmente di sbagliato per avere 2 risposte diverse per la pagina htm e la pagina asp ?

    E' stato inserito questo

    Response.Status = "301 Moved Permanently"
    Response.AddHeader("Location", http://www.nomesito.com/)

    Inoltre volevo sapere: che problemi hai avuto con Google a seguito di questo ?


  • User Attivo

    Attenzione che io non ho un 301

    utilizzando il tool indicato sopra ho

    HTTP/1.1 302 Object moved

    per questa situazione sono ancora in attesa di solutions dal mitico hosting 😉

    comunque nessun danno per via di questo, ma non è corretto e va sistemato.


  • User

    Non credo che cambi molto dal punto di vista di ciò che stiamo analizzando, vale a dire, perchè cambia a seconda che sia pagina htm o pagina asp ?


  • User Attivo

    Fai come ho fatto io chiedi spiegazioni agli amministratori del server, loro dovranno darti delle spiegazioni, io sono in attesa... vediamo cosa ci dicono


  • User

    Cioè hai inserito un 404 not found ma ti permane la differenza ?


  • User Attivo

    Finalmente dopo circa una settimana ricevo una mail ... dove capisco che non hanno capito niente, magari io mi sono spiegata male, ma qui invece Rinzi mi ha capito al volo...E' un genio sto ragazzo!!!

    Morale della favola: dicono che dovrò attendere ma che forse non si potrà fare niente...tanto vale a sto punto rinunciare alla personalizzazione, oppure cambiare provider, chissà quale altri fantasmi si nascondano nei loro armadi

    a te Altapur11 com'è andata ?


  • User Attivo

    rinzi ha visto cose che i provider non possono neanche immaginare! 😮

    da me tutto tace...


  • User Attivo

    @John Koenig said:

    rinzi ha visto cose che i provider non possono neanche immaginare! 😮

    da me tutto tace...

    è esattamente così a quanto pare, e me lo aspettavo di ricevere una risposta simile

    Mi chiedo:
    è giusto che un provider ignori totalmente problematiche relative alla navigazione dei siti ospitati sui propri server da parte degli spider dei mdr ?

    forse si se il problema fosse dovuto ad un bug del mdr, ma in altri casi tipo questo dove è il provider a comunicare allo spider una informazione sbagliata ?