Navigazione

    Privacy - Termini e condizioni
    © 2020 Search On Media Group S.r.l.
    • Registrati
    • Accedi
    • CATEGORIES
    • Discussioni
    • Non letti
    • Recenti
    • Hashtags
    • Popolare
    • Utenti
    • Stream
    • Interest
    • Categories
    1. Home
    2. Categorie
    3. Coding e Sistemistica
    4. Hosting e Cloud
    5. Errori LOG non previsti
    Questa discussione è stata cancellata. Solo gli utenti con diritti di gestione possono vederla.
    • M
      matrixman User Attivo • ultima modifica di

      Errori LOG non previsti

      Salve ragazzi!
      Spero di poter avere da voi un aiuto o un chiarimento.
      Dall'analisi dei log sul mio server mi sono accorto che googlebot ed altri bot tentano di seguire e di indicizzare cartelle inesistenti attraverso i percorsi assolti.
      Mi spiego meglio. Ecco un tipico errore:

      [error] [client 66.249.73.175] File does not exist: /home/userid/public_html/**nome-cartella
      **
      In pratica Googlebot cerca di indicizzare una cartella che non esiste e che in realtà ho creato con la riscrittura dei link con htaccess
      Un link tipico del/dei miei siti è questo: w w w . nomesito . com/nome-cartella/nome-pagina.html
      In relta nome-cartella non esiste ma Googlebot cerca di indicizzarla ugualmente
      Vorrei eliminare questo tipo di errore perchè credo che sia negativo per l'indicizzazione del sito.
      Ho un server apache con Cpanel.

      Qualcuno mi potrebbe dare una mano? Grazie.

      0 Miglior Risposta Ringrazia Cita Rispondi

        1 Risposta Ultima Risposta
      • P
        paolino Moderatore • ultima modifica di

        Ho un dubbio su questa frase "In pratica Googlebot cerca di indicizzare una cartella che non esiste e che in realtà ho creato con la riscrittura dei link con htaccess".

        Se c'è il rewrite, allora la directory dovrebbe essere accessibile. Ho capito male?

        Per impedirgli di indicizzare quelle cose lì, potresti usare il robots.txt ( il disallow ). Però se google le cerca, vuol dire che da qualche parte ha visto dei link a quegli url. La domanda è: "dove?"

        0 Miglior Risposta Ringrazia Cita Rispondi

          1 Risposta Ultima Risposta
        • M
          matrixman User Attivo • ultima modifica di

          No, non esiste perché il rewrite è fatto in questo modo

          RewriteRule ^nome-cartella/(.*)-([0-9]+).html pagina.php?action=var&label=$1&id=$2 [L,QSA,NC]

          Per cui la cartella in realtà non esiste...

          Non credo che Google abbia visto i link diretti alla cartella ma come dicevo in precedenza esistono solo link alla pagina finale del tipo:

          nomesito.com/nome-cartella/(.*)-([0-9]+).html

          0 Miglior Risposta Ringrazia Cita Rispondi

            1 Risposta Ultima Risposta
          • P
            paolino Moderatore • ultima modifica di

            A questo punto potresti usare il robots.txt, oppure aggiungere un'altra regola che rimandi gli accessi alle tabelle verso un 404.

            Soprattutto nel secondo caso, i bot dovrebbero smetterla dopo un pò di cercare di accedere a quelle directory.

            0 Miglior Risposta Ringrazia Cita Rispondi

              1 Risposta Ultima Risposta
            • M
              matrixman User Attivo • ultima modifica di

              Ma se aggiungo una regola nel file robots bloccando la cartella, non vado a bloccare anche tutti i link che dipendono da essa (anche se in modo virtuale)?

              0 Miglior Risposta Ringrazia Cita Rispondi

                1 Risposta Ultima Risposta
              • P
                paolino Moderatore • ultima modifica di

                Aspè, ma se sono cartelle inesistenti perchè ci sono dei file dentro?

                0 Miglior Risposta Ringrazia Cita Rispondi

                  1 Risposta Ultima Risposta
                • M
                  matrixman User Attivo • ultima modifica di

                  Non è che ci son file dentro... MI riferivo alla pagina che dipende dalla cartella...

                  nomesito.com/nome-cartella/pagina.html

                  In ratica pagina.html è cose se si trovasse al suo interno anche se non è veramente li perchè nome-cartella l'ho creata solo per posizionare il sito...

                  Quindi se blocco come cartella in teoria dovrei bloccare anche l'accesso a pagina.html

                  0 Miglior Risposta Ringrazia Cita Rispondi

                    1 Risposta Ultima Risposta
                  • P
                    paolino Moderatore • ultima modifica di

                    In questo caso l'unica possibilità è fornire o un index.html ( tramite rewrite ovviamente ) oppure una pagina 404 che fa capire al motore che l'index non c'è.

                    0 Miglior Risposta Ringrazia Cita Rispondi

                      1 Risposta Ultima Risposta
                    Caricamento altri post
                    Rispondi
                    • Topic risposta
                    Effettua l'accesso per rispondere
                    • Da Vecchi a Nuovi
                    • Da Nuovi a Vecchi
                    • Più Voti