Navigazione

    Privacy - Termini e condizioni
    © 2020 Search On Media Group S.r.l.
    • Registrati
    • Accedi
    • CATEGORIES
    • Discussioni
    • Non letti
    • Recenti
    • Hashtags
    • Popolare
    • Utenti
    • Stream
    • Interest
    • Categories
    1. Home
    2. Categorie
    3. Digital Marketing
    4. SEO
    5. Indicizzazione di pagine /wp-content/ su Wordpress
    Questa discussione è stata cancellata. Solo gli utenti con diritti di gestione possono vederla.
    • I
      isotopia User Attivo • ultima modifica di

      Grazie per l'aiuto,
      in effetti anch'io non capisco perchè vengano indicizzate.
      Credo si tratti di vere pagine a tutti gli effetti che contengono ciascuna lunghe liste di risorse .jpg.

      Potrei mettere il noindex da htaccess o da file robots, tuttavia come farei ad escludere il blocco sui singoli path, considerando che numericamente le immagini sono moltissime?

      0 Miglior Risposta Ringrazia Cita Rispondi

        merlinox filippo.jatta 2 Risposte Ultima Risposta
      • merlinox
        merlinox Moderatore • ultima modifica di @isotopia

        @isotopia da robots.txt il noindex non si può più fare, anche se Google diceva non esistesse.
        Io andrei a capire "chi" crea quelle pagine e lo bloccherei.
        Se non mandi URL dura capire però.

        0 Miglior Risposta Ringrazia Cita Rispondi

          1 Risposta Ultima Risposta
        • kal
          kal Contributor • ultima modifica di

          Normalmente quelle cartelle hanno un 403 Forbidden che dovrebbe impedirne l'indicizzazione.

          Se vengono indicizzate, vuol dire che restituiscono 200 OK.

          E se hanno un 200 OK vuol dire che sono stati scazzati in qualche modo i permessi delle cartelle. O direttamente sul server o in qualche modo all'interno del file .htaccess o a causa di qualche plugin.

          Non ci sono molte altre alternative.

          Consiglio standard: controlla che i permessi delle cartelle siano tutti 755, controlla che nel file htaccess non ci siano istruzioni strane oltre allo standard e disattiva tutti i plugin e riattivali uno per uno per capire quale è quello che combina guai.

          Una volta che hai capito e risolto il problema e le cartelle tornano a restituire un 403 Forbidden puoi anche dimenticarti della cosa: Google le rimuoverà dall'indice coi suoi tempi.

          0 Miglior Risposta 1 Ringrazia Cita Rispondi

            1 Risposta Ultima Risposta
          • filippo.jatta
            filippo.jatta User Attivo • ultima modifica di @isotopia

            @isotopia ha detto in Indicizzazione di pagine /wp-content/ su Wordpress:

            Potrei mettere il noindex da htaccess o da file robots, tuttavia come farei ad escludere il blocco sui singoli path, considerando che numericamente le immagini sono moltissime

            Non va bene il noindex, perchè costringi comunque il crawler a scansionare quelle pagine. Vanno messe in disallow, se non riesci a eliminarle.

            0 Miglior Risposta 1 Ringrazia Cita Rispondi

              merlinox 1 Risposta Ultima Risposta
            • merlinox
              merlinox Moderatore • ultima modifica di @filippo.jatta

              @filippo-jatta ha detto in Indicizzazione di pagine /wp-content/ su Wordpress:

              perchè costringi comunque il crawler a scansionare quelle pagine

              Mi pare un po' un volo pindarico questa affermazione.
              Qui il problema è:

              • perché ci sono quelle pagine
              • come le ha scoperte il crawler (link, sitemap, ...)

              Il noindex oltre a forzare la rimozione di una pagina dalle SERP porta lo scheduler a ridurre nel tempo la scansione. Non solo: porta anche - se persistente per lunga durata (=tante scansioni) a portare i suoi link in uno stato di "virtuale" nofollow.

              0 Miglior Risposta Ringrazia Cita Rispondi

                kal 1 Risposta Ultima Risposta
              • kal
                kal Contributor • ultima modifica di @merlinox

                @merlinox sul come le ha scoperte è presto detto: Googlebot è noto che provi a scansionare le sottocartelle "per vedere che cosa trova".

                Sì aspettano un 403 e di solito non indicizzano.

                Ma se per errore hai settato un 200...

                0 Miglior Risposta Ringrazia Cita Rispondi

                  1 Risposta Ultima Risposta
                • I
                  isotopia User Attivo • ultima modifica di

                  Grazie a tutti.
                  Ecco un esempio di queste pagine:

                  https://www.resmedia.it/wp-content/uploads/2018/06/

                  C'è una lunga serie di pagine indicizzate di questo tipo.
                  Il sito è costruito su Wordpress. Ora, mi chiedo quale sia la soluzione percorribile e migliore tra:

                  • Applicare un Disallow su robots.txt per la cartella /wp-content/uploads/. . A questo punto la mia domanda è: Così facendo però vado a de-indicizzare anche tutte le risorse .jpg elencate in queste pagine, dunque in sostanza le immagini del mio sito? Se così fosse, non è attuabile
                  • Un NO-Index da htaccess valido per l'intera sottocartella, ma ho lo stesso dubbio di cui sopra.
                  • Reindirizzare tutte queste pagine può creare dei malfunzionamenti al sito?
                  • Impostare come suggerite uno status code 403 Forbidden (attualmente sono 200, indicizzabili) per tutta la sottocartella /wp-content/uploads/ ?
                  0 Miglior Risposta Ringrazia Cita Rispondi

                    kal merlinox 2 Risposte Ultima Risposta
                  • kal
                    kal Contributor • ultima modifica di kal @isotopia

                    @isotopia ha detto in Indicizzazione di pagine /wp-content/ su Wordpress:

                    Impostare come suggerite uno status code 403 Forbidden (attualmente sono 200, indicizzabili) per tutta la sottocartella /wp-content/uploads/ ?

                    Assolutamente questo.

                    403 forbidden sulle cartelle è il default di Wordpress e questa cosa non dovrebbe succedere.

                    0 Miglior Risposta 0 Ringrazia Cita Rispondi

                      1 Risposta Ultima Risposta
                    • merlinox
                      merlinox Moderatore • ultima modifica di @isotopia

                      @isotopia NON sono pagine, sono listing di server. Devi togliere il permesso da web server.

                      1 Miglior Risposta 1 Ringrazia Cita Rispondi

                        1 Risposta Ultima Risposta
                      • I
                        isotopia User Attivo • ultima modifica di

                        Ok d'accordo, faccio impostare un 403. Grazie a tutti.

                        1 Miglior Risposta Ringrazia Cita Rispondi

                          1 Risposta Ultima Risposta
                        Caricamento altri post
                        Rispondi
                        • Topic risposta
                        Effettua l'accesso per rispondere
                        • Da Vecchi a Nuovi
                        • Da Nuovi a Vecchi
                        • Più Voti