Navigazione

    Privacy - Termini e condizioni
    © 2020 Search On Media Group S.r.l.
    • Registrati
    • Accedi
    • CATEGORIES
    • Discussioni
    • Non letti
    • Recenti
    • Hashtags
    • Popolare
    • Utenti
    • Stream
    • Interest
    • Categories
    1. Home
    2. Categorie
    3. Digital Marketing
    4. SEO
    5. Modifica robots.txt con wildcard
    Questa discussione è stata cancellata. Solo gli utenti con diritti di gestione possono vederla.
    • overclokk
      overclokk Moderatore • ultima modifica di

      Così come sono scritte non hanno senso, quello è il bot di google per adsense e con il disallow senza barra dici semplicemente a quel bot che può scansionare le pagine del tuo sito (tutte), il fatto è che scritto così si usa mettere se prima blocchi qualche bot o tutti, per esempio:

      
      User-agent: Googlebot 
      Disallow: /  
      User-agent: Mediapartners-Google 
      Disallow:
      

      Dice al bot di google di non scansionare ma il bot per adsense (che è sempre di google) può farlo.

      A meno che tu non abbia asigenze particolari non ti serve, casomai inserisci all'inizio questo:

      
      User-agent: * 
      Allow: /
      Disallow: /search 
      Disallow: /*archive.html 
      

      Ti ho anche inserito le altre due righe di codice così è pronto per essere copiato ed incollato 🙂

      Ciao
      Enea

      0 Miglior Risposta Ringrazia Cita Rispondi

        1 Risposta Ultima Risposta
      • Z
        zombiekb User • ultima modifica di

        😮

        Quindi mi stai dicendo che così com'era impostato mi stava limitando nel posizionamento sui vari motori di ricerca?

        Zio Billy !!!

        0 Miglior Risposta Ringrazia Cita Rispondi

          1 Risposta Ultima Risposta
        • overclokk
          overclokk Moderatore • ultima modifica di

          No, non ho mai detto questo, ho detto che avere quel comando e non averlo era la stessa cosa :D, quindi meglio avere meno codice possibile e file più leggeri.

          Ciao
          Enea

          0 Miglior Risposta Ringrazia Cita Rispondi

            1 Risposta Ultima Risposta
          • Z
            zombiekb User • ultima modifica di

            Ah...ok, mi stava venendo un crampo al cervello 😄

            Grazie 1000 !!!

            Ciao!

            0 Miglior Risposta Ringrazia Cita Rispondi

              1 Risposta Ultima Risposta
            • overclokk
              overclokk Moderatore • ultima modifica di

              Di nulla 😄

              Se hai altri problemi usa pure il forum 😄

              Ciao
              Enea

              0 Miglior Risposta Ringrazia Cita Rispondi

                1 Risposta Ultima Risposta
              • Z
                zombiekb User • ultima modifica di

                In effetti avevo già aperto un thread (Sviluppo e Gestione siti --> web Scripting lato client --> Ottimizzazione caricamento script) ma forse l'ho farcito troppo... 🙂

                Che dici?

                Ciao!

                0 Miglior Risposta Ringrazia Cita Rispondi

                  1 Risposta Ultima Risposta
                • Z
                  zombiekb User • ultima modifica di

                  Ciao Enea,

                  scusa ancora il disturbo...ma ho cercato qualche informazione su internet e non sono riuscito a farmi un'idea precisa:

                  la compilazione del robot.txt sostituisce la presenza dentro il codice della pagina del meta robot ad esempio <meta content='index,follow' name='robots'/> ?

                  Te lo chiedo perché ho notato che in una delle pagine che dovrebbero ora dovrebbero avere il disallow come da robot.txt, guardando le informazioni della pagina hanno invece un index,follow 😐

                  grazie del chiarimento

                  0 Miglior Risposta Ringrazia Cita Rispondi

                    1 Risposta Ultima Risposta
                  • overclokk
                    overclokk Moderatore • ultima modifica di

                    Ciao ZombieKB,
                    in teoria il robots dovrebbe essere il primo file che il crawler legge, ad ogni modo che sia bloccata in un modo o nell'altro (sempre in teoria) non dovrebbe considerare quella pagina.

                    Ciao
                    Enea

                    0 Miglior Risposta Ringrazia Cita Rispondi

                      1 Risposta Ultima Risposta
                    • Z
                      zombiekb User • ultima modifica di

                      Ciao 🙂

                      Quindi posso rimuoverli tranquillamente? Non vorrei che mi creassero conflitti...

                      Grazie!

                      0 Miglior Risposta Ringrazia Cita Rispondi

                        1 Risposta Ultima Risposta
                      • overclokk
                        overclokk Moderatore • ultima modifica di

                        Prima di rimuoverli segui la procedura corretta 🙂

                        Ciao
                        Enea

                        0 Miglior Risposta Ringrazia Cita Rispondi

                          1 Risposta Ultima Risposta
                        • Z
                          zombiekb User • ultima modifica di

                          ...che sarebbe?

                          Thanx 🙂

                          0 Miglior Risposta Ringrazia Cita Rispondi

                            1 Risposta Ultima Risposta
                          • Z
                            zombiekb User • ultima modifica di

                            Scusa ancora...mi sono accorto di una cosa curiosa, nel codice del template ho queste cose

                            Appena subito sotto l'apertura dell' <head> ho questo:

                            <b:if cond='data:blog.pageType == &quot;archive&quot;'>
                            <meta content='noindex,noarchive' name='robots'/>
                            </b:if> 
                            

                            poco più sotto questo:

                            <meta content='index,follow' name='robots'/>
                            

                            E' esattamente quello che è specificato nel robots.txt giusto?

                            0 Miglior Risposta Ringrazia Cita Rispondi

                              1 Risposta Ultima Risposta
                            • overclokk
                              overclokk Moderatore • ultima modifica di

                              Il primo codice dice di non indicizzare e non archiviare il contenuto della pagina (hai presente la cache di google? Quella!)
                              Il secondo invece dice di indicizzare e seguire i link.

                              A prescindere da ciò che hai nel robots una delle due righe va eliminata, tieni quella che è più utile in quel caso specifico.

                              Ciao
                              Enea

                              0 Miglior Risposta Ringrazia Cita Rispondi

                                1 Risposta Ultima Risposta
                              • Z
                                zombiekb User • ultima modifica di

                                Grazie 1000 Enea 🙂

                                Prezioso come sempre!

                                Ciao

                                0 Miglior Risposta Ringrazia Cita Rispondi

                                  1 Risposta Ultima Risposta
                                Caricamento altri post
                                Rispondi
                                • Topic risposta
                                Effettua l'accesso per rispondere
                                • Da Vecchi a Nuovi
                                • Da Nuovi a Vecchi
                                • Più Voti