Navigazione

    Privacy - Termini e condizioni
    © 2020 Search On Media Group S.r.l.
    • Registrati
    • Accedi
    • CATEGORIES
    • Discussioni
    • Non letti
    • Recenti
    • Hashtags
    • Popolare
    • Utenti
    • Stream
    • Interest
    • Categories
    1. Home
    2. svany
    3. Discussioni
    S

    svany

    @svany

    • Profilo
    • Chi segue 0
    • Da chi è seguito 0
    • Discussioni 2
    • Post 5
    • Migliore 0
    • Gruppi 0
    Iscrizione Ultimo Accesso
    Età 47
    0
    Reputazione
    10
    Post
    0
    Visite al profilo
    0
    Da chi è seguito
    0
    Chi segue
    User Newbie

    badges

    0
    Bookmarks
    0
    Voti
    0
    Ringraziamenti
    0
    Miglior risposte
    Inizia una nuova discussione
    di cosa vuoi parlare?

    Discussioni create da svany

    • Topic
      Post
      View
      Votazioni
      Post
      Attività
    • S

      Title mostrato in SERP non equivalente a quanto scritto dentro al relativo META TAG
      SEO • • svany  

      12
      885
      Visualizzazioni
      0
      Votazioni
      12
      Post

      simone.paciarelli

      si proprio adesso ho rimandato la segnalazione di un sito.

      Vediamo un pò

      grazie

    • S

      File robots.txt da posizionare non in root
      SEO • • svany  

      4
      923
      Visualizzazioni
      0
      Votazioni
      4
      Post

      federico.sasso

      Ciao Svany,

      @Svany said:

      Per svariati motivi non posso posizionare il file robots.txt nella radice del sito, posso posizionarlo in una cartella diversa? Se sì, come faccio a "dire" a google di andare a leggere il file txt nella posizione scelta?
      L'implementazione di Google è tollerante verso i redirect sul file robots.txt (in questo aderisce all'originale RFC del 1997).
      La documentazione di Google lascia intendere sia possibile tenerlo altrove, impostando un opportuno redirect da /robots.txt alla nuova destinazione (es. /cartella/robots.txt)

      Eccoti il link e un'estratto della documentazione:
      https://developers.google.com/webmasters/control-crawl-index/docs/robots_txt

      3xx (redirection)Redirects will generally be followed until a valid result can be found (or a loop is recognized). We will follow a limited number of redirect hops (RFC 1945 for HTTP/1.0 allows up to 5 hops) and then stop and treat it as a 404. Handling of robots.txt redirects to disallowed URLs is undefined and discouraged. Handling of logical redirects for the robots.txt file based on HTML content that returns 2xx (frames, JavaScript, or meta refresh-type redirects) is undefined and discouraged.
      Non ho mai provato, vale un tentativo.

      Potresti anche adottare una soluzione alternativa:
      **ritornare **in risposta a /robots.txt uno Status Code HTTP 503 ("Service unavailable"). Un motore di ricerca non indicizzerebbe il contenuto. Ti sconsiglio di ritornare un errore HTTP 500 generico perché Google (lo puoi leggere nella documentazione sopra link-ata) potrebbe interpretare come un 404 mal configurato e accedere comunque ai contenuti.

      Occhio (enfasi mia):
      @Svany said:

      avrei questo problema: devo disattivare dall'indicizzazione un intero sito web, dominio di terzo livello xxx.miosito.it
      Tieni conto che bloccare da robots.txt non necessariamente preclude l'indicizzazione, alcuni contenuti potrebbero essere indicizzati - almeno da Google - lo stesso qualora trovasse link sufficienti per ritenerla una risorsa potenzialmente importante da indicizzare (bloccare da robots.txt un sito temporaneo, esposto solo privatamente, etc.. è una pratica comune, anch'io lo faccio e non ho mai avuto problemi particolare se non quando il blocco da robots.txt è stato annullato da qualche tecnico distratto).

      Spero d'esserti stato utile