- Home
- Categorie
- Digital Marketing
- Posizionamento Nei Motori di Ricerca
- Occorre inserire nel robot.txt l'esclusione dei PDF?
-
Occorre inserire nel robot.txt l'esclusione dei PDF?
Un dubbio, se voglio pubblicare la versione PDF di un articolo che ho già pubblicato in html debbo escluderlo dall'indicizzazione tramite il file robot.txt?
-
Si, sarebbero contenuti duplicati.
-
Non è una cosa necessaria da fare.
Solitamente non causa problemi, ma se vuoi dare forza alla risorsa non PDF puoi mettere un canonical nell'header HTTP del pdf.
-
Ok grazie per il chiarimento.
Ne approfitto per aggiungere una considerazione sul problema dei contenuti duplicati.
E' più che comprensibile che i motori vogliano filtrare i contenuti duplicati quando si tratta di articoli o guide di qualsiasi genere.
Il discorso diventa più complicato quando si tratta di pubblicare documenti ufficiali i quali, ovviamente, non possono essere modificati.
Se voglio pubblicare ad esempio il testo di una sentenza della Corte di Cassazione non posso certo modificarla ma quel contenuto probabilmente sarà pubblicato anche da numerosi altri siti Internet.
Cosa accade a questo punto? Se la Corte di Cassazione rendesse pubbliche le sentenze (strano che ancora non faccia) allora non solo non ci sarebbe bisogno di pubblicarle (basterebbe mettere un link alla fonte ufficiale nell'articolo in cui si parla di quella sentenza) ma basterebbe anche applicare come tu hai suggerito il rel canonical.
Purtroppo non è così perché la Cassazione pubblica solo pochissime sentenze e tutte le altre sono pubblicate dai diversi siti giuridici.
Bisognerà capire come si regolerà Google in questi casi. Per il momento mi sembra che vengano indicizzate tutte anche se poi la prevalenza (in termini di posizionamento) viene data in base ai soliti criteri (segnali social, autorevolezza del sito, link in ingresso, h1 etc...).
-
Beh sì. In questo caso puoi farci poco a meno di aggiungere una considerazione tua prima di mettere la sentenza.
-
Ad esempio mi viene in mente come i siti sportivi gestiscono i comunicati ufficiali delle varie squadre, in pratica non copiano tutto il comunicato ma ne estraggono dei pezzi, commentandolo, poi mettono pure il link.
-
Un'ottima soluzione, quella che utilizzano i siti sportivi.
Io attualmente pubblico articoli (giuridici) che illustrano il contenuto delle sentenze e poi a fondo articolo metto un link con l'attributo rel="nofollow" al PDF della sentenza commentata che devo necessariamente caricare nel sito perché la fonte ufficiale (ossia la Cassazione) raramente ne pubblica il testo.Per le Leggi dello Stato il problema non si pone più perché c'è ora un sito istituzionale (normattiva.it) dove ci sono tutti i provvedimenti normativi e viene fornito anche un permalink. A quel punto chi ha un sito giuridico può limitarsi a illustrare e commentare con articoli originali i contenuti delle leggi e limitarsi a mettere un link al testo che si trova sul normattiva.it oppure sulla Gazzetta Ufficiale (gazzettaufficiale.it).
In ogni caso mi sembra che, anche se si pubblicano documenti ufficiali, ciò che conta è sempre il valore aggiunto che gli si conferisce e quindi ben venga il tuo suggerimento della "premessa introduttiva" che adottano i siti sportivi.
-
Da quello che avevo capito roby128150460 dal tuo commento di prima il contenuto non era presente in un sito ufficiale.
Se è presente basta mettere il canonical all'originale oppure un itemprop="sameAs" vero l'originale.
Vale comunque sempre la pena dare valore aggiunto altrimenti perché dovrei visitare il tuo sito e non l'originale?
-
In realtà nel sito ufficiale della cassazione non ci sono tutte le sentenze.
Se una sentenza non è stata pubblicata nel sito istituzionale io posso però farne una copia in cancelleria e pubblicarla.
Quella pubblicazione però non può avere copyright e tutti possono prenderla e duplicarla.
Insomma l'unica soluzione è quella che hai suggerito tu: una premessa originale
-
Ti converrebbe scrivere un tuo testo, originale, e poi linkare il pdf della sentenza. In questo caso, non vai in duplicato ( o meglio, il pdf duplicato non arreca danno, anche perchè le visite sul pdf, sono visite "offline")
-
Ottima idea. Grazie.