• User Attivo

    PDF e motori di ricerca

    Salve,

    c'è qualcuno che sa darmi qualche informazione su come si comportano i motori di ricerca a riguardo dei documenti in PDF.

    Ho notato che google li inserisce nelle ricerche, ma analizza tutte le parole al suo interno ???

    e come si comportano altre search engine tipo MSN ?

    se una gran quantità di documenti sul mio sito sono in PDF le persone riusciranno a rintracciarli attravarso un motore di ricerca ??

    :mmm:


  • User

    Non credo sia una buona idea...
    A meno che gli spider non si avvalgano di convertitori, ma questa mi giungerebbe nuova, non hanno modo di carpire il contenuto di tali file, che probabilmente indicizzano solo in base al titolo e con bassissimo rank:

    TUTTI i motori sono nati per l' HTML.


  • User Attivo

    Ciao

    grazie per la risposta.

    Si lo so che non è una buona idea, ma sul mio sito ci sono un bel po' di pdf (e anche molto lunghi) che accompagnano pagine in HTML. Volevo sapere se almeno una parte del contenuto di questi file sarà visibile ai motore di ricerca.

    Ad esempio Google si limita ad effetuare l'indicizzazione solo sul titolo del file .pdf o riesce a leggere il contenuto dei pdf (almeno in parte) ???


  • Super User

    @sharemind said:

    Salve,

    c'è qualcuno che sa darmi qualche informazione su come si comportano i motori di ricerca a riguardo dei documenti in PDF.

    Ho notato che google li inserisce nelle ricerche, ma analizza tutte le parole al suo interno ???

    e come si comportano altre search engine tipo MSN ?

    se una gran quantità di documenti sul mio sito sono in PDF le persone riusciranno a rintracciarli attravarso un motore di ricerca ??

    :mmm:

    Non ti so dire se indicizzi fino all'ultima riga documenti di centinaia di pagine, tuttavia, per esperienza diretta, ti posso dire che documenti di 60 pagine sono stati indicizzati e rientrano nelle serp con keys contenute nell'ultima riga. Ormai Google li considera testo normale, cosi' pure i file txt, doc, e altri.

    Il problema di questi file e' che non segue i link contenuti in essi, per cui sono vicoli ciechi, tu hai un pdf linkato dalla home, e il link muore li.
    Per la rintracciabilita' dei file pdf stai tranquillo, il problema e' quello che ti ho detto poco fa, per il resto sono normale testo.

    Yahoo li trova tranquillamente, Msn non saprei. Aspettiamo quindi un altro parere.


  • Super User

    Che io sappia, i link nei pdf sono seguiti.


  • User Attivo

    si, i link nei pdf sono seguiti...

    achille


  • User Attivo

    Grazie per le risposte 😄

    Fantastico!! Quindi ricapitolando Google indicizza i file PDF (almeno quelli fino a 60 pagine) e segue i link al loro interno. Ma probabilmente fornisce un Page Rank inferiore rispetto alle pagine in html.

    Anche Yahoo indicizza file .pdf.
    C'è qualcuno che sa come si comportano altri motori di ricerca?:1145470084-Animali


  • User Attivo

    ... Google in particolare ed ormai la maggior parte dei motori di ricerca come Yahoo Msn sono sempre e comunque alla ricerca di documenti contenenti piu' informazioni possibili sotto forma di testo, e quale miglior file se non il pdf puo' che contenere testo..

    Ti consiglio in ogni caso di inserire il title nelle proprietà della pagina e vedrai che otterrai buoni risultati se i tuoi documenti contengono testo.

    Per l'indicizzazione confermo quanto detto in precedenza : Google , Msn , Yahoo indicizzano senza problemi.

    Sui link contenuti nei pdf, credo che vengano seguiti dai motori , ma non ho esperienza in merito, avete informazioni se link inseriti tramite un text link passino valore alle pagine di destinazione ?


  • Super User

    E se ho un testo uguale in una pagina HTML e un PDF viene considerato duplicato oppure visto che sono formati diversi vengono considerate fonti diverse?


  • Community Manager

    Mio consiglio per PDF 😄

    creare sottodominio

    pdf.sito.it

    In questo ci mettete tutti i pdf e fare una directory per raggiungerli 🙂

    :ciauz:


  • Moderatore

    @Gorka said:

    E se ho un testo uguale in una pagina HTML e un PDF viene considerato duplicato oppure visto che sono formati diversi vengono considerate fonti diverse?

    Una pagina in pdf, duplicata di una in html, non viene considerata duplicata. Anzi alcuni test fatti al corso Madri, hanno dimostrato che addirittura con uguali contenuti, venga posizionata meglio una pagina in .pdf

    :ciauz:


  • User Attivo

    ne approfitto della discussione per chiede se google e gli altri motori, seguono i link presenti anche nei documenti Word ed Excel... 🙂

    Ciao, Dario. :ciauz:


  • Super User

    @Giorgiotave said:

    Mio consiglio per PDF 😄

    creare sottodominio

    pdf.sito.it

    In questo ci mettete tutti i pdf e fare una directory per raggiungerli 🙂

    :ciauz:

    Esattamente 😉

    E' il modo migliore per organizzare tutti i pdf, specialmente quando sono centinaia o addirittura migliaia 😉

    La directory può anche vivere di vita propria, raccogliere molte segnalazioni e salire in serp.

    Un consiglio, però, per rendere più fruibili le risorse.
    Cercare di non superare i 2mega di dimensioni massime, ovvero una dimensione che permette, a chi ci accede attraverso le serp, di aprire il documento senza aspettare tempi biblici.

    Se il documento è molto grande, dividetelo in più uscite.