• User Attivo

    Sitemap tramite Feed RSS

    Ciao a tutti.
    Ho notato che in google webmaster tool posso segnalare anche dei Feed RSS come sitemap del sito.

    Secondo voi è conveniente quando si hanno un centinaio di nuove pagine ogni giorno?

    Nella sitemap principale ho 18'000 link inviati a google (6700 indicizzati).

    Mi converrebbe aggiungere i feed piuttosto che una sitemap?
    Ho un feed per ogni categoria, quindi potrei mettere una 30ina di feed rss.

    Qualcuno usa gli RSS per sitemap?
    :ciauz:


  • Moderatore

    Ciao.

    Si, conoscevo questa cosa e in un caso l'ho anche consigliata ad un amico che non poteva comportarsi altrimenti.

    Ora che ho letto questo tuo messaggio ho anche deciso di fare un piccolo test... perchè ad esempio in certi casi questa potrebbe essere una soluzione abbastanza 'economica' in termini di carico sul server (quindi per siti con frequenza di aggiornamento molto elevata e con scarse risorse hardware a disposizione).

    Nello specifico infatti riscontro il fatto che per siti di dimensioni simili o maggiori a quelle da te indicate i più comuni programmi di generazione delle sitemaps 'impegnano' il server quel tanto che basta per 'dare fastidio'... soprattutto se si tratta di siti i cui contenuti crescono costantemente, e in cui la sitemap andrebbe quindi rigenerata abbastanza spesso.

    La cosa che farei (e che farò, probabilmente) è comunque quella di creare una sitemapindex che indichi l'indirizzo dei vari feed... se non altro per non dover segnalare 30 sitemap, ma una sola che le raccoglie e le linka tutte.

    La sintassi per generare una sitemapindex è veramente semplice.

    Buona idea, secondo me.
    Almeno in certi casi questa può essere un'ottima idea (cioè economica, semplice e 'leggera').

    Proviamo.

    🙂


  • User Attivo

    Si, quando devo rigenerare la sitemap inpiega anche diverse ore, perchè scandaglia tutto, anche quello che non gli dico di analizzare, quindi arriva anche a metterci 2 orette. In questo tempo spesso il sito rimane irraggiungibile.
    Solitamente lo faccio a notte fonda.

    Non so se sperimentare o cosa. Pensi che rischio di perdere pagine indicizzate cambiando completamente la sitemap in una sitemap con dentro solo i feed?


  • Moderatore

    @n1gH7 said:

    [...] arriva anche a metterci 2 orette. In questo tempo spesso il sito rimane irraggiungibile.
    Solitamente lo faccio a notte fonda.

    E infatti avevo immaginato che la tua domanda derivasse da problemi del genere.

    Chiaramente è impensabile che tu vada avanti in questo modo.

    Soprattutto se si tratta di un sito che viene aggiornato spesso .

    Che software usi? Gsitecrawler?

    Dai 'tempi' che nomini direi di si.

    Ovviamente esistono in commercio software migliori... e probabilmente un programmatore potrebbe svilupparti uno script su misura per le tue esigenze.

    Rimane il fatto che la generazione di sitemap molto grandi è impegnativa per il server... e anche volendo settare un cron notturno secondo me è inaccettabile pianificare dei down ripetuti.

    In fondo l'obiettivo è quello di favorire l'indicizzazione, nulla di diverso.

    Probabilmente potrebbe farci comodo il parere di qualcun altro che è incappato in un simile problema, soprattutto per consigliarti qualche software.

    Tenendo in considerazione che una sitemap non dovrebbe pesare più di 5 mega... quindi appunto si tratta anche di confrontarsi con dimensioni che non possono essere supportate con script come GsiteCrawler (o almeno, questa è la mia esperienza.... ma anche script più 'completi' come PhpSitemapNG impegnano molto il server, anche se sono più rapidi e possono essere lanciati attraverso un cron).

    D'altra parte Xml è uno dei linguaggi più verbosi in assoluto... quindi strutturalmente 'pesanti'.

    Se qualcuno può indicarci un software in grado di affrontare sitemap del genere senza gravare troppo sulle risorse di sistema... LO ATTENDIAMO con fiducia.

    🙂

    Ti posso premettere che si tratta sicuramente di qualcosa 'a pagamento'.. tra i software gratuiti non ce n'è uno 'pronto' in grado di aiutarti.

    Oppure ti fai uno script tuo partendo dal protocollo open source messo a disposizione da Google stesso.
    Il tuo server deve suportare Pyton, se non ricordo male.

    Trovi tutto qui: http://code.google.com/p/googlesitemapgenerator/

    Ma non sono sicuro che risolva il problema di fondo (e cioè la scansione di un sito medio-grande in un sistema con risorse hardware limitate).


    Per mia esperienza in ogni caso direi che non dovresti subire perdite di documenti indicizzati 'in modo particolare'.

    E' chiaro che avere la sitemap 'tradizionale' è la soluzione migliore... ma occorre anche vedere 'a che prezzo'.

    Inoltre è evidente che di per sè la sitemap non garantisce in ogni caso la totale indicizzazione di un sito: e un url già ben indicizzato non scompare dall'indice di Google solo perchè lo estrometti da una sitemap o perchè ne fai totalmente a meno.

    In attesa di pareri più qualificati trovo che la tua idea sia valida, quindi.

    🙂


  • User Attivo

    Ho deciso di provare a segnalare, oltre che alla sitemap, alcuni feed rss importanti. Farò sapere i risultati.

    Fino ad ora usavo xml-sitemap (.com), l'ho anche comprato. Sempre trovato bene per siti piccoli. FIno a qualche mese fa pure il sito dove ho il problema non dava rallentamenti. Lo strumento è ottimo.

    Il server in ogni caso è un dedicato, e ci ospito una 20ina di siti.


  • User Attivo

    A pochi giorni di distanza, Google ha indicizzato oltre 13'000 pagine in più, arrivando ad avere 19'900 pagine indicizzate.

    13'000 Pagine non fanno parte della sitemap, che da quando ho scritto questo topic non ho più aggiornato.

    Quindi sono quasi per forza state prelevate da Feed RSS.

    Direi che è un'ottimo risultato per chi aggiorna molto il sito e ha un centinaio di nuove pagine ogni giorno da indicizzare.

    Ho notato che gli ultimi articoli che vengono segnalati su addalo, vengono indicizzati molto velocemente, cosa basilare per un sito social news.

    Spero che questa mia esperienza serva da via per altri siti con questi problemi.

    Da oggi segnalerò solo Feed RSS e una sitemap generale.

    Saluti!


  • User Newbie

    Questa discussione mi interessa particolarmente e mi permetto di agganciarmi: ho creato da poco un forum e in fatto di codici html sono una neofita in questo campo e sto cercando di imparare il più possibile giorno per giorno anche se non è facile.
    Ho riscontrato difficoltà nell'inserire una sitemap nel mio forum ed ho visto che c'è invece la possibilità di indicizzare con i feed, ma, in che modo?
    C'e cortesemente, un 'passo passo' per capire come effettuare questo tipo di indicizzazione?
    Grazie! :gthi:


  • Moderatore

    Ciao Kyra_00.

    🙂

    Come spero avrai constatato in questo 3d facevamo riferimento a siti particolarmente larghi, aggiornati ogni giorno con decine e centinaia di nuovi contenuti.

    Discutevamo quindi una soluzione 'estrema' come quella di utilizzare i feed come sitemap per ovviare a problemi tecnici legati anche alle prestazioni del server e al consumo di risorse.

    Insomma, è bene che tu abbia chiaro che questo NON è il modo corretto di realizzare una sitemap.

    Oltretutto credo che le piattaforme per fare i forum abbiano degli script appositi in grado di generare automaticamente la tua sitemap: ora non conosco nello specifico il tuo software nè tantomeno le condizioni del server in cui è ospitato il tuo sito.. ma forse puoi provare a chiedere un consiglio nella sezione riservata agli amministratori di forum, dove probabilmente c'è qualcuno che saprà darti indicazioni più precise.

    In ogni caso - e fatte salve tutte queste premesse - Big G accetta la segnalazione diretta del feed come 'facente funzione' di una vera e propria sitemap xml.

    Vale a dire che nel tuo pannello presso il Google Webmaster Tool puoi segnalare l'indirizzo del tuo feed laddove normalmente si usa segnalare l'indirizzo della propria sitemap.

    Quindi qualcosa come esempio.com/feed.xml

    Nel tuo caso l'indirizzo è ilgiardinosegreto.forumcommunity.net/rss.php?c=430297

    Ma devo assolutamente ribadire il concetto: avendo un forum molto giovane sarebbe molto meglio se tu riuscissi a produrre una vera sitemap !!!


  • User Attivo

    Salve,

    anch'io ho lo stesso problema vostro con dedine di pagine nuove indicizzate ogni giorno. I programmi finora utilizzati sono estremamente insoddisfacenti, durano ore e ore, impiegano molte risorse sul server. Poi in una settima, devo rifare nuovamente il lavoro.

    Utilizzando i feed rss, indicizzerei solo una piccola percentuale di tutto l'archivio dati. Possibile che non ci sia sul mercato online un prodotto professionale a pagamento per questo tipo di esigenza? Quali sono i migliori software in circolazione?