• User

    [Altri] GSiteClawler - Problema di indicizzare di alcuni link

    Spero di aver pubblicato nella sezione giusta.
    Ho un problema nell'usare GSiteClawler. In pratica l'operazione di indicizzazione e creazione sitemap avviene senza alcun problema, a causa di un problema che ancora non riesco a risolvere, vorrei che GSiteClawler non indicizzasse alcune pagine del sito in questione.

    Vi faccio un esempio (evitando di fare spam):
    Il mio sito - nomesito. est - ha una pagina in cui sono presenti dei banner di affiliazioni e, per ogni banner è presente il codice HTML per essere inserito nelle pagine web in cui compare appunto il link al sito. Questa pagina di affiliazioni si trova in questa posizione: nomesito. est/ affiliazioni/

    Al momento dell'indicizzazione con GSiteClawler, il software indicizza anche questa pagina, e non solo: inizia a trovare ed indicizzare centinaia di pagine di questo tipo: nomesito. est/ affiliazioni/ &/ &/ &/....
    CENTER
    [/CENTER]
    Sicuramente il fatto che siano presenti delle "&" sarà dato dal fatto che all'interno si trovi il link al sito o, sinceramente non so cosa...è da capire.

    Ora vorrei che GSiteClawler non indicizzi la pagina affiliazioni e tutti i suoi derivati. Nel programma, all'interno di Filtri -> Ban URL, ho inserito "/affiliazioni", ho reindicizzato il sito ma continua ad indicizzarmi quelle pagine.

    Qualcuno può darmi una mano?

    Tipo:
    Altri


  • Moderatore

    Ciao pinosiciliano e Benvenuto nel Forum GT.

    Una domanda, ma quella directory l'hai bloccata col robots.txt?


  • User

    Grazie PsYCHo.
    Sarà questo il problema, perchè il robots è stato aggiornato l'ultima volta dal plugin per Wordpress "XML google sitemaps", quindi ha questi riferimenti:

    BEGIN XML-SITEMAP-PLUGIN

    Sitemap: [indirizzo-sito-web/sitemap.xml.gz

    END XML-SITEMAP-PLUGIN

    pensi che il problema sia dovuto a questo? Cosa dovrei aggiungere per evitare questi problemi di indicizzazione?

    MOD: Ho appena aggiunto le eccezioni a GSiteClawler. Non ho aggiunto tutti i link completi ma soltanto la parte "affiliazioni", ho fatto bene? Il problema è che, dopo 8-10 minuti che il programma è avviato, non mi trova l'articolo che ho pubblicato qualche ora fa.


  • User

    Ho risolto. Grazie lo stesso.