• User Attivo

    In un precedente post ho chiesto aiuto per i passi da seguire nell'uso del programmino di GG ma a parte un generoso tentativo di Tymba, non c'è stato più nessun riscontro.
    Qualcuno può spiegare in termini comprensibili dai comuni mortali come installare e configurare il programmino di GG, e come proporgli poi i risultati per farsi indicizzare?
    Sono le cose basilari, ma credo che molti, io per primo, non le ho capite.


  • Super User

    il nuovo servizio sitemap lo hanno provato in pochi ancora, chi per mancanza di tempo e chi perchè non lo ritiene ancora necessario,

    io personalmente lo proverò ma per ora ho solo letto le info che da google :ciauz:


  • Super User

    @PregoPapà said:

    @pieru said:
    Visto che anche questo tool mi conferma che il numero di pagine indicizzate da google è in vertiginosa picchiata, probabilmente a causa del panico, sto per fare una ca**ata. Sto preparando un file con 300.000 pagine del sito e provo a darglielo in pasto.

    O la va o la spacca??!!

    Se volete vi tengo informati su come va a finire

    300.000 pagine non ci entrano in un file di 10mb
    io con 30.000 pagine ci sono a stento dentro.

    in ogni caso sto' preparando un tutorial x i meno esperti dove è possibile far indicizzare un intero DB con ASP/XML
    😄

    Non ho ancora finito di preparare il file ma, se ho capito bene le istruzioni basta spezzare su più file e creare una index. Sbaglio??


  • User Attivo

    @pieru said:

    @PregoPapà said:
    @pieru said:
    Visto che anche questo tool mi conferma che il numero di pagine indicizzate da google è in vertiginosa picchiata, probabilmente a causa del panico, sto per fare una ca**ata. Sto preparando un file con 300.000 pagine del sito e provo a darglielo in pasto.

    O la va o la spacca??!!

    Se volete vi tengo informati su come va a finire

    300.000 pagine non ci entrano in un file di 10mb
    io con 30.000 pagine ci sono a stento dentro.

    in ogni caso sto' preparando un tutorial x i meno esperti dove è possibile far indicizzare un intero DB con ASP/XML
    😄

    Non ho ancora finito di preparare il file ma, se ho capito bene le istruzioni basta spezzare su più file e creare una index. Sbaglio??

    
    <?xml version="1.0" encoding="UTF-8"?>
    <sitemapindex xmlns="http://www.google.com/schemas/sitemap/0.84">
       <sitemap>
          <loc>http&#58;//www.dominio.com/sitemap1.xml</loc>
          <lastmod>2005-01-01</lastmod>
       </sitemap>
       <sitemap>
          <loc>http&#58;//www.dominio.com/sitemap2.xml</loc>
          <lastmod>2005-01-01</lastmod>
       </sitemap>
     <sitemap>
          <loc>http&#58;//www.dominio.com/sitemap3.xml</loc>
          <lastmod>2005-01-01</lastmod>
       </sitemap>
    .....
    
    ....
    </sitemapindex>
    
    

    crei 10 sitemap da 10mb e li fai caricare in questo modo.


  • Super User

    Grazie mille!

    Per ora sto ancora producendo l'elenco delle pagine così come piace a lui (lastmod, freq e priority).
    Una curiosità, se produco un unico enorme file di testo e lo do in pasto al tool di google (mi riferisco al "famigerato" script in pyton) ci penserà lui a crearmi i 10 (o quanti ne servono) files?

    Adesso non sono in ufficio ma ricordo che nel file di configurazione occorreva specificare il numero massimo di url, proprio per evitare di superare il limite, come hai giustamente ricordato!


  • User Attivo

    @pieru said:

    Grazie mille!

    Per ora sto ancora producendo l'elenco delle pagine così come piace a lui (lastmod, freq e priority).
    Una curiosità, se produco un unico enorme file di testo e lo do in pasto al tool di google (mi riferisco al "famigerato" script in pyton) ci penserà lui a crearmi i 10 (o quanti ne servono) files?

    Adesso non sono in ufficio ma ricordo che nel file di configurazione occorreva specificare il numero massimo di url, proprio per evitare di superare il limite, come hai giustamente ricordato!

    onestamente, non ci penso proprio ad installare sulle mie macchine un codice a scatola chiusa, soprattutto se parliamo di GG che ormai ha più informazioni della CIA


  • Super User

    Adesso mi sono perso veramente.

    1. Perchè dici a scatola chiusa? Il codice non è leggibile ? Non è uno script in python ?
    2. In ogni caso io volevo usare lo script solo per convertire il file di testo che sto producendo nell'xml che piace a lui ... Questo a voler essere sospettosi lo si può fare anche su un altra macchina, anche non connessa a internet.

    Scusa se insisto "Papà" ma mi hai messo angoscia !!!


  • User Attivo

    Il file xml da dare in pasto a GG può essere limitato ad alcune pagine che si vuole vengano indicizzate ed ampliarlo nel tempo?


  • User Attivo

    @pieru said:

    Adesso mi sono perso veramente.

    1. Perchè dici a scatola chiusa? Il codice non è leggibile ? Non è uno script in python ?
    2. In ogni caso io volevo usare lo script solo per convertire il file di testo che sto producendo nell'xml che piace a lui ... Questo a voler essere sospettosi lo si può fare anche su un altra macchina, anche non connessa a internet.

    Scusa se insisto "Papà" ma mi hai messo angoscia !!!

    non saprei, lo script non l'ho proprio scaricato, quindi non so' dirti quali funzioni possa avere.

    preferisco crearmeli io, poco + suo' c'è una script che lo genera è completamente open source e non ha nessuna funzione segreta.

    a shade:
    si i file possono essere aggiunti anche successivamente, anche io ho pensato che inviare 30000 pagine GG si sarebbe insospettito, ma poi considerato che, con il sito che sto' testando GG lo ha già indicizzato, ho preferito dargli in pasto tutto.


  • User Attivo

    Ho letto solo oggi questa interessantissima discussione, comunque concordo con Rinzi nel prender tempo per usare questo sitemap, trovo che ci siano ancora troppi misteri. :mmm:
    Sopratutto quello di capire perchè GG ha attivato questo servizio?


  • User Attivo

    Rifaccio una domanda senza risposta:
    come e da dove si esegue il comando per eseguire sitemap generator ?
    $ python sitemap_gen.py --config=/path/config.xml


  • Super User

    @shade said:

    Rifaccio una domanda senza risposta:
    come e da dove si esegue il comando per eseguire sitemap generator ?
    $ python sitemap_gen.py --config=/path/config.xml

    Provo a risponderti io anche se non sono uno dei maghi veri che trovi sul forum.
    Devi eseguirlo sul server, cioè in termini pratici ti devi collegare al server con telnet o meglio in ssh.


  • Super User

    Per "papà"

    Scusa sono tornato adesso in ufficio e devo ammettere di non aver letto con la dovuta attenzione il tuo post più e quindi mi era sfuggito il tool che hai creato e reso disponibile!!!

    Ovviamente è ottimo e penso che lo userò per alcuni siti. Purtroppo però non posso usarlo per il mio sito: è un sito dinamico e non ho usato un CMS standard (ce lo siamo fatti a manina). Ho provato anche a usare XENU ma dopo 3 o 4 giorni h indicizzato milioni di pagine ma ne mancavano molte utile e ce ne erano troppe ripetute (per esempio la stessa pagina con ordinamenti differenti, i contenuti sono gli stessi ma lui genera "pagine" diverse)

    Per questo ci staimo facendo a manella (copirait del rispettivo proprietari) un elenco più corretto di pagine da dargli in pasto.

    Spero di non essere sembrato arrogante sono qui per imparare, non avevo affatto sottovaluto il tuo precedente post, semplicemente non lo avevo visto!!!!


  • Super User

    @pieru said:

    Per "papà"

    Scusa sono tornato adesso in ufficio e devo ammettere di non aver letto con la dovuta attenzione il tuo post più sopra e quindi mi era sfuggito il tool che hai creato e reso disponibile!!!

    Ovviamente è ottimo e penso che lo userò per alcuni siti. Purtroppo però non posso usarlo per il mio sito: è un sito dinamico e non ho usato un CMS standard (ce lo siamo fatti a manina). Ho provato anche a usare XENU ma dopo 3 o 4 giorni h indicizzato milioni di pagine ma ne mancavano molte utile e ce ne erano troppe ripetute (per esempio la stessa pagina con ordinamenti differenti, i contenuti sono gli stessi ma lui genera "pagine" diverse)

    Per questo ci staimo facendo a manella (copirait del rispettivo proprietari) un elenco più corretto di pagine da dargli in pasto.

    Spero di non essere sembrato arrogante sono qui per imparare, non avevo affatto sottovaluto il tuo precedente post, semplicemente non lo avevo visto!!!!


  • User Attivo

    @pieru said:

    Devi eseguirlo sul server, cioè in termini pratici ti devi collegare al server con telnet o meglio in ssh.

    Sono operazioni che non ho mai avuto modo di eseguire,
    Come ci si collega con telnet o ssh?


  • Super User

    @shade said:

    @pieru said:
    Devi eseguirlo sul server, cioè in termini pratici ti devi collegare al server con telnet o meglio in ssh.

    Sono operazioni che non ho mai avuto modo di eseguire,
    Come ci si collega con telnet o ssh?

    Normalmente il tuo provider dovrebbe fornirti tutte le istruzioni del caso.
    Posso darti solo delle istruzioni generiche.

    Lo scopo dei due sistemi è di aprire una finestra di comando dal tuo computer direttamente sul tuo server. Praticamente come se fossi lì fisicamente. Una volta collegato hai una finestra, tipo prompt di ms-dos per intenderci e da lì puoi eseguire i comandi, ok fino a qui ?
    Una volta collegato è come se tu usassi la tua tastiera e il tuo monitor direttamente sul server. Quindi se il tuo server è linux dovrai usare comandi linux altrimenti comandi dos-windows.
    Ci sei ancora?

    Come ci si collega hai chiesto?

    1. Molti provider "seri" non forniscono la possibilità di collegarsi in telnet perchè questo protocollo è considerato poco sicuro. Ad ogni modo per il collegamento fai start esegui, scrivi telnet e dai invio.
      Si apre la finistra scrivi open, il nome del tuo host e dai invio. Ti chiederà username e password e se autenticato ci sei
    2. SSH è molto più sicuro. Questo in un certo senso è più semplice, devi trovare un software di connessione e seguire le istruzioni del programma Io per esempio uso SSH terms che è aperto e gratuito ma ce ne sono tanti altri. Ti connetti al server, di solito in questo caso da menù ma dipende dal software, e anche in questo caso dopo aver fornito username e password valide sei connesso.

    Spero di esserti stato utile

    Pier


  • User Attivo

    @pieru said:

    Per "papà"

    Scusa sono tornato adesso in ufficio e devo ammettere di non aver letto con la dovuta attenzione il tuo post più e quindi mi era sfuggito il tool che hai creato e reso disponibile!!!

    Ovviamente è ottimo e penso che lo userò per alcuni siti. Purtroppo però non posso usarlo per il mio sito: è un sito dinamico e non ho usato un CMS standard (ce lo siamo fatti a manina). Ho provato anche a usare XENU ma dopo 3 o 4 giorni h indicizzato milioni di pagine ma ne mancavano molte utile e ce ne erano troppe ripetute (per esempio la stessa pagina con ordinamenti differenti, i contenuti sono gli stessi ma lui genera "pagine" diverse)

    Per questo ci staimo facendo a manella (copirait del rispettivo proprietari) un elenco più corretto di pagine da dargli in pasto.

    Spero di non essere sembrato arrogante sono qui per imparare, non avevo affatto sottovaluto il tuo precedente post, semplicemente non lo avevo visto!!!!

    🙂 tranquillo 🙂

    il mio script è generico, quindi mi sembra ovvio che non puo' soddisfare esigenze particolari e quando si parla di query a DB spesso uno script generico non puo' interagire correttamente.

    in definitiva: Buon lavoro, xchè da quanto ho capito ne stai facendo tanto :ciauz:


  • User

    Il mio sito:

    Host: 66.249.65.203 /robots.txt
    Http Code: 200 Date: Jun 10 13:41:12 Http Version: HTTP/1.1 Size in Bytes: 24
    Referer: -
    Agent: Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)

    /sitemap.xml
    Http Code: 200 Date: Jun 10 13:46:15 Http Version: HTTP/1.1 Size in Bytes: 13668
    Referer: -
    Agent: Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)

    Host: 66.249.66.36 /sitemap.xml
    Http Code: 200 Date: Jun 10 01:41:08 Http Version: HTTP/1.1 Size in Bytes: 13668
    Referer: -
    Agent: Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)

    Host: 66.249.65.70 /robots.txt
    Http Code: 200 Date: Jun 09 13:30:54 Http Version: HTTP/1.1 Size in Bytes: 24
    Referer: -
    Agent: Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)

    /sitemap.xml
    Http Code: 200 Date: Jun 09 13:35:57 Http Version: HTTP/1.1 Size in Bytes: 13668
    Referer: -
    Agent: Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)


  • User

    Volevo segnalare questo link per l'autocomposizione del sitemap

    http://sitemap.chinookwebs.com/docs.htm

    a me non riesce ma sicuramente da inesperto ho sbagliato qualcosa. Qualcuno vuole provare??


  • Super User

    @PregoPapà said:

    🙂 tranquillo 🙂

    il mio script è generico, quindi mi sembra ovvio che non puo' soddisfare esigenze particolari e quando si parla di query a DB spesso uno script generico non puo' interagire correttamente.

    in definitiva: Buon lavoro, xchè da quanto ho capito ne stai facendo tanto :ciauz:

    In effetti me 'sto quasi a ammazzà !!!!
    Ieri sera o meglio stamattina alle 5 ho finito! Ho sottoposto la mappa al fetente e appena due ore fa se l'è scaricata.
    Sono un bel po' di pagine, spero che finalmente si degni di leggermente un altro po'.

    Buon week end!