• User Attivo

    @Raele-l'Angelo said:

    @PregoPapà said:

    in ogni caso sto' preparando un tutorial x i meno esperti dove è possibile far indicizzare un intero DB con ASP/XML
    😄

    GraziePapa' 😄

    proprio in questo periodo ho cominciato a studiare come indicizzare pagine dinamiche quindi come si dice?...nel posto giusto al momento giusto!! 😄

    ok riporto il link, avrei voluto presentarlo meglio ma per il momento beccatevi questo:
    caricamento nel xml di tutti ifile (fisici presenti nel sito)
    http://www.flashitalia.it/blog/2.htm
    caricamento nel xml di tutti i file (virtuali quindi DB)
    http://www.flashitalia.it/blog/3.htm


  • User Attivo

    scusate se posto 2 volte.

    mi date il nome di qualche dominio dove è già stato messo il sitemap, sto' facendo un controllo che poi postero' qui pubblicamente.

    grazie


  • User

    @maderafina said:

    Una domanda:

    Per lanciare questi comandi bisogna collegarsi al proprio server in telnet?
    E se uno non avesse questa possibilità, cosa bisogna fare?

    Io ieri ho creato il file a mano e con l'aiuto di excel e google lo ha gia letto, ma non so che stia facendo 😞

    Sto cercando di creare qualcosa ma qualcuno mi può spiegare cosa devo fare poi con il sever???

    Grazie a tutti


  • Super User

    @PregoPapà said:

    scusate se posto 2 volte.

    mi date il nome di qualche dominio dove è già stato messo il sitemap, sto' facendo un controllo che poi postero' qui pubblicamente.

    grazie

    http://www.planetathletics.net/site-map/site-map-google.xml
    :ciauz:

    poi ci dici i risultati dei tuoi test vero?
    mi interessa MOLTO MOLTO questa storia


  • User Attivo

    @Tymba said:

    @PregoPapà said:
    scusate se posto 2 volte.

    mi date il nome di qualche dominio dove è già stato messo il sitemap, sto' facendo un controllo che poi postero' qui pubblicamente.

    grazie

    http://www.planetathletics.net/site-map/site-map-google.xml
    :ciauz:

    poi ci dici i risultati dei tuoi test vero?
    mi interessa MOLTO MOLTO questa storia

    Planet Athletics - il portale italiano dedicato **all'**atletica.

    togli l'apice.

    utf-8 lo standard del sitemap manda in errore:
    àèìòù e legge in ascci tutti i caratteri speciali.

    quindi per migliorare la description sarebbe meglio non inserire apici o roba varia.
    questo è l'xml della tua home secondo GG.

    
    <GSP VER="3.2">
    <TM>0.119791</TM>
    <Q>info:http&#58;//www.planetathletics.net</Q>
    <PARAM name="client" value="navclient-auto" original_value="navclient-auto"/>
    <PARAM name="ch" value="63875465800" original_value="63875465800"/>
    <PARAM name="ie" value="UTF-8" original_value="UTF-8"/>
    <PARAM name="oe" value="UTF-8" original_value="UTF-8"/>
    <PARAM name="q" value="info&#58;http&#58;//www.planetathletics.net" original_value="info&#58;http&#58;//www.planetathletics.net"/>
    -
    	<RES SN="1" EN="1">
    <M>1</M>
    <XT/>
    -
    	<R N="1">
    <U>http&#58;//www.planetathletics.net/</U>
    <UE>http&#58;//www.planetathletics.net/</UE>
    <T>Planet Athletics - atletica</T>
    <RK>0</RK>
    -
    	<S>
    Planet Athletics - il portale italiano dedicato all&#39;atletica.
    </S>
    <LANG>it</LANG>
    -
    	<HAS>
    <L/>
    <C SZ="10k" CID="dJsG-BqiI_cJ"/>
    <RT/>
    </HAS>
    </R>
    </RES>
    </GSP>
    
    

    confrontato con altri ho notato che ancora non ha preso il formato di lettura text/html e non hai ancora un crawlerdate.
    qunato tempo fà l'hai segnalato?


  • Bannato User Attivo

    @Tymba said:

    @PregoPapà said:
    scusate se posto 2 volte.

    mi date il nome di qualche dominio dove è già stato messo il sitemap, sto' facendo un controllo che poi postero' qui pubblicamente.

    grazie

    http://www.planetathletics.net/site-map/site-map-google.xml
    :ciauz:

    poi ci dici i risultati dei tuoi test vero?
    mi interessa MOLTO MOLTO questa storia
    Io uso Opera e non mi funziona!
    Questo xml è serio (ma solo per explorer?)


  • User Attivo

    In un precedente post ho chiesto aiuto per i passi da seguire nell'uso del programmino di GG ma a parte un generoso tentativo di Tymba, non c'è stato più nessun riscontro.
    Qualcuno può spiegare in termini comprensibili dai comuni mortali come installare e configurare il programmino di GG, e come proporgli poi i risultati per farsi indicizzare?
    Sono le cose basilari, ma credo che molti, io per primo, non le ho capite.


  • Super User

    il nuovo servizio sitemap lo hanno provato in pochi ancora, chi per mancanza di tempo e chi perchè non lo ritiene ancora necessario,

    io personalmente lo proverò ma per ora ho solo letto le info che da google :ciauz:


  • Super User

    @PregoPapà said:

    @pieru said:
    Visto che anche questo tool mi conferma che il numero di pagine indicizzate da google è in vertiginosa picchiata, probabilmente a causa del panico, sto per fare una ca**ata. Sto preparando un file con 300.000 pagine del sito e provo a darglielo in pasto.

    O la va o la spacca??!!

    Se volete vi tengo informati su come va a finire

    300.000 pagine non ci entrano in un file di 10mb
    io con 30.000 pagine ci sono a stento dentro.

    in ogni caso sto' preparando un tutorial x i meno esperti dove è possibile far indicizzare un intero DB con ASP/XML
    😄

    Non ho ancora finito di preparare il file ma, se ho capito bene le istruzioni basta spezzare su più file e creare una index. Sbaglio??


  • User Attivo

    @pieru said:

    @PregoPapà said:
    @pieru said:
    Visto che anche questo tool mi conferma che il numero di pagine indicizzate da google è in vertiginosa picchiata, probabilmente a causa del panico, sto per fare una ca**ata. Sto preparando un file con 300.000 pagine del sito e provo a darglielo in pasto.

    O la va o la spacca??!!

    Se volete vi tengo informati su come va a finire

    300.000 pagine non ci entrano in un file di 10mb
    io con 30.000 pagine ci sono a stento dentro.

    in ogni caso sto' preparando un tutorial x i meno esperti dove è possibile far indicizzare un intero DB con ASP/XML
    😄

    Non ho ancora finito di preparare il file ma, se ho capito bene le istruzioni basta spezzare su più file e creare una index. Sbaglio??

    
    <?xml version="1.0" encoding="UTF-8"?>
    <sitemapindex xmlns="http://www.google.com/schemas/sitemap/0.84">
       <sitemap>
          <loc>http&#58;//www.dominio.com/sitemap1.xml</loc>
          <lastmod>2005-01-01</lastmod>
       </sitemap>
       <sitemap>
          <loc>http&#58;//www.dominio.com/sitemap2.xml</loc>
          <lastmod>2005-01-01</lastmod>
       </sitemap>
     <sitemap>
          <loc>http&#58;//www.dominio.com/sitemap3.xml</loc>
          <lastmod>2005-01-01</lastmod>
       </sitemap>
    .....
    
    ....
    </sitemapindex>
    
    

    crei 10 sitemap da 10mb e li fai caricare in questo modo.


  • Super User

    Grazie mille!

    Per ora sto ancora producendo l'elenco delle pagine così come piace a lui (lastmod, freq e priority).
    Una curiosità, se produco un unico enorme file di testo e lo do in pasto al tool di google (mi riferisco al "famigerato" script in pyton) ci penserà lui a crearmi i 10 (o quanti ne servono) files?

    Adesso non sono in ufficio ma ricordo che nel file di configurazione occorreva specificare il numero massimo di url, proprio per evitare di superare il limite, come hai giustamente ricordato!


  • User Attivo

    @pieru said:

    Grazie mille!

    Per ora sto ancora producendo l'elenco delle pagine così come piace a lui (lastmod, freq e priority).
    Una curiosità, se produco un unico enorme file di testo e lo do in pasto al tool di google (mi riferisco al "famigerato" script in pyton) ci penserà lui a crearmi i 10 (o quanti ne servono) files?

    Adesso non sono in ufficio ma ricordo che nel file di configurazione occorreva specificare il numero massimo di url, proprio per evitare di superare il limite, come hai giustamente ricordato!

    onestamente, non ci penso proprio ad installare sulle mie macchine un codice a scatola chiusa, soprattutto se parliamo di GG che ormai ha più informazioni della CIA


  • Super User

    Adesso mi sono perso veramente.

    1. Perchè dici a scatola chiusa? Il codice non è leggibile ? Non è uno script in python ?
    2. In ogni caso io volevo usare lo script solo per convertire il file di testo che sto producendo nell'xml che piace a lui ... Questo a voler essere sospettosi lo si può fare anche su un altra macchina, anche non connessa a internet.

    Scusa se insisto "Papà" ma mi hai messo angoscia !!!


  • User Attivo

    Il file xml da dare in pasto a GG può essere limitato ad alcune pagine che si vuole vengano indicizzate ed ampliarlo nel tempo?


  • User Attivo

    @pieru said:

    Adesso mi sono perso veramente.

    1. Perchè dici a scatola chiusa? Il codice non è leggibile ? Non è uno script in python ?
    2. In ogni caso io volevo usare lo script solo per convertire il file di testo che sto producendo nell'xml che piace a lui ... Questo a voler essere sospettosi lo si può fare anche su un altra macchina, anche non connessa a internet.

    Scusa se insisto "Papà" ma mi hai messo angoscia !!!

    non saprei, lo script non l'ho proprio scaricato, quindi non so' dirti quali funzioni possa avere.

    preferisco crearmeli io, poco + suo' c'è una script che lo genera è completamente open source e non ha nessuna funzione segreta.

    a shade:
    si i file possono essere aggiunti anche successivamente, anche io ho pensato che inviare 30000 pagine GG si sarebbe insospettito, ma poi considerato che, con il sito che sto' testando GG lo ha già indicizzato, ho preferito dargli in pasto tutto.


  • User Attivo

    Ho letto solo oggi questa interessantissima discussione, comunque concordo con Rinzi nel prender tempo per usare questo sitemap, trovo che ci siano ancora troppi misteri. :mmm:
    Sopratutto quello di capire perchè GG ha attivato questo servizio?


  • User Attivo

    Rifaccio una domanda senza risposta:
    come e da dove si esegue il comando per eseguire sitemap generator ?
    $ python sitemap_gen.py --config=/path/config.xml


  • Super User

    @shade said:

    Rifaccio una domanda senza risposta:
    come e da dove si esegue il comando per eseguire sitemap generator ?
    $ python sitemap_gen.py --config=/path/config.xml

    Provo a risponderti io anche se non sono uno dei maghi veri che trovi sul forum.
    Devi eseguirlo sul server, cioè in termini pratici ti devi collegare al server con telnet o meglio in ssh.


  • Super User

    Per "papà"

    Scusa sono tornato adesso in ufficio e devo ammettere di non aver letto con la dovuta attenzione il tuo post più e quindi mi era sfuggito il tool che hai creato e reso disponibile!!!

    Ovviamente è ottimo e penso che lo userò per alcuni siti. Purtroppo però non posso usarlo per il mio sito: è un sito dinamico e non ho usato un CMS standard (ce lo siamo fatti a manina). Ho provato anche a usare XENU ma dopo 3 o 4 giorni h indicizzato milioni di pagine ma ne mancavano molte utile e ce ne erano troppe ripetute (per esempio la stessa pagina con ordinamenti differenti, i contenuti sono gli stessi ma lui genera "pagine" diverse)

    Per questo ci staimo facendo a manella (copirait del rispettivo proprietari) un elenco più corretto di pagine da dargli in pasto.

    Spero di non essere sembrato arrogante sono qui per imparare, non avevo affatto sottovaluto il tuo precedente post, semplicemente non lo avevo visto!!!!


  • Super User

    @pieru said:

    Per "papà"

    Scusa sono tornato adesso in ufficio e devo ammettere di non aver letto con la dovuta attenzione il tuo post più sopra e quindi mi era sfuggito il tool che hai creato e reso disponibile!!!

    Ovviamente è ottimo e penso che lo userò per alcuni siti. Purtroppo però non posso usarlo per il mio sito: è un sito dinamico e non ho usato un CMS standard (ce lo siamo fatti a manina). Ho provato anche a usare XENU ma dopo 3 o 4 giorni h indicizzato milioni di pagine ma ne mancavano molte utile e ce ne erano troppe ripetute (per esempio la stessa pagina con ordinamenti differenti, i contenuti sono gli stessi ma lui genera "pagine" diverse)

    Per questo ci staimo facendo a manella (copirait del rispettivo proprietari) un elenco più corretto di pagine da dargli in pasto.

    Spero di non essere sembrato arrogante sono qui per imparare, non avevo affatto sottovaluto il tuo precedente post, semplicemente non lo avevo visto!!!!