• User Attivo

    p.s. visto il poema che ho scritto e l'ora in cui l'ho scritto (alba profonda ancora per me) NON AZZARDARTI A DIRE CHE NON ERA QUELLO CHE VOLEVI SAPERE.

    Se passi da queste parti (Rimini) vieni a trovarmi che ti offro la colazione, anche perchè:

    NON ERA QUELLO CHE VOLEVO SAPERE

    Le tue istruzioni sono utilissime in qualsiasi caso, io purtroppo 😄 ho circa 80.000 pagine da indicizzare e volevo utilizzare il "programmino", perciò ho bisogno di chiarimenti sulla sua configurazione ed uso.

    PS. caffe o cappuccino?


  • Super User

    :arrabbiato: :arrabbiato: :arrabbiato: :arrabbiato:

    va buò, la prim volta che passo da rimini ti faccio un fischio allora 😄

    :ciauz:


  • User Attivo

    Once you have copied the files to your webserver, you'll need to run the Sitemap Generator script. Connect to your webserver and run the following command:

    $ python sitemap_gen.py --config=/path/config.xml
    

    Tip: If you're testing your configuration and are not ready to submit your sitemap, the following syntax will prevent Sitemap Generator from contacting Google:

    $ python sitemap_gen.py --config=/path/config.xml --testing

    Il trafiletto sopra viene dalle istruzioni del GG sitemap.
    Scusate la mia ignoranza, ma qualcuno mi spiega cosa si intende per: connettiti al tuo server e lancia il seguente comando?
    in che modo?
    da dove?


  • User

    Una domanda:

    Per lanciare questi comandi bisogna collegarsi al proprio server in telnet?
    E se uno non avesse questa possibilità, cosa bisogna fare?

    Io ieri ho creato il file a mano e con l'aiuto di excel e google lo ha gia letto, ma non so che stia facendo 😞


  • User Attivo

    <%
    Response.ContentType="text/xml"
    Response.Expires = -1
    %><?xml version='1.0' encoding='UTF-8'?>

    <urlset xmlns="http://www.google.com/schemas/sitemap/0.84">

    <url>
    <loc>indirizzo</loc>
    <lastmod>modifica</lastmod>
    <changefreq>a</changefreq>
    <priority>b</priority>
    </url>

    </urlset>

    con mozillone si vede mentre con ie6 no :mmm:

    sullo stesso server ho un XML molto molto + complesso e sia IE che Moz. lo leggono benissimo

    per piacere aiutatemi altrimenti sfascio tutto 😢


  • User Attivo

    @maderafina said:

    Io ieri ho creato il file a mano e con l'aiuto di excel e google lo ha gia letto, ma non so che stia facendo 😞

    Io per tenere d'occhio l'andamento delle indicizzazioni uso questo:
    http://www.yourcache.com


  • User

    Grazie Shade

    questo è il mio risultato:
    Results for URL: www.maderafina.net Datacenters
    216.239.57.98 191
    216.239.57.99 191
    216.239.57.104 191
    216.239.57.105 191
    216.239.53.104 208
    216.239.53.99 206
    66.102.7.104 208
    66.102.7.99 208
    66.102.7.105 206
    66.102.7.147 208
    216.239.57.106 191
    216.239.57.107 191
    216.239.53.106 208
    216.239.53.107 206
    216.239.39.104 191
    216.239.39.99 191
    216.239.37.104 191
    216.239.37.99 191
    216.239.37.105 191
    216.239.37.147 191
    216.239.39.107 191
    216.239.39.106 191
    216.239.37.107 191
    216.239.37.106 191
    216.239.59.99 84
    216.239.59.104 191
    66.102.11.99 84
    66.102.9.99 84
    66.102.9.104 84
    66.102.11.104 84
    216.239.59.105 84
    Va da 84 a 208, è meglio che questi valori siano alti, o tutti uguali o un po alti e bassi?
    Come li interpreto? 😎


  • User Attivo

    @maderafina said:

    Va da 84 a 208, è meglio che questi valori siano alti, o tutti uguali o un po alti e bassi?
    Come li interpreto? 😎

    I valori ti dicono quante pagine sono indicizzate per ogni datacenter di GG.
    I datacenter non sono tutti allineati e per avere un certo livellamento dei valori passerà un pò di tempo.
    Se domani ripeti l'operazione, ti darà i valori del momento ma anche quelli di oggi permettendoti di fare un confronto dell'andamento.

    PS. facendo click sul numero delle pagine in parte al datacenter, verrà richiamato GG che ti mostrerà quali sono le pagine indicizzate fino a quel momento.


  • Super User

    Visto che anche questo tool mi conferma che il numero di pagine indicizzate da google è in vertiginosa picchiata, probabilmente a causa del panico, sto per fare una ca**ata. Sto preparando un file con 300.000 pagine del sito e provo a darglielo in pasto.
    O la va o la spacca??!!

    Se volete vi tengo informati su come va a finire


  • User Attivo

    @pieru said:

    Visto che anche questo tool mi conferma che il numero di pagine indicizzate da google è in vertiginosa picchiata, probabilmente a causa del panico, sto per fare una ca**ata. Sto preparando un file con 300.000 pagine del sito e provo a darglielo in pasto.
    O la va o la spacca??!!

    Se volete vi tengo informati su come va a finire

    300.000 pagine non ci entrano in un file di 10mb
    io con 30.000 pagine ci sono a stento dentro.

    in ogni caso sto' preparando un tutorial x i meno esperti dove è possibile far indicizzare un intero DB con ASP/XML
    😄


  • User Attivo

    @PregoPapà said:

    in ogni caso sto' preparando un tutorial x i meno esperti dove è possibile far indicizzare un intero DB con ASP/XML
    😄

    GraziePapa' 😄

    proprio in questo periodo ho cominciato a studiare come indicizzare pagine dinamiche quindi come si dice?...nel posto giusto al momento giusto!! 😄


  • Super User

    ma numeri così alti di pagine come li fate? forum? gallery? :mmm: :mmm:

    io ho raggiunto ora le 1500 pagine ma mi sono sbattuto parecchio per creare una pagina per ogni foto ed il sito ha come risorsa principale la gallerya di immagini.

    come diavolo si raggiungono siti da 300.000 pagine????


  • Super User

    @Tymba said:

    ma numeri così alti di pagine come li fate? forum? gallery? :mmm: :mmm:

    io ho raggiunto ora le 1500 pagine ma mi sono sbattuto parecchio per creare una pagina per ogni foto ed il sito ha come risorsa principale la gallerya di immagini.

    come diavolo si raggiungono siti da 300.000 pagine????

    Per esempio se hai le schede di 30.000 alberghi e le hai tradotte in 3 lingue sei già a 90.000.
    Il problema è che anche se cerco di seguire i consigli che trovo su questo ottimo sito, inevitabilmente ho una struttura complessa, con le info importanti in fondo. Non riesco a spingere il fetente in fondo, lui fa un po' quello che gli pare zompettando qua e là e ripassando 800 volte su una pagina che non cambierà mai. Magari questo sitemap ....


  • Super User

    se hai 30.000 schede di alberghi e te le sei tradotte in 3 lingue... tanto di cappello.

    le mie sono pagine generate in automatico, carico centinaia di foto in varie cartelle e faccio generare le pagine.

    tu te le sei smazzate a manina da quanto ho capito. COMPLIMENTI!


  • Super User

    @Tymba said:

    se hai 30.000 schede di alberghi e te le sei tradotte in 3 lingue... tanto di cappello.

    le mie sono pagine generate in automatico, carico centinaia di foto in varie cartelle e faccio generare le pagine.

    tu te le sei smazzate a manina da quanto ho capito. COMPLIMENTI!
    Ti ringrazio ma ... non è che ho fatto tutto solo e ci è voluto anche un po' di tempo!
    Comunque si, in realtà gli alberghi sono di più ma solo 30.000 schede sono "decentemente aggiornate" le altre le tengo in stand by


  • User Attivo

    @Raele-l'Angelo said:

    @PregoPapà said:

    in ogni caso sto' preparando un tutorial x i meno esperti dove è possibile far indicizzare un intero DB con ASP/XML
    😄

    GraziePapa' 😄

    proprio in questo periodo ho cominciato a studiare come indicizzare pagine dinamiche quindi come si dice?...nel posto giusto al momento giusto!! 😄

    ok riporto il link, avrei voluto presentarlo meglio ma per il momento beccatevi questo:
    caricamento nel xml di tutti ifile (fisici presenti nel sito)
    http://www.flashitalia.it/blog/2.htm
    caricamento nel xml di tutti i file (virtuali quindi DB)
    http://www.flashitalia.it/blog/3.htm


  • User Attivo

    scusate se posto 2 volte.

    mi date il nome di qualche dominio dove è già stato messo il sitemap, sto' facendo un controllo che poi postero' qui pubblicamente.

    grazie


  • User

    @maderafina said:

    Una domanda:

    Per lanciare questi comandi bisogna collegarsi al proprio server in telnet?
    E se uno non avesse questa possibilità, cosa bisogna fare?

    Io ieri ho creato il file a mano e con l'aiuto di excel e google lo ha gia letto, ma non so che stia facendo 😞

    Sto cercando di creare qualcosa ma qualcuno mi può spiegare cosa devo fare poi con il sever???

    Grazie a tutti


  • Super User

    @PregoPapà said:

    scusate se posto 2 volte.

    mi date il nome di qualche dominio dove è già stato messo il sitemap, sto' facendo un controllo che poi postero' qui pubblicamente.

    grazie

    http://www.planetathletics.net/site-map/site-map-google.xml
    :ciauz:

    poi ci dici i risultati dei tuoi test vero?
    mi interessa MOLTO MOLTO questa storia


  • User Attivo

    @Tymba said:

    @PregoPapà said:
    scusate se posto 2 volte.

    mi date il nome di qualche dominio dove è già stato messo il sitemap, sto' facendo un controllo che poi postero' qui pubblicamente.

    grazie

    http://www.planetathletics.net/site-map/site-map-google.xml
    :ciauz:

    poi ci dici i risultati dei tuoi test vero?
    mi interessa MOLTO MOLTO questa storia

    Planet Athletics - il portale italiano dedicato **all'**atletica.

    togli l'apice.

    utf-8 lo standard del sitemap manda in errore:
    àèìòù e legge in ascci tutti i caratteri speciali.

    quindi per migliorare la description sarebbe meglio non inserire apici o roba varia.
    questo è l'xml della tua home secondo GG.

    
    <GSP VER="3.2">
    <TM>0.119791</TM>
    <Q>info:http&#58;//www.planetathletics.net</Q>
    <PARAM name="client" value="navclient-auto" original_value="navclient-auto"/>
    <PARAM name="ch" value="63875465800" original_value="63875465800"/>
    <PARAM name="ie" value="UTF-8" original_value="UTF-8"/>
    <PARAM name="oe" value="UTF-8" original_value="UTF-8"/>
    <PARAM name="q" value="info&#58;http&#58;//www.planetathletics.net" original_value="info&#58;http&#58;//www.planetathletics.net"/>
    -
    	<RES SN="1" EN="1">
    <M>1</M>
    <XT/>
    -
    	<R N="1">
    <U>http&#58;//www.planetathletics.net/</U>
    <UE>http&#58;//www.planetathletics.net/</UE>
    <T>Planet Athletics - atletica</T>
    <RK>0</RK>
    -
    	<S>
    Planet Athletics - il portale italiano dedicato all&#39;atletica.
    </S>
    <LANG>it</LANG>
    -
    	<HAS>
    <L/>
    <C SZ="10k" CID="dJsG-BqiI_cJ"/>
    <RT/>
    </HAS>
    </R>
    </RES>
    </GSP>
    
    

    confrontato con altri ho notato che ancora non ha preso il formato di lettura text/html e non hai ancora un crawlerdate.
    qunato tempo fà l'hai segnalato?