- Home
- Categorie
- La Community Connect.gt
- Tutto sulla Community
- SiteMap - nuovo servizio Google
-
il nuovo servizio sitemap lo hanno provato in pochi ancora, chi per mancanza di tempo e chi perchè non lo ritiene ancora necessario,
io personalmente lo proverò ma per ora ho solo letto le info che da google
-
@PregoPapà said:
@pieru said:
Visto che anche questo tool mi conferma che il numero di pagine indicizzate da google è in vertiginosa picchiata, probabilmente a causa del panico, sto per fare una ca**ata. Sto preparando un file con 300.000 pagine del sito e provo a darglielo in pasto.O la va o la spacca??!!
Se volete vi tengo informati su come va a finire
300.000 pagine non ci entrano in un file di 10mb
io con 30.000 pagine ci sono a stento dentro.in ogni caso sto' preparando un tutorial x i meno esperti dove è possibile far indicizzare un intero DB con ASP/XML
Non ho ancora finito di preparare il file ma, se ho capito bene le istruzioni basta spezzare su più file e creare una index. Sbaglio??
-
@pieru said:
@PregoPapà said:
@pieru said:
Visto che anche questo tool mi conferma che il numero di pagine indicizzate da google è in vertiginosa picchiata, probabilmente a causa del panico, sto per fare una ca**ata. Sto preparando un file con 300.000 pagine del sito e provo a darglielo in pasto.O la va o la spacca??!!
Se volete vi tengo informati su come va a finire
300.000 pagine non ci entrano in un file di 10mb
io con 30.000 pagine ci sono a stento dentro.in ogni caso sto' preparando un tutorial x i meno esperti dove è possibile far indicizzare un intero DB con ASP/XML
Non ho ancora finito di preparare il file ma, se ho capito bene le istruzioni basta spezzare su più file e creare una index. Sbaglio??
<?xml version="1.0" encoding="UTF-8"?> <sitemapindex xmlns="http://www.google.com/schemas/sitemap/0.84"> <sitemap> <loc>http://www.dominio.com/sitemap1.xml</loc> <lastmod>2005-01-01</lastmod> </sitemap> <sitemap> <loc>http://www.dominio.com/sitemap2.xml</loc> <lastmod>2005-01-01</lastmod> </sitemap> <sitemap> <loc>http://www.dominio.com/sitemap3.xml</loc> <lastmod>2005-01-01</lastmod> </sitemap> ..... .... </sitemapindex>
crei 10 sitemap da 10mb e li fai caricare in questo modo.
-
Grazie mille!
Per ora sto ancora producendo l'elenco delle pagine così come piace a lui (lastmod, freq e priority).
Una curiosità, se produco un unico enorme file di testo e lo do in pasto al tool di google (mi riferisco al "famigerato" script in pyton) ci penserà lui a crearmi i 10 (o quanti ne servono) files?Adesso non sono in ufficio ma ricordo che nel file di configurazione occorreva specificare il numero massimo di url, proprio per evitare di superare il limite, come hai giustamente ricordato!
-
@pieru said:
Grazie mille!
Per ora sto ancora producendo l'elenco delle pagine così come piace a lui (lastmod, freq e priority).
Una curiosità, se produco un unico enorme file di testo e lo do in pasto al tool di google (mi riferisco al "famigerato" script in pyton) ci penserà lui a crearmi i 10 (o quanti ne servono) files?Adesso non sono in ufficio ma ricordo che nel file di configurazione occorreva specificare il numero massimo di url, proprio per evitare di superare il limite, come hai giustamente ricordato!
onestamente, non ci penso proprio ad installare sulle mie macchine un codice a scatola chiusa, soprattutto se parliamo di GG che ormai ha più informazioni della CIA
-
Adesso mi sono perso veramente.
- Perchè dici a scatola chiusa? Il codice non è leggibile ? Non è uno script in python ?
- In ogni caso io volevo usare lo script solo per convertire il file di testo che sto producendo nell'xml che piace a lui ... Questo a voler essere sospettosi lo si può fare anche su un altra macchina, anche non connessa a internet.
Scusa se insisto "Papà" ma mi hai messo angoscia !!!
-
Il file xml da dare in pasto a GG può essere limitato ad alcune pagine che si vuole vengano indicizzate ed ampliarlo nel tempo?
-
@pieru said:
Adesso mi sono perso veramente.
- Perchè dici a scatola chiusa? Il codice non è leggibile ? Non è uno script in python ?
- In ogni caso io volevo usare lo script solo per convertire il file di testo che sto producendo nell'xml che piace a lui ... Questo a voler essere sospettosi lo si può fare anche su un altra macchina, anche non connessa a internet.
Scusa se insisto "Papà" ma mi hai messo angoscia !!!
non saprei, lo script non l'ho proprio scaricato, quindi non so' dirti quali funzioni possa avere.
preferisco crearmeli io, poco + suo' c'è una script che lo genera è completamente open source e non ha nessuna funzione segreta.
a shade:
si i file possono essere aggiunti anche successivamente, anche io ho pensato che inviare 30000 pagine GG si sarebbe insospettito, ma poi considerato che, con il sito che sto' testando GG lo ha già indicizzato, ho preferito dargli in pasto tutto.
-
Ho letto solo oggi questa interessantissima discussione, comunque concordo con Rinzi nel prender tempo per usare questo sitemap, trovo che ci siano ancora troppi misteri.
Sopratutto quello di capire perchè GG ha attivato questo servizio?
-
Rifaccio una domanda senza risposta:
come e da dove si esegue il comando per eseguire sitemap generator ?
$ python sitemap_gen.py --config=/path/config.xml
-
@shade said:
Rifaccio una domanda senza risposta:
come e da dove si esegue il comando per eseguire sitemap generator ?
$ python sitemap_gen.py --config=/path/config.xmlProvo a risponderti io anche se non sono uno dei maghi veri che trovi sul forum.
Devi eseguirlo sul server, cioè in termini pratici ti devi collegare al server con telnet o meglio in ssh.
-
Per "papà"
Scusa sono tornato adesso in ufficio e devo ammettere di non aver letto con la dovuta attenzione il tuo post più e quindi mi era sfuggito il tool che hai creato e reso disponibile!!!
Ovviamente è ottimo e penso che lo userò per alcuni siti. Purtroppo però non posso usarlo per il mio sito: è un sito dinamico e non ho usato un CMS standard (ce lo siamo fatti a manina). Ho provato anche a usare XENU ma dopo 3 o 4 giorni h indicizzato milioni di pagine ma ne mancavano molte utile e ce ne erano troppe ripetute (per esempio la stessa pagina con ordinamenti differenti, i contenuti sono gli stessi ma lui genera "pagine" diverse)
Per questo ci staimo facendo a manella (copirait del rispettivo proprietari) un elenco più corretto di pagine da dargli in pasto.
Spero di non essere sembrato arrogante sono qui per imparare, non avevo affatto sottovaluto il tuo precedente post, semplicemente non lo avevo visto!!!!
-
@pieru said:
Per "papà"
Scusa sono tornato adesso in ufficio e devo ammettere di non aver letto con la dovuta attenzione il tuo post più sopra e quindi mi era sfuggito il tool che hai creato e reso disponibile!!!
Ovviamente è ottimo e penso che lo userò per alcuni siti. Purtroppo però non posso usarlo per il mio sito: è un sito dinamico e non ho usato un CMS standard (ce lo siamo fatti a manina). Ho provato anche a usare XENU ma dopo 3 o 4 giorni h indicizzato milioni di pagine ma ne mancavano molte utile e ce ne erano troppe ripetute (per esempio la stessa pagina con ordinamenti differenti, i contenuti sono gli stessi ma lui genera "pagine" diverse)
Per questo ci staimo facendo a manella (copirait del rispettivo proprietari) un elenco più corretto di pagine da dargli in pasto.
Spero di non essere sembrato arrogante sono qui per imparare, non avevo affatto sottovaluto il tuo precedente post, semplicemente non lo avevo visto!!!!
-
@pieru said:
Devi eseguirlo sul server, cioè in termini pratici ti devi collegare al server con telnet o meglio in ssh.
Sono operazioni che non ho mai avuto modo di eseguire,
Come ci si collega con telnet o ssh?
-
@shade said:
@pieru said:
Devi eseguirlo sul server, cioè in termini pratici ti devi collegare al server con telnet o meglio in ssh.Sono operazioni che non ho mai avuto modo di eseguire,
Come ci si collega con telnet o ssh?Normalmente il tuo provider dovrebbe fornirti tutte le istruzioni del caso.
Posso darti solo delle istruzioni generiche.Lo scopo dei due sistemi è di aprire una finestra di comando dal tuo computer direttamente sul tuo server. Praticamente come se fossi lì fisicamente. Una volta collegato hai una finestra, tipo prompt di ms-dos per intenderci e da lì puoi eseguire i comandi, ok fino a qui ?
Una volta collegato è come se tu usassi la tua tastiera e il tuo monitor direttamente sul server. Quindi se il tuo server è linux dovrai usare comandi linux altrimenti comandi dos-windows.
Ci sei ancora?Come ci si collega hai chiesto?
- Molti provider "seri" non forniscono la possibilità di collegarsi in telnet perchè questo protocollo è considerato poco sicuro. Ad ogni modo per il collegamento fai start esegui, scrivi telnet e dai invio.
Si apre la finistra scrivi open, il nome del tuo host e dai invio. Ti chiederà username e password e se autenticato ci sei - SSH è molto più sicuro. Questo in un certo senso è più semplice, devi trovare un software di connessione e seguire le istruzioni del programma Io per esempio uso SSH terms che è aperto e gratuito ma ce ne sono tanti altri. Ti connetti al server, di solito in questo caso da menù ma dipende dal software, e anche in questo caso dopo aver fornito username e password valide sei connesso.
Spero di esserti stato utile
Pier
- Molti provider "seri" non forniscono la possibilità di collegarsi in telnet perchè questo protocollo è considerato poco sicuro. Ad ogni modo per il collegamento fai start esegui, scrivi telnet e dai invio.
-
@pieru said:
Per "papà"
Scusa sono tornato adesso in ufficio e devo ammettere di non aver letto con la dovuta attenzione il tuo post più e quindi mi era sfuggito il tool che hai creato e reso disponibile!!!
Ovviamente è ottimo e penso che lo userò per alcuni siti. Purtroppo però non posso usarlo per il mio sito: è un sito dinamico e non ho usato un CMS standard (ce lo siamo fatti a manina). Ho provato anche a usare XENU ma dopo 3 o 4 giorni h indicizzato milioni di pagine ma ne mancavano molte utile e ce ne erano troppe ripetute (per esempio la stessa pagina con ordinamenti differenti, i contenuti sono gli stessi ma lui genera "pagine" diverse)
Per questo ci staimo facendo a manella (copirait del rispettivo proprietari) un elenco più corretto di pagine da dargli in pasto.
Spero di non essere sembrato arrogante sono qui per imparare, non avevo affatto sottovaluto il tuo precedente post, semplicemente non lo avevo visto!!!!
tranquillo
il mio script è generico, quindi mi sembra ovvio che non puo' soddisfare esigenze particolari e quando si parla di query a DB spesso uno script generico non puo' interagire correttamente.
in definitiva: Buon lavoro, xchè da quanto ho capito ne stai facendo tanto
-
Il mio sito:
Host: 66.249.65.203 /robots.txt
Http Code: 200 Date: Jun 10 13:41:12 Http Version: HTTP/1.1 Size in Bytes: 24
Referer: -
Agent: Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)/sitemap.xml
Http Code: 200 Date: Jun 10 13:46:15 Http Version: HTTP/1.1 Size in Bytes: 13668
Referer: -
Agent: Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)Host: 66.249.66.36 /sitemap.xml
Http Code: 200 Date: Jun 10 01:41:08 Http Version: HTTP/1.1 Size in Bytes: 13668
Referer: -
Agent: Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)Host: 66.249.65.70 /robots.txt
Http Code: 200 Date: Jun 09 13:30:54 Http Version: HTTP/1.1 Size in Bytes: 24
Referer: -
Agent: Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)/sitemap.xml
Http Code: 200 Date: Jun 09 13:35:57 Http Version: HTTP/1.1 Size in Bytes: 13668
Referer: -
Agent: Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)
-
Volevo segnalare questo link per l'autocomposizione del sitemap
http://sitemap.chinookwebs.com/docs.htm
a me non riesce ma sicuramente da inesperto ho sbagliato qualcosa. Qualcuno vuole provare??
-
@PregoPapà said:
tranquillo
il mio script è generico, quindi mi sembra ovvio che non puo' soddisfare esigenze particolari e quando si parla di query a DB spesso uno script generico non puo' interagire correttamente.
in definitiva: Buon lavoro, xchè da quanto ho capito ne stai facendo tanto
In effetti me 'sto quasi a ammazzà !!!!
Ieri sera o meglio stamattina alle 5 ho finito! Ho sottoposto la mappa al fetente e appena due ore fa se l'è scaricata.
Sono un bel po' di pagine, spero che finalmente si degni di leggermente un altro po'.Buon week end!
-
Qulcosa si muove ... si è effettivamente scaricato tutti i file della mappa, il bot è passato domenica e si è letto un po' di pagine. Un numero ridicolo rispetto a quelle segnalate ma comunque molto superiore alla media delle settimane precedenti.
Contestualmente è anche aumentata l'attività del bot di adsense ma immagino sia una coincidenza ....
Ovviamente registro l'ennesimo calo nelle serp che provavo a controllare!
Per ora insomma un lavoraccio piuttosto inutile