- Home
- Categorie
- La Community Connect.gt
- Tutto sulla Community
- Lista delle directory BANNATE
-
Okey
-
Scusa ma cosa significa ??
Quella è la lista dell Web Directory bannate o quant'altro ??
-
@angelweb said:
Scusa ma cosa significa ??
Quella è la lista dell Web Directory bannate o quant'altro ??se conosci un minimo di xml troverai un file (tramite il link del post precedente) che ti da una lista di directory bannate. Questo file viene generato automaticamente dal database che sto gestendo. Il database viene aggiornato da uno "spider" che continua a controllare se le url delle directory risultato bannate o meno da google. Sto inoltre sviluppando uno script in AJAX per rendere un po' più comprensibile la lettura del file xml. E' uno sviluppo di questi giorni, un po' di pazienza e avrai la lista
-
Perdono!!
-
@domenico.biancardi said:
vi inizio a postare il link al file XML contenente la lista delle directory http://www.caleidossrl.it/seoSystem/xml/xmlBannedDir.php
il DOCTYPE è molto semplice, nome della directory, url e data dell'ultimo controllo. appena riesco faccio anche lo script ajax
ciao , scusa ma questo elenco contiene le bannate ?
-
Sarebbe interessante poter aggiungere dei campi accanto ad ogni directory scrivendo la provenienza, i dettagli della directory e i feedback da parte degli utenti. una bella directory delle directory
-
Ciao Domenico,
in base a quali criteri determini se una directory è bannata o meno? Mi pare di aver capito che non ti riferisci ad un "ban" in senso stretto.. giusto?
-
-
@diegalax said:
ci deve essere sicuramente qualche bug da risolvere, oggi vedo di capire il xke e aggiorno tutte le directory
-
-
@angelweb said:
one moment, c'è una spiegazione. ieri ho iniziato a fare il lavoro ma sono arrivato al 20% delle directory le restanti sono rimaste nello stato banned. Oggi dovrei concludere il tutto e il file xml che vi ho mostrato si aggiorna da solo quindi non dovrebbero più esserci le directory non bannate.
cmq grazie per l'aiuto e i consigli li tengo presente. scappo a lavoro ci sentiamo tra un paio d'ore
-
scoperto l'arcano mistero. effettuando troppe richieste SOAP (di seguito) alcune non vengono prese in considerazione e non danno nessun risultato o meglio il risultato 0 che è uguale al risultato di bannato.
ora sto modificando la routine di interrogazione a google e vediamo se riesco ad effettuare molte richieste di seguito senza che il sistema si inceppi
-
date un occhio ora alla lista e ditemi se notate qualcosa di strano. grazie
-
@domenico.biancardi said:
scoperto l'arcano mistero. effettuando troppe richieste SOAP (di seguito) alcune non vengono prese in considerazione e non danno nessun risultato o meglio il risultato 0 che è uguale al risultato di bannato.
ora sto modificando la routine di interrogazione a google e vediamo se riesco ad effettuare molte richieste di seguito senza che il sistema si inceppiGrazie per la spiegazione Domenico
-
dategli un occhio ogni tanto alla lista così vediamos è corretta. sto facendo dei test a campione tramite i tool vari per vedere se i siti che sono nella lista sono realmente bannati e finora (con la lista aggiornata di stamattina) i risultati sono corretti
-
@Rammo said:
Ciao Domenico,
in base a quali criteri determini se una directory è bannata o meno? Mi pare di aver capito che non ti riferisci ad un "ban" in senso stretto.. giusto???
-
@Rammo said:
??
ora lo descrivo però prima volevo dirvi che se siete a conoscenza di un criterio da valutare migliore posso modificare il sistema (non è molto complessa la modifica).
Esempio
directory: iosonounadir.com
effettuo due query su google, esattamente
site:iosonounadir.com
link:www.iosonounadir.com
Salvo entrambi i risultati, dato che per la versione che uso in ufficio l'impiegato si mette a segnalare il sito partendo dalle directory più importanti.Le directory bannate sono quelle che hanno il valore 0 ad entrambe le query.
Esempio concreto:directory: searchstream.co.uk
Prima query -->
http://www.google.it/search?sourceid=navclient&hl=it&ie=UTF-8&rls=GGLJ,GGLJ:2006-34,GGLJ:it&q=site%3asearchstream%2eco%2euk+
Seconda query --> http://www.google.it/search?hl=it&rls=GGLJ%2CGGLJ%3A2006-34%2CGGLJ%3Ait&q=link%3Awww.searchstream.co.uk+&meta=Entrambe le query ritornano valore 0 quindi la directory è bannata o è nuova (ma nella maggiorparte dei casi è bannata).
Il metodo ovviamente è automatico e ogni settimana viene effettuata una scansione di tutto il database.
-
@eLLeGi said:
Sarebbe interessante poter aggiungere dei campi accanto ad ogni directory scrivendo la provenienza, i dettagli della directory e i feedback da parte degli utenti. una bella directory delle directory
ora ho aggiunto una funzione allo spider che in automatico acchiappa il meta description della directory e lo salva come informazioni aggiuntive
-
@domenico.biancardi said:
ora lo descrivo però prima volevo dirvi che se siete a conoscenza di un criterio da valutare migliore posso modificare il sistema (non è molto complessa la modifica).
Esempio
directory: iosonounadir.com
effettuo due query su google, esattamente
site:iosonounadir.com
link:www.iosonounadir.com
Salvo entrambi i risultati, dato che per la versione che uso in ufficio l'impiegato si mette a segnalare il sito partendo dalle directory più importanti.Le directory bannate sono quelle che hanno il valore 0 ad entrambe le query.
Esempio concreto:directory: searchstream.co.uk
Prima query -->
http://www.google.it/search?sourceid=navclient&hl=it&ie=UTF-8&rls=GGLJ,GGLJ:2006-34,GGLJ:it&q=site%3asearchstream%2eco%2euk+
Seconda query --> http://www.google.it/search?hl=it&rls=GGLJ%2CGGLJ%3A2006-34%2CGGLJ%3Ait&q=link%3Awww.searchstream.co.uk+&meta=Entrambe le query ritornano valore 0 quindi la directory è bannata o è nuova (ma nella maggiorparte dei casi è bannata).
Il metodo ovviamente è automatico e ogni settimana viene effettuata una scansione di tutto il database.
Ah, quindi ti riferisci ad un ban nel vero senso della parola..
..ma non basterebbe solamente interrogare GG mediante la query site:www.nomedirectory.com ?
Non potrebbe trovare link a www.nomedirectory.com ma averla bannata?
-
lo pensavo anche io, però ho gestito una mole grossa di dati ed ho verificato che alcuni siti non hanno nessun risultato con site:..... ma hanno dei risultati con link:.... non so che cosa voglia dire