- Home
- Categorie
- La Community Connect.gt
- Tutto sulla Community
- Attacco di ragnetti da InktomiSearch. Bene o male?
-
Attacco di ragnetti da InktomiSearch. Bene o male?
Stavolta l'ho beccato.
Sono li che penso alla mia amata neve quando aggiorno la home del forum e vedo 234 utenti connessi.
Eh no stavolta ti becco!Admin panel--> ed ecco la schermata degli ip... Ne riporto solamente una schermata, ma vi assicuro che non finivano più
In definitiva c'erano cirrca 230 spider di questo motore di ricerca che insieme si leggevano il mio forum.
Che significa questo?L'attacco sarà durato si e no 2 minuti, ma probabilmente mooolto meno...
Ed un altra volta mi è capitato con msnbot ma non ho fatto lo screenshot...
Ma questi motori di ricerca si comperano blocchi di indirizzi IP?
Questo inkoti secondo me c'ha tutti quelli: 64.142.250.*
e 64.142.251.*
Ho notato che anche google ha gli indirizzi IP sempre simili, cambia solo una cifra.
-
inktomi (yahoo).
come avevo scritto pochi giorni fa, anche a me ha fatto una spiderizzata tipo denial of service
-
ti fa vedere anche il nome del topic da admin panel? a me no... hai messo qualche mod?
-
No, ti fa vedere la sezione del forum in cui sta anvigando ma non il topic preciso
-
Troppo bello il topic preciso, dovremmo trovare un MOD
-
Qualcuno ha idee?
-
Scusate, ma è normale? anche a me sta capitando...120 Inktomi connessi in media con punte di 150/170...
-
@beltipo said:
Scusate, ma è normale? anche a me sta capitando...120 Inktomi connessi in media con punte di 150/170...
Beh, prova a immaginare come funziona un sistema di crawling.
I grossi motori di ricerca usano delle batterie di crawlers (su centinaia di macchine).In un sistema "semplice" ogni spider prende il prossimo URL dalla coda, scarica la pagina, estrae tutti i link e li inserisce quelli nuovi in fondo alla coda (utilizzando una struttura dati a parte per memorizzare quali URL sono gia' stati visitati).
L'operazione richiede pochi centesimi di secondo, per cui tu li vedi come accessi contemporanei (nello stesso minuto), ma per il crawler sono accessi distinti e relativamente lontani nel tempo.
I crawler piu' sofisticati pongono dei vincoli su quante richieste al secondo (o al minuto) fare allo stesso host per evitare di soffocarlo, per cui la coda degli URL da visitare non e' necessariamente FIFO ma puo' utilizzare algoritmi piuttosto complessi per bilanciare il carico (per esempio possono esserci diverse code, ordinate secondo vari criteri).
-
Ahh...ok...capito.
Quindi tutto sommato è qualcosa da considerare positivo, oltre che un metodo di lavoro giusto?
-
Si si, ogni tanto capita