- Home
- Categorie
- La Community Connect.gt
- Tutto sulla Community
- Script PHP per monitorare il passaggio dei bot
-
Script PHP per monitorare il passaggio dei bot
Questo script vi invia una mail quando passa un bot
(ho fatto un mini articoletto con link a questo forum da qui: http://informaticare.blogspot.com/2005/04/script-php-segnalazione-passaggio-bot.html )pagina 1: <?php /* ------------------------------------------------------------ */ /* Spider-Sense */ /* Detects bot activity and alerts you to their presence */ /* By Shawn Raloff */ /* [url="http://www.side2.com"]http://www.side2.com */ /* ------------------------------------------------------------ */ /* ---------- You must set these variables ---------- */ $domain = "www.tuosito.it"; $email = "[email protected]"; /* ---------- No need to edit beyond this point ---------- */ $bot = $_SERVER['HTTP_USER_AGENT']; $page = $_SERVER['PHP_SELF']; /* ---------- Look for bots ---------- */ ini_set("sendmail_from",'[email protected]'); //mail("$email", "aaaa", "aaa"); $myFile = fopen("spider-sense.dat","r"); while(!feof($myFile)) { $myLine = chop(fgets($myFile, 255)); list($agent,$url) = split("[|]", $myLine); if( eregi($agent,$bot) ) { mail("$email", "$agent detected on $domain", "$agent has crawled $page on $domain"); } } fclose($myFile); //echo "[url='http://www.side2.com']Powered By Side2.com"; ?>
spider-sense.dat:
AbachoBOT|[url="http://www.abacho.com"]www.abacho.com abcdatos_botlink|[url="http://www.abcdatos.com"]www.abcdatos.com AESOP_com_SpiderMan|[url="http://www.aesop.com"]www.aesop.com ah-ha.com crawler|[url="http://www.ah-ha.com"]www.ah-ha.com ia_archiver|[url="http://www.alexa.com"]www.alexa.com Scooter|[url="http://www.altavista.com"]www.altavista.com AltaVista-Intranet|[url="http://www.altavista.co.uk"]www.altavista.co.uk FAST-WebCrawler|[url="http://www.alltheweb.com"]www.alltheweb.com Acoon Robot|[url="http://www.acoon.de"]www.acoon.de antibot|[url="http://www.antisearch.net"]www.antisearch.net Atomz|[url="http://www.atomz.com"]www.atomz.com Buscaplus Robi|[url="http://www.buscaplus.com"]www.buscaplus.com CanSeek|[url="http://www.canseek.ca"]www.canseek.ca ChristCRAWLER|[url="http://www.christcrawler.com"]www.christcrawler.com Crawler|[url="http://www.crawler.de"]www.crawler.de DaAdLe.com ROBOT|[url="http://www.daadle.com"]www.daadle.com RaBot|[url="http://www.daum.net"]www.daum.net DeepIndex|[url="http://www.en.deepindex.com"]www.en.deepindex.com DittoSpyder|[url="http://www.ditto.com"]www.ditto.com Jack|domanova.co.uk Speedy Spider|[url="http://www.entireweb.com"]www.entireweb.com ArchitextSpider|[url="http://www.excite.com"]www.excite.com Arachnoidea|[url="http://www.euroseek.net"]www.euroseek.net EZResult|[url="http://www.ezresults.com"]www.ezresults.com Fast PartnerSite Crawler|[url="http://www.fastsearch.net"]www.fastsearch.net KIT-Fireball|[url="http://www.fireball.de"]www.fireball.de FyberSearch|[url="http://www.fybersearch.com"]www.fybersearch.com GalaxyBot|[url="http://www.galaxy.com"]www.galaxy.com geckobot|[url="http://www.geckobot.com"]www.geckobot.com GenCrawler|[url="http://www.gendoor.com"]www.gendoor.com GeonaBot|[url="http://www.geona.com"]www.geona.com Googlebot|[url="http://www.google.com"]www.google.com Aranha|[url="http://www.girafa.com"]www.girafa.com Slurp|[url="http://www.inktomisearch.com"]www.inktomisearch.com Toutatis|hoppa.com Hubater|[url="http://www.hubat.com"]www.hubat.com IlTrovatore-Setaccio|[url="http://www.iltrovatore.it"]www.iltrovatore.it IncyWincy|[url="http://www.incywincy.com"]www.incywincy.com UltraSeek|[url="http://www.infoseek.com"]www.infoseek.com Mole2|[url="http://www.intags.de"]www.intags.de MP3Bot|mp3bot.de C-PBWF-ip3000.com-crawler|[url="http://www.ip3000.com"]www.ip3000.com kuloko-bot|[url="http://www.kuloko.com"]www.kuloko.com LNSpiderguy|[url="http://www.lexis-nexis.com"]www.lexis-nexis.com NetResearchServer|[url="http://www.look.com"]www.look.com MantraAgent|[url="http://www.looksmart.com"]www.looksmart.com NetResearchServer|[url="http://www.loopimprovements.com"]www.loopimprovements.com Lycos_Spider|[url="http://www.lycos.com"]www.lycos.com JoocerBot|[url="http://www.joocer.com"]www.joocer.com HenryTheMiragoRobot|[url="http://www.mirago.co.uk"]www.mirago.co.uk mozDex|[url="http://www.mozdex.com"]www.mozdex.com MSNBOT|search.msn.com Gulliver|[url="http://www.northernlight.com"]www.northernlight.com ObjectsSearch|[url="http://www.objectssearch.com"]www.objectssearch.com PicoSearch|[url="http://www.picosearch.com"]www.picosearch.com PJspider|[url="http://www.portaljuice.com"]www.portaljuice.com DIIbot|[url="http://www.powerinter.net"]www.powerinter.net nttdirectory_robot|navi.ocn.ne.jp NationalDirectory-SuperSpider|[url="http://www.nationaldirectory.com"]www.nationaldirectory.com Openfind piranha,Shark|[url="http://www.openfind.com"]www.openfind.com psbot|[url="http://www.picsearch.org"]www.picsearch.org CrawlerBoy Pinpoint.com|[url="http://www.pinpoint.com"]www.pinpoint.com AlkalineBOT|[url="http://www.vestris.com"]www.vestris.com Fluffy the spider|[url="http://www.searchhippo.com"]www.searchhippo.com Scrubby|[url="http://www.scrubtheweb.com"]www.scrubtheweb.com asterias|[url="http://www.singingfish.com"]www.singingfish.com Kototoi|[url="http://www.s.u-tokyo.ac.jp"]www.s.u-tokyo.ac.jp Searchspider|[url="http://www.searchspider.com"]www.searchspider.com SightQuestBot|[url="http://www.sightquest.com"]www.sightquest.com Spider_Monkey|[url="http://www.spidermonkey.ca"]www.spidermonkey.ca Surfnomore Spider|[url="http://www.surfnomore.com"]www.surfnomore.com [email][email protected][/email]|[url="http://www.supersnooper.com"]www.supersnooper.com teoma|[url="http://www.teoma.com"]www.teoma.com Teradex_Mapper|mapper.teradex.com ESISmartSpider|[url="http://www.travel-finder.com"]www.travel-finder.com Spider TraficDublu|[url="http://www.traficdublu.ro"]www.traficdublu.ro Tutorial Crawler|[url="http://www.tutorgig.com"]www.tutorgig.com UK Searcher Spider|[url="http://www.uksearcher.co.uk"]www.uksearcher.co.uk Vivante Link Checker|[url="http://www.vivante.com"]www.vivante.com appie|[url="http://www.walhello.com"]www.walhello.com Nazilla|[url="http://www.websmostlinked.com"]www.websmostlinked.com [url="http://www.WebWombat.com.au"]www.WebWombat.com.au|[url="http://www.webwombat.com.au"]www.webwombat.com.au marvininfoseek|[url="http://www.webseek.de"]www.webseek.de MuscatFerret|[url="http://www.webtop.com"]www.webtop.com WhizBang! Lab|[url="http://www.whizbanglabs.com"]www.whizbanglabs.com ZyBorg|[url="http://www.wisenut.com"]www.wisenut.com WIRE WebRefiner|[url="http://www.wire.co.uk"]www.wire.co.uk WSCbot|[url="http://www.worldsearchcenter.com"]www.worldsearchcenter.com Yandex|[url="http://www.yandex.com"]www.yandex.com Yellopet-Spider|[url="http://www.yellowpet.com"]www.yellowpet.com
-
Grande Tuonorosso
Ecco il php applicato ai motori di ricerca.
Tuonorosso aveva postato in php, ho chiesto io a lui di aprire un topic anche in questa sezione, i moderatori lascino aperti tutti e due i topic.
-
giorgio, hai msn? Se si aggiungimi
ciao
-
Bravo Max !
-
Se servono gli indirizzi IP dei MdR sempre aggiornati fatemi un fischio
-
@positano said:
Se servono gli indirizzi IP dei MdR sempre aggiornati fatemi un fischio
Servirebbe un bel topic in rilievo per questo cose
-
@positano said:
Se servono gli indirizzi IP dei MdR sempre aggiornati fatemi un fischio Vecchio cloakkaro che non sei altro
-
cmq eventualmente li spedisco a chi gestisce lo script
p.s.
cosa vuoi beke il cloaking è la mia passione
-
Perchè mi da un errore a questa riga?
if( eregi($agent,$bot) )
-
Benvenuto Pegasus
@Pegasus said:
Perchè mi da un errore a questa riga?
if( eregi($agent,$bot) )Forse è sbagliato sarebbe
if( ereg($agent,$bot) )
Forse....
Buon Forum Pegasus
Giorgio
P.S. i link in firma possibili sono 3
Dal Regolamento
5)E' possibile inserire massimo tre link in firma
-
Grazie Giorgio
Cmq non è quello l'errore bho!!
Niente bot in e-mail per grande dispiacere di MrYak
-
@giorgiotave said:
Benvenuto Pegasus
@Pegasus said:
Perchè mi da un errore a questa riga?if( eregi($agent,$bot) )
Forse è sbagliato sarebbe
if( ereg($agent,$bot) )
Forse....
Buon Forum Pegasus
Giorgio
P.S. i link in firma possibili sono 3
Dal Regolamento
5)E' possibile inserire massimo tre link in firmaAggiustate le firme...ovviamente il regolamento mi sono guardato bene dal leggerlo!!
-
Figurati Pegaus,
per correttezza nei confronti di tutti.
Per lo script se capisci l'errore fammi sapere, altrimenti si disabilita con @
-
Tuono potresti gentilmente spiegarmi bene dove devono andare questi codici ?
il file dat come si crea ?
Non so niente di php mi descrivi bene tutti i passagi ?
Grazie infinite.
-
il codice php potrebbe essere messo nell'home page..
il file dat: crei un file txt, ci metti dentro il contenuto, rinomini in .dat
-
Tuono potresti gentilmente spiegarmi bene dove devono andare questi codici ?
il file dat come si crea ?
Non so niente di php mi descrivi bene tutti i passagi ?
Mi associo alla richiesta di istruzioni dettagliate se non è un problema. Qualcuno di buona volontà?
-
Pardon, il link al blog di Tuonorosso spiega il da farsi su come inserire e dove inserire lo script.
-
Ho inserito il codice nella hompage.htm ma pubblica il testo, ho provato a metterlo nel head e nel body e non va chi mi aiuta please ??
lo vedete qui: http://www.sardegnamania.com
grazie
-
deve essere una pagina .php altrimenti il server non riconosce il codice
-
grazie ho capito