• Super User

    Script PHP per monitorare il passaggio dei bot

    Questo script vi invia una mail quando passa un bot
    (ho fatto un mini articoletto con link a questo forum da qui: http://informaticare.blogspot.com/2005/04/script-php-segnalazione-passaggio-bot.html )

    pagina 1: 
    <?php  
    /* ------------------------------------------------------------ */ 
    /* Spider-Sense                                                                                                    */ 
    /* Detects bot activity and alerts you to their presence                */ 
    /* By Shawn Raloff                                                                                                */ 
    /* [url="http&#58;//www.side2.com"]http&#58;//www.side2.com                                                                                 */ 
    /* ------------------------------------------------------------ */ 
    
    /* ---------- You must set these variables ---------- */ 
    $domain = "www.tuosito.it"; 
    $email = "[email protected]"; 
    
    
    /* ---------- No need to edit beyond this point ---------- */ 
    $bot = $_SERVER&#91;'HTTP_USER_AGENT'&#93;; 
    $page = $_SERVER&#91;'PHP_SELF'&#93;; 
    
    /* ---------- Look for bots ---------- */ 
    ini_set&#40;"sendmail_from",'[email protected]'&#41;; 
    
    //mail&#40;"$email", "aaaa", "aaa"&#41;; 
    $myFile = fopen&#40;"spider-sense.dat","r"&#41;; 
    while&#40;!feof&#40;$myFile&#41;&#41;  
    &#123; 
        $myLine = chop&#40;fgets&#40;$myFile, 255&#41;&#41;; 
        list&#40;$agent,$url&#41; = split&#40;"&#91;|&#93;", $myLine&#41;; 
        if&#40; eregi&#40;$agent,$bot&#41; &#41; 
        &#123;  
            mail&#40;"$email", "$agent detected on $domain", "$agent has crawled $page on $domain"&#41;;  
        &#125; 
    &#125; 
    
    fclose&#40;$myFile&#41;; 
    
    //echo "[url='http&#58;//www.side2.com']Powered By Side2.com"; 
    ?> 
    
    

    spider-sense.dat:

    AbachoBOT|[url="http&#58;//www.abacho.com"]www.abacho.com 
    abcdatos_botlink|[url="http&#58;//www.abcdatos.com"]www.abcdatos.com 
    AESOP_com_SpiderMan|[url="http&#58;//www.aesop.com"]www.aesop.com 
    ah-ha.com crawler|[url="http&#58;//www.ah-ha.com"]www.ah-ha.com 
    ia_archiver|[url="http&#58;//www.alexa.com"]www.alexa.com 
    Scooter|[url="http&#58;//www.altavista.com"]www.altavista.com 
    AltaVista-Intranet|[url="http&#58;//www.altavista.co.uk"]www.altavista.co.uk 
    FAST-WebCrawler|[url="http&#58;//www.alltheweb.com"]www.alltheweb.com 
    Acoon Robot|[url="http&#58;//www.acoon.de"]www.acoon.de 
    antibot|[url="http&#58;//www.antisearch.net"]www.antisearch.net 
    Atomz|[url="http&#58;//www.atomz.com"]www.atomz.com 
    Buscaplus Robi|[url="http&#58;//www.buscaplus.com"]www.buscaplus.com 
    CanSeek|[url="http&#58;//www.canseek.ca"]www.canseek.ca 
    ChristCRAWLER|[url="http&#58;//www.christcrawler.com"]www.christcrawler.com 
    Crawler|[url="http&#58;//www.crawler.de"]www.crawler.de 
    DaAdLe.com ROBOT|[url="http&#58;//www.daadle.com"]www.daadle.com 
    RaBot|[url="http&#58;//www.daum.net"]www.daum.net 
    DeepIndex|[url="http&#58;//www.en.deepindex.com"]www.en.deepindex.com 
    DittoSpyder|[url="http&#58;//www.ditto.com"]www.ditto.com 
    Jack|domanova.co.uk 
    Speedy Spider|[url="http&#58;//www.entireweb.com"]www.entireweb.com 
    ArchitextSpider|[url="http&#58;//www.excite.com"]www.excite.com 
    Arachnoidea|[url="http&#58;//www.euroseek.net"]www.euroseek.net 
    EZResult|[url="http&#58;//www.ezresults.com"]www.ezresults.com 
    Fast PartnerSite Crawler|[url="http&#58;//www.fastsearch.net"]www.fastsearch.net 
    KIT-Fireball|[url="http&#58;//www.fireball.de"]www.fireball.de 
    FyberSearch|[url="http&#58;//www.fybersearch.com"]www.fybersearch.com 
    GalaxyBot|[url="http&#58;//www.galaxy.com"]www.galaxy.com 
    geckobot|[url="http&#58;//www.geckobot.com"]www.geckobot.com 
    GenCrawler|[url="http&#58;//www.gendoor.com"]www.gendoor.com 
    GeonaBot|[url="http&#58;//www.geona.com"]www.geona.com 
    Googlebot|[url="http&#58;//www.google.com"]www.google.com 
    Aranha|[url="http&#58;//www.girafa.com"]www.girafa.com 
    Slurp|[url="http&#58;//www.inktomisearch.com"]www.inktomisearch.com 
    Toutatis|hoppa.com 
    Hubater|[url="http&#58;//www.hubat.com"]www.hubat.com 
    IlTrovatore-Setaccio|[url="http&#58;//www.iltrovatore.it"]www.iltrovatore.it 
    IncyWincy|[url="http&#58;//www.incywincy.com"]www.incywincy.com 
    UltraSeek|[url="http&#58;//www.infoseek.com"]www.infoseek.com 
    Mole2|[url="http&#58;//www.intags.de"]www.intags.de 
    MP3Bot|mp3bot.de 
    C-PBWF-ip3000.com-crawler|[url="http&#58;//www.ip3000.com"]www.ip3000.com 
    kuloko-bot|[url="http&#58;//www.kuloko.com"]www.kuloko.com 
    LNSpiderguy|[url="http&#58;//www.lexis-nexis.com"]www.lexis-nexis.com 
    NetResearchServer|[url="http&#58;//www.look.com"]www.look.com 
    MantraAgent|[url="http&#58;//www.looksmart.com"]www.looksmart.com 
    NetResearchServer|[url="http&#58;//www.loopimprovements.com"]www.loopimprovements.com 
    Lycos_Spider|[url="http&#58;//www.lycos.com"]www.lycos.com 
    JoocerBot|[url="http&#58;//www.joocer.com"]www.joocer.com 
    HenryTheMiragoRobot|[url="http&#58;//www.mirago.co.uk"]www.mirago.co.uk 
    mozDex|[url="http&#58;//www.mozdex.com"]www.mozdex.com 
    MSNBOT|search.msn.com 
    Gulliver|[url="http&#58;//www.northernlight.com"]www.northernlight.com 
    ObjectsSearch|[url="http&#58;//www.objectssearch.com"]www.objectssearch.com 
    PicoSearch|[url="http&#58;//www.picosearch.com"]www.picosearch.com 
    PJspider|[url="http&#58;//www.portaljuice.com"]www.portaljuice.com 
    DIIbot|[url="http&#58;//www.powerinter.net"]www.powerinter.net 
    nttdirectory_robot|navi.ocn.ne.jp 
    NationalDirectory-SuperSpider|[url="http&#58;//www.nationaldirectory.com"]www.nationaldirectory.com 
    Openfind piranha,Shark|[url="http&#58;//www.openfind.com"]www.openfind.com 
    psbot|[url="http&#58;//www.picsearch.org"]www.picsearch.org 
    CrawlerBoy Pinpoint.com|[url="http&#58;//www.pinpoint.com"]www.pinpoint.com 
    AlkalineBOT|[url="http&#58;//www.vestris.com"]www.vestris.com 
    Fluffy the spider|[url="http&#58;//www.searchhippo.com"]www.searchhippo.com 
    Scrubby|[url="http&#58;//www.scrubtheweb.com"]www.scrubtheweb.com 
    asterias|[url="http&#58;//www.singingfish.com"]www.singingfish.com 
    Kototoi|[url="http&#58;//www.s.u-tokyo.ac.jp"]www.s.u-tokyo.ac.jp 
    Searchspider|[url="http&#58;//www.searchspider.com"]www.searchspider.com 
    SightQuestBot|[url="http&#58;//www.sightquest.com"]www.sightquest.com 
    Spider_Monkey|[url="http&#58;//www.spidermonkey.ca"]www.spidermonkey.ca 
    Surfnomore Spider|[url="http&#58;//www.surfnomore.com"]www.surfnomore.com 
    &#91;email&#93;[email protected]&#91;/email&#93;|[url="http&#58;//www.supersnooper.com"]www.supersnooper.com 
    teoma|[url="http&#58;//www.teoma.com"]www.teoma.com 
    Teradex_Mapper|mapper.teradex.com 
    ESISmartSpider|[url="http&#58;//www.travel-finder.com"]www.travel-finder.com 
    Spider TraficDublu|[url="http&#58;//www.traficdublu.ro"]www.traficdublu.ro 
    Tutorial Crawler|[url="http&#58;//www.tutorgig.com"]www.tutorgig.com 
    UK Searcher Spider|[url="http&#58;//www.uksearcher.co.uk"]www.uksearcher.co.uk 
    Vivante Link Checker|[url="http&#58;//www.vivante.com"]www.vivante.com 
    appie|[url="http&#58;//www.walhello.com"]www.walhello.com 
    Nazilla|[url="http&#58;//www.websmostlinked.com"]www.websmostlinked.com 
    [url="http&#58;//www.WebWombat.com.au"]www.WebWombat.com.au|[url="http&#58;//www.webwombat.com.au"]www.webwombat.com.au 
    marvininfoseek|[url="http&#58;//www.webseek.de"]www.webseek.de 
    MuscatFerret|[url="http&#58;//www.webtop.com"]www.webtop.com 
    WhizBang! Lab|[url="http&#58;//www.whizbanglabs.com"]www.whizbanglabs.com 
    ZyBorg|[url="http&#58;//www.wisenut.com"]www.wisenut.com 
    WIRE WebRefiner|[url="http&#58;//www.wire.co.uk"]www.wire.co.uk 
    WSCbot|[url="http&#58;//www.worldsearchcenter.com"]www.worldsearchcenter.com 
    Yandex|[url="http&#58;//www.yandex.com"]www.yandex.com 
    Yellopet-Spider|[url="http&#58;//www.yellowpet.com"]www.yellowpet.com
    
    

  • Community Manager

    Grande Tuonorosso 😉

    Ecco il php applicato ai motori di ricerca.

    Tuonorosso aveva postato in php, ho chiesto io a lui di aprire un topic anche in questa sezione, i moderatori lascino aperti tutti e due i topic.


  • Super User

    giorgio, hai msn? Se si aggiungimi 😉
    ciao


  • Bannato Super User

    Bravo Max !
    😄


  • Bannato User Attivo

    Se servono gli indirizzi IP dei MdR sempre aggiornati fatemi un fischio :ciauz:


  • Community Manager

    @positano said:

    Se servono gli indirizzi IP dei MdR sempre aggiornati fatemi un fischio :ciauz:

    Servirebbe un bel topic in rilievo per questo cose 😎


  • Super User

    @positano said:

    Se servono gli indirizzi IP dei MdR sempre aggiornati fatemi un fischio :ciauz:Vecchio cloakkaro che non sei altro 😄


  • Bannato User Attivo

    :fumato: cmq eventualmente li spedisco a chi gestisce lo script
    p.s.
    cosa vuoi beke il cloaking è la mia passione


  • User Attivo

    Perchè mi da un errore a questa riga?
    if( eregi($agent,$bot) )


  • Community Manager

    Benvenuto Pegasus

    @Pegasus said:

    Perchè mi da un errore a questa riga?
    if( eregi($agent,$bot) )

    Forse è sbagliato sarebbe

    if( ereg($agent,$bot) )

    Forse....

    Buon Forum Pegasus

    Giorgio

    P.S. i link in firma possibili sono 3 😉
    Dal Regolamento
    5)E' possibile inserire massimo tre link in firma


  • User Attivo

    Grazie Giorgio :yuppi:
    Cmq non è quello l'errore bho!!
    Niente bot in e-mail per grande dispiacere di MrYak :fumato:


  • User Attivo

    @giorgiotave said:

    Benvenuto Pegasus

    @Pegasus said:
    Perchè mi da un errore a questa riga?

    if( eregi($agent,$bot) )

    Forse è sbagliato sarebbe

    if( ereg($agent,$bot) )

    Forse....

    Buon Forum Pegasus

    Giorgio

    P.S. i link in firma possibili sono 3 😉
    Dal Regolamento
    5)E' possibile inserire massimo tre link in firma

    Aggiustate le firme...ovviamente il regolamento mi sono guardato bene dal leggerlo!! :ciauz:


  • Community Manager

    Figurati Pegaus,

    per correttezza nei confronti di tutti.

    Per lo script se capisci l'errore fammi sapere, altrimenti si disabilita con @

    :ciauz:


  • User

    Tuono potresti gentilmente spiegarmi bene dove devono andare questi codici ?

    il file dat come si crea ?

    Non so niente di php mi descrivi bene tutti i passagi ?

    Grazie infinite.


  • User Attivo

    il codice php potrebbe essere messo nell'home page..
    il file dat: crei un file txt, ci metti dentro il contenuto, rinomini in .dat 😎 😎


  • User

    Tuono potresti gentilmente spiegarmi bene dove devono andare questi codici ?
    il file dat come si crea ?
    Non so niente di php mi descrivi bene tutti i passagi ?
    Mi associo alla richiesta di istruzioni dettagliate se non è un problema. Qualcuno di buona volontà?


  • User

    Pardon, il link al blog di Tuonorosso spiega il da farsi su come inserire e dove inserire lo script.


  • User

    Ho inserito il codice nella hompage.htm ma pubblica il testo, ho provato a metterlo nel head e nel body e non va chi mi aiuta please ??

    lo vedete qui: http://www.sardegnamania.com

    grazie


  • User Attivo

    deve essere una pagina .php altrimenti il server non riconosce il codice


  • User

    grazie ho capito