• Super User

    @kerouac3001 said:

    non conosco wget..mi spieghi cos'è?

    un downloader da linea di comando per unix.
    con l'opzione --mirror (o una combinazione di altre) fa il mirror del sito (o parte di esso).


  • Super User

    @must said:

    @kerouac3001 said:
    non conosco wget..mi spieghi cos'è?

    un downloader da linea di comando per unix.
    con l'opzione --mirror (o una combinazione di altre) fa il mirror del sito (o parte di esso).

    bè ma non c'entra un c***o ...vabbè te lo faccio io lo script se ho tempo...ci metto 30 minuti al massimo 😎


  • Community Manager

    @kerouac3001 said:

    @must said:
    @kerouac3001 said:
    non conosco wget..mi spieghi cos'è?

    un downloader da linea di comando per unix.
    con l'opzione --mirror (o una combinazione di altre) fa il mirror del sito (o parte di esso).

    bè ma non c'entra un c***o ...vabbè te lo faccio io lo script se ho tempo...ci metto 30 minuti al massimo 😎

    :sbav:

    Il link in firma non è messo bene

    Linkare un altro sito
    Il BBCode di phpBB supporta diversi modi per creare URI, Uniform Resource Indicators meglio conosciuti come URL.
    
        * Il primo di questi utilizza il tag [url=][/url], qualunque cosa digiti dopo il segno = genererà il contenuto del tag che si comporterà come URL. Per esempio per linkarsi a phpBB.com devi usare:
    
          [url=http://www.phpbb.com/]Visita phpBB![/url]
    
          Questo genera il seguente link, Visita phpBB! Come puoi vedere il link si apre in una nuova finestra così l'utente può continuare a navigare nei forum.
        * Se vuoi che l'URL stesso venga mostrato come link puoi fare questo semplicemente usando:
    
          [url]http://www.phpbb.com/[/url]
    
          Questo genera il seguente link, http://www.phpbb.com/
        * Inoltre phpBB dispone di una cosa chiamata Magic Links, questo cambierà ogni URL sintatticamente corretta in un link senza la necessità di specificare nessun tag o http://. Per esempio digitando www.phpbb.com nel tuo messaggio automaticamente verrà cambiato in www.phpbb.com e verrà mostrato nel messaggio finale.
        * La stessa cosa accade per gli indirizzi email, puoi specificare un indirizzo esplicitamente, per esempio:
    
          [email][email protected][/email]
    
          che mostrerà [email][email protected][/email] o puoi digitare [email][email protected][/email] nel tuo messaggio e verrà automaticamente convertito.
    
    Come per tutti i tag del BBCode puoi includere le URL in ogni altro tag come [img][/img] (guarda il successivo punto), [b][/b], ecc. Come per i tag di formattazione dipende da te verificare che tutti i tag siano correttamente aperti e chiusi, per esempio:
    
    [url=http://www.phpbb.com/][img]http://www.phpbb.com/images/phplogo.gif[/url][/img]
    

  • Super User

    si l'avevo notato da giorni, ma sono pigro 🙂

    sei pure tu interessato a uno script del genere?
    oggi non ho avuto tempo ma se vi sembra utile lo faccio 🙂


  • Community Manager

    Si può tornare molto utile 🙂


  • Super User

    prima di farlo però mi è venuto un dubbio:

    il tuo sito è statico o dinamico?perchè se è dinamico il problema è diverso.

    prima di buttare giù il codice passami l'url del tuo sito must

    forse la soluzione migliore è creare uno spider...è da un pò che volevo creare uno spider in php..penso sia abbastanza impossibile, ma la sfida mi alletta 😄

    lo spider dovrebbe solo leggere la pagina cercare i links a pagine interne e se non sono già presenti nell'array link[] allora li aggiunge all'array.
    dopo aver letto l'index inizia a visualizzare e leggere i links presenti in link[] e ad aggiungere altri link all'array..in questo modo vede tutte le pagine che vedrebbe google.

    in VB6 sarebbe facile da fare, ma mi sono sempre chiesto se potessi fare la stessa cosa in php

    Se invece il tuo sito è statico allora l'idea iniziale della ricerca ricorsiva all'interno delle tue cartelle può andare bene

    ok mi metto a lavoro..tu fammi sapere


  • Super User

    il sito e' il famoso laboratorio personale: www.prodottitipicitaliani.com


  • Super User

    ho fatto uno script adatto solo al sito di must..

    il mio finto spider sta vedendo tutte le tue pagine 😄

    ho fatto in modo che ne visualizzi una ogni 3 secondi...

    il suo nome è SpazioGratis.iT 😄 se hai phpstats dimmi se vedi che sta passando 😄

    poi dimmi la reazione di google adsense


  • Super User

    @kerouac3001 said:

    ho fatto uno script adatto solo al sito di must..

    il mio finto spider sta vedendo tutte le tue pagine 😄

    ho fatto in modo che ne visualizzi una ogni 3 secondi...

    il suo nome è SpazioGratis.iT 😄 se hai phpstats dimmi se vedi che sta passando 😄

    poi dimmi la reazione di google adsense

    il ragno lo vedo, googlebot no :sad:


  • Super User

    bene ho bloccato il ragno..lo faccio ripartire dall'ultima pagina vista solo se mi dirai che google è passato sulle pagine viste

    mi segno qui i dati dell'ultima pagina vista così non li dimentico

    cat=0&id=1210


  • Super User

    @kerouac3001 said:

    bene ho bloccato il ragno..lo faccio ripartire dall'ultima pagina vista solo se mi dirai che google è passato sulle pagine viste

    mi segno qui i dati dell'ultima pagina vista così non li dimentico

    cat=0&id=1210

    non passa, non passa 😢 :arrabbiato:


  • Super User

    la domanda è: perchè a volte adsense legge le pagine viste dagli utenti mentre altre volte le ignora?

    le legge solo la prima volta?
    le legge solo se conosce il browser?
    le legge solo se l'utente resta per un pò di tempo?

    cmq ho bloccato il ragno
    la soluzione è: aspettare :bho:


  • Super User

    @kerouac3001 said:

    la domanda è: perchè a volte adsense legge le pagine viste dagli utenti mentre altre volte le ignora?

    le legge solo la prima volta?

    sicuramente no. anche perche' con il ragno non e' passato neanche la prima volta.

    le legge solo se conosce il browser?

    sicuramente no. con il wget di cui ti parlavo ho provato a spiderizzare anche settando uno user agent (di firefox). cambiato nulla.

    le legge solo se l'utente resta per un pò di tempo?

    no, googlebot/mediapartners arriva SUBITO, praticamente mentre l'utente sta ancora caricando la pagina.

    cmq ho bloccato il ragno
    la soluzione è: aspettare :bho:

    eheh. no, aspettando la soluzione non piove dal cielo (oddio, magari da questo o altri forum si :lol: ).
    secondo me lo spider deve essere in grado di eseguire il codice javascript. niente piu' niente meno.


  • Super User

    no sbagli 🙂

    lo spider esegue il javascript..l'ho visto con i miei occhi..quindi il problema è un altro 🙂

    ti darei l'url per avviare lo spider, ma se lo posto la gente poi si diverte ad usarlo e ti fotte banda quindi evitiamo 🙂

    al massimo te lo do in pvt se lo vuoi vedere...basta aprire l'url e lasciare la pagina aperta...lui fa il resto


  • Super User

    @kerouac3001 said:

    no sbagli 🙂

    lo spider esegue il javascript..l'ho visto con i miei occhi..quindi il problema è un altro 🙂

    ti darei l'url per avviare lo spider, ma se lo posto la gente poi si diverte ad usarlo e ti fotte banda quindi evitiamo 🙂

    al massimo te lo do in pvt se lo vuoi vedere...basta aprire l'url e lasciare la pagina aperta...lui fa il resto

    oh beh, se e' l'url che vedo nei log, ce l'ho.

    resta il problema, e non so veramente che pensare...


  • Super User

    AAAAAAAAAAAAAAHHHHHHHHHHHHHHHHH

    fermo!
    FUNZIONA!!!

    solo che dopo un po' si e' fermato. alzerei il delay tra una pagina e l'altra a 30/60 secondi pero'.

    infatti il bot arrivava all'inizio, poi s'e' fermato. forse ha sentito puzza di spider (o piu' semplicemente c'e' un filtro che evita troppe visite in tot tempo).

    rifallo partire e vediamo al volo se riprende.


  • Super User

    azz..30 secondi è troppo..ti do l'url il privato e fai tu..anzi aggiungo una variabile per settare il delay..un minuto e ti passo l'url in pvt


  • Super User

    vi comunichiamo che il progetto è falllito miseramente quando must mi ha fatto notare che probabilmente google stava vedendo le mie pagine e non le sue ahahahahhah

    aveva ragione 🙂


  • Super User

    @kerouac3001 said:

    vi comunichiamo che il progetto è falllito miseramente quando must mi ha fatto notare che probabilmente google stava vedendo le mie pagine e non le sue ahahahahhah

    aveva ragione 🙂

    :lol: :lol: :lol: :lol: :lol: :lol: :lol: :lol: :lol: :lol: :lol: :lol: :lol: :lol: :lol: