• User Attivo

    cercando nella rete a proposito delle markov chain, ho trovato questa pagina che parla di uno script che genera, a partire da un testo di Gibbon, un sito intero

    questa è la pagina

    http://www.brank.org/gibbon/

    però non sono riuscito a trovare lo scritp (GibbonHandler.py), ho inviato una mail all'autore, spero che mi risponda

    cosa vi sembra?


  • Super User

    Gente il php è tutto corretto, ma ho fatto un errore nell'html (eheh) nell'index.php dovete sostituire queste 2 righe:

    
    <tr><td valign=top>Numero di Pagine</td><td valign=top><input type="text" name="" value="2"></td><td valign=top>Numero di pagine che volete creare</td></tr>
    <tr><td valign=top>Nome delle pagine</td><td valign=top><input type="text" name="" value="pagina_"></td><td valign=top>Base utilizzata per creare il nome delle pagine</td></tr>
    
    

    con queste 2 righe:

    
    <tr><td valign=top>Numero di Pagine</td><td valign=top><input type="text" name="max_pagine" value=""></td><td valign=top>Numero di pagine che volete creare</td></tr>
    <tr><td valign=top>Nome delle pagine</td><td valign=top><input type="text" name="nome_pagine" value=""></td><td valign=top>Base utilizzata per creare il nome delle pagine</td></tr>
    
    

    Mentre stavo pulendo il form ho eliminato il valore del name invece del valore del value..o lo correggete voi oppure potete riscaricare lo script (adesso è online corretto)

    Se trovate altri errori segnalateli 🙂

    P.S. Per paolo: stavo provvedendo a correggere questa cosa e quindi non ho ancora visto il sito da te citato, ma si tratta di una cosa molto interessante se è vera. Quindi appena posso intervengo anch'io sull'argomento. Prima però sarà meglio che mi informi anch'io 😄

    Aggiungo che mi sono accorto che anche questo è sbagliato:

    
    <tr><td valign=top>Codice HTML</td><td valign=top><TEXTAREA NAME="" ROWS=30 COLS=40></TEXTAREA></td><td valign=top>Inserite qui un template html e inserite il tag &#91;MARKOV&#93; dove volete che appaia il testo e i tag &#91;KEY1&#93; e &#91;KEY2&#93; dove volete che compaiano le 2 keyword di ottimizzazione</td></tr>
    
    

    Sostituitelo con:

    
    <tr><td valign=top>Codice HTML</td><td valign=top><TEXTAREA NAME="codice_html" ROWS=30 COLS=40></TEXTAREA></td><td valign=top>Inserite qui un template html e inserite il tag &#91;MARKOV&#93; dove volete che appaia il testo e i tag &#91;KEY1&#93; e &#91;KEY2&#93; dove volete che compaiano le 2 keyword di ottimizzazione</td></tr>
    
    

    Comunque a sto punto è meglio se lo riscaricate..l'ho messo online ora..quindi tutti quelli scaricati prima di questo messaggio sono da considerare errati


  • Super User

    @paolo said:

    cercando nella rete a proposito delle markov chain, ho trovato questa pagina che parla di uno script che genera, a partire da un testo di Gibbon, un sito intero

    questa è la pagina

    http://www.brank.org/gibbon/

    però non sono riuscito a trovare lo scritp (GibbonHandler.py), ho inviato una mail all'autore, spero che mi risponda

    cosa vi sembra?

    Ecco adesso posso risponderti.
    Mi sembra interessante e molto facile da realizzare. Ma questo ve lo faccio la settimana prossima (eheheh)

    E' sufficiente inserire nello script genera doorway una funzione di linking che ragioni con un Webmaster/Spider

    1. lo script genera un pò di testo Markov

    2. la funzione genera N link e li salva in un database

    3. lo script genera un alto pò di testo e salva la pagina

    4. lo script prende uno dei link e se la pagina non esiste la crea ripetendo i procedimenti da 1 a 3 (ed usando a posto dei link casuali quelli del database più un link all'homepage (la prima pagina creata))..poi legge il secondo link e procede alla stessa maniera finchè non ha letto tutti gli N link

    In questo modo si genera un sito chiuso con menù laterale che linka a tutte le pagine del sito.

    Con qualche altro piccolo accorgimento il sito può venire generato col miglior tipo di linkaggio:

    • A piramide
    • A albero
    • A cerchio
      ...

    Qualsiasi tipo di linkaggio..però se faccio pure questo script poi finisce come prevede uMor 😉 sarà la vittoria dello spam

    P.S. a dire il vero uso una tecnica simile in uno dei miei siti di hotel, ma senza le markov. L'ho fatto l'aprile scorso e ha parecchie pagine indicizzate..e quando dico parecchie intendo dire parecchie 😉


  • User Attivo

    non era mia intenzione, kerouac, farti fare le ore piccole per fare questi script 😞


  • Super User

    @kerouac3001 said:

    eccolo [url=http://www.eblong.com/zarf/markov/]Markov Chain
    Grazie. Ho scaricato la versione in C e gli ho dato giusto un'occhiata visto non ho il compilatore installato sul portatile.
    E' abbastanza incasinato visto usa puntatori e puntatori a puntatori.Comunque visto anche la memoria allocata dinamicamente, la velocità dev'essere notevole.


  • Super User

    @claudioweb said:

    @kerouac3001 said:
    eccolo [url=http://www.eblong.com/zarf/markov/]Markov Chain
    Grazie. Ho scaricato la versione in C e gli ho dato giusto un'occhiata visto non ho il compilatore installato sul portatile.
    E' abbastanza incasinato visto usa puntatori e puntatori a puntatori.Comunque visto anche la memoria allocata dinamicamente, la velocità dev'essere notevole.

    Se hai tempo libero e se ne hai voglia potresti fare la versione in C del mio script che genera doorway. Sarebbe molto più utile del mio script così com'è ora.

    Invece lo script di cui parla paolino (quello che genera un sito intero tramite markov chain) è meglio farlo in php

    P.S. puntatori in c? sarà mica un virus? eheh scherzo


  • Super User

    @kerouac3001 said:

    Se hai tempo libero e se ne hai voglia potresti fare la versione in C del mio script che genera doorway. Sarebbe molto più utile del mio script così com'è ora.
    In questo periodo non ce la faccio. Sono sommerso dagli esami. :arrabbiato:
    Il fatto è che non sarei così incredibilmente rapido come te. 🙂

    Comunque tranne se qualcuno non mi precede, e esami permettendo, lo farò con calma (tradotto: ci vorranno mesi).


  • User Attivo

    vi lascio qualche link se volete sbizzarrirvi con le markov chain:

    http://www.lazaruscorporation.co.uk/v4/cutup/links.php

    http://www.oreillynet.com/pub/wlg/7830

    e questo che però non so se c'entra perchè non ho ancora avuto il tempo di guardarlo

    http://runme.org/project/+walserphp/

    buona fortuna 😄


  • Super User

    @paolo said:

    vi lascio qualche link se volete sbizzarrirvi con le markov chain:

    http://www.lazaruscorporation.co.uk/v4/cutup/links.php

    http://www.oreillynet.com/pub/wlg/7830

    e questo che però non so se c'entra perchè non ho ancora avuto il tempo di guardarlo

    http://runme.org/project/+walserphp/

    buona fortuna 😄

    Stavo giusto ascoltando una "canzone" di burroughs poco fa 😄 e me lo ritrovo ovunque. Non avevo subito connesso le markov chain alla tecnica cut-up di burroughs, ma pensandoci bene sono la stessa cosa. Burroughs scriveva prendendo pezzi di frasi da altri libri..le mischiava e generava un nuovo suono e una nuova idea (è stato copiato da molti gruppi..i primi pink floyd in testa: vi ricordate Set the control for the heart of the sun?).

    Comunque, grazie paolo (ti confondo sempre con paolino..non siete la stessa persona vero?)..non tutti quei programmi sono utili e molti non li capisco (causa poco studio di lingua inglese), ma in generale mi stanno piacendo molto. Prendo spunti un pò ovunque. :fumato:


  • User Attivo

    ho fatto delle prove, è normale avere robe tipo:

    "ora grazie a monray le donne hanno una l'ultimo atto della battaglia legale che, da quattro anni, vede l'ultimo atto della battaglia legale che, da quattro anni, vede l'ultimo atto della battaglia legale che, da quattro anni, vede l'ultimo atto della battaglia legale che, da quattro anni, vede l'ultimo atto della battaglia legale che, da quattro anni, vede l'ultimo atto della battaglia legale che, da quattro anni, vede l'ultimo atto della battaglia legale che, da quattro anni, vede l'ultimo atto della battaglia legale che, da quattro anni, vede l'ultimo atto della battaglia legale che, da quattro."


  • Super User

    @uMoR said:

    ho fatto delle prove, è normale avere robe tipo:

    "ora grazie a monray le donne hanno una l'ultimo atto della battaglia legale che, da quattro anni, vede l'ultimo atto della battaglia legale che, da quattro anni, vede l'ultimo atto della battaglia legale che, da quattro anni, vede l'ultimo atto della battaglia legale che, da quattro anni, vede l'ultimo atto della battaglia legale che, da quattro anni, vede l'ultimo atto della battaglia legale che, da quattro anni, vede l'ultimo atto della battaglia legale che, da quattro anni, vede l'ultimo atto della battaglia legale che, da quattro anni, vede l'ultimo atto della battaglia legale che, da quattro."

    hai poco testo oppure è un caso sporadico dovuto a questo fatto:

    Tutte le coppie presenti in questa frase "ora grazie a monray le donne hanno una l'ultimo atto della battaglia legale che, da quattro anni, vede" sono ripetute nel testo originale un'unica volta..se non fosse così non avresti quel caso 🙂

    P.S. almeno credo 🙂 questa è la prima spiegazione che mi viene in mente..cmq prova ad aumentare il testo


  • User Attivo

    50kb son pochi ?


  • User Attivo

    Ho trovato alcuni bug:

    gli ho dato un testo da 1megabyte, crasha.

    Fatal error: Allowed memory size of 52428800 bytes exhausted (tried to allocate 26 bytes)
    Fatal error: Maximum execution time of 30 seconds exceeded

    ora provo con meno


  • User Attivo

    con 300kb sembra funzionare decente, anche se non mi piace molto il risultato.

    Con 500kb riesce a generare quasi completamente e il risultato sembra molto buono.

    Con più di 500kb sulla maggior parte dei webserver viene killato


  • User Attivo

    allora sono giunto a questa conclusione dopo un po di test:

    Se ci si basa su testo "bello" bastano 100kb per produrre una pagina di 1000 parole con senso compiuto e non un'accozzaglia di spam.
    Se ci si basa su testo "brutto" almeno almeno 400kb per tirar fuori qualcosa di decente.


  • User Attivo

    a dire la verità anche a me genera testo ripetuto, però, come dice kerouac, il problema consiste nella "scarsa" (almeno per questo script) disponibilità di testo.


  • Super User

    Se il testo non è monotematico lo script non funziona..quindi usate solo testo monotematico..il problema dei kb dipende appunto dal server e l'avevo già notato (mi pare di averlo scritto nella guida).

    Il punto è questo:

    se non esistono abbastanza coppie di parole uguali, lo script ha poche possibilità di scelta..quindi rischia di arrivare ad un punto morto e ripetere sempre la stessa frase. Io vi consiglio 100kb di testo monotematico


  • User Attivo

    io ho aggiunto parecchi filtri sui testi e con 100kb vengono fuori cose carine..


  • Super User

    @uMoR said:

    io ho aggiunto parecchi filtri sui testi e con 100kb vengono fuori cose carine..

    Io prima o poi vorrei provare a usare come teso originale un testo generato tramite le markov chain..chissà cosa viene fuori 😄


  • Bannato Super User

    Come vi organizzate per i testi...

    Li scrivete ?
    Utilizzate un programma di ocr ?
    Oppure ?

    🙂