- Home
- Categorie
- Digital Marketing
- Consigli su Penalizzazioni e Test SEO
- Markov chain [lavoriamoci assieme]
-
@paolo said:
vi lascio qualche link se volete sbizzarrirvi con le markov chain:
http://www.lazaruscorporation.co.uk/v4/cutup/links.php
http://www.oreillynet.com/pub/wlg/7830
e questo che però non so se c'entra perchè non ho ancora avuto il tempo di guardarlo
http://runme.org/project/+walserphp/
buona fortuna
Stavo giusto ascoltando una "canzone" di burroughs poco fa e me lo ritrovo ovunque. Non avevo subito connesso le markov chain alla tecnica cut-up di burroughs, ma pensandoci bene sono la stessa cosa. Burroughs scriveva prendendo pezzi di frasi da altri libri..le mischiava e generava un nuovo suono e una nuova idea (è stato copiato da molti gruppi..i primi pink floyd in testa: vi ricordate Set the control for the heart of the sun?).
Comunque, grazie paolo (ti confondo sempre con paolino..non siete la stessa persona vero?)..non tutti quei programmi sono utili e molti non li capisco (causa poco studio di lingua inglese), ma in generale mi stanno piacendo molto. Prendo spunti un pò ovunque.
-
ho fatto delle prove, è normale avere robe tipo:
"ora grazie a monray le donne hanno una l'ultimo atto della battaglia legale che, da quattro anni, vede l'ultimo atto della battaglia legale che, da quattro anni, vede l'ultimo atto della battaglia legale che, da quattro anni, vede l'ultimo atto della battaglia legale che, da quattro anni, vede l'ultimo atto della battaglia legale che, da quattro anni, vede l'ultimo atto della battaglia legale che, da quattro anni, vede l'ultimo atto della battaglia legale che, da quattro anni, vede l'ultimo atto della battaglia legale che, da quattro anni, vede l'ultimo atto della battaglia legale che, da quattro."
-
@uMoR said:
ho fatto delle prove, è normale avere robe tipo:
"ora grazie a monray le donne hanno una l'ultimo atto della battaglia legale che, da quattro anni, vede l'ultimo atto della battaglia legale che, da quattro anni, vede l'ultimo atto della battaglia legale che, da quattro anni, vede l'ultimo atto della battaglia legale che, da quattro anni, vede l'ultimo atto della battaglia legale che, da quattro anni, vede l'ultimo atto della battaglia legale che, da quattro anni, vede l'ultimo atto della battaglia legale che, da quattro anni, vede l'ultimo atto della battaglia legale che, da quattro anni, vede l'ultimo atto della battaglia legale che, da quattro."
hai poco testo oppure è un caso sporadico dovuto a questo fatto:
Tutte le coppie presenti in questa frase "ora grazie a monray le donne hanno una l'ultimo atto della battaglia legale che, da quattro anni, vede" sono ripetute nel testo originale un'unica volta..se non fosse così non avresti quel caso
P.S. almeno credo questa è la prima spiegazione che mi viene in mente..cmq prova ad aumentare il testo
-
50kb son pochi ?
-
Ho trovato alcuni bug:
gli ho dato un testo da 1megabyte, crasha.
Fatal error: Allowed memory size of 52428800 bytes exhausted (tried to allocate 26 bytes)
Fatal error: Maximum execution time of 30 seconds exceededora provo con meno
-
con 300kb sembra funzionare decente, anche se non mi piace molto il risultato.
Con 500kb riesce a generare quasi completamente e il risultato sembra molto buono.
Con più di 500kb sulla maggior parte dei webserver viene killato
-
allora sono giunto a questa conclusione dopo un po di test:
Se ci si basa su testo "bello" bastano 100kb per produrre una pagina di 1000 parole con senso compiuto e non un'accozzaglia di spam.
Se ci si basa su testo "brutto" almeno almeno 400kb per tirar fuori qualcosa di decente.
-
a dire la verità anche a me genera testo ripetuto, però, come dice kerouac, il problema consiste nella "scarsa" (almeno per questo script) disponibilità di testo.
-
Se il testo non è monotematico lo script non funziona..quindi usate solo testo monotematico..il problema dei kb dipende appunto dal server e l'avevo già notato (mi pare di averlo scritto nella guida).
Il punto è questo:
se non esistono abbastanza coppie di parole uguali, lo script ha poche possibilità di scelta..quindi rischia di arrivare ad un punto morto e ripetere sempre la stessa frase. Io vi consiglio 100kb di testo monotematico
-
io ho aggiunto parecchi filtri sui testi e con 100kb vengono fuori cose carine..
-
@uMoR said:
io ho aggiunto parecchi filtri sui testi e con 100kb vengono fuori cose carine..
Io prima o poi vorrei provare a usare come teso originale un testo generato tramite le markov chain..chissà cosa viene fuori
-
Come vi organizzate per i testi...
Li scrivete ?
Utilizzate un programma di ocr ?
Oppure ?
-
@uMoR said:
io ho aggiunto parecchi filtri sui testi e con 100kb vengono fuori cose carine..
Ci delucidi un pochino uMoR?
-
@Dell'Orto Fabio said:
Utilizzate un programma di ocr ?
Oppure ?Cosa vuol dire ocr?
Oppure copia e incolla
-
premetto che non lo sapevo:
http://www.google.it/search?hl=it&q=define%3Aocr&btnG=Cerca+con+Google&meta=
-
azz, non si ha mai finito di imparare :bho:
cmq ecco alcuni link utili:
pagina con vari software ocr:
http://www.brothersoft.com/ocr_freeware_shareware_software_download_4.htmldue software ocr gratuiti:
http://jocr.sourceforge.net/download.html
http://www.brothersoft.com/Utilities_Scanner_and_OCR_HTMLtoRTF_Converter_Easy_37843.htmlanche se il HTMLtoRTF forse non l'ho capito bene
-
@paolo said:
Oppure copia e incolla
Se si copia dal Web, è una pessima idea.
Se si usa lo stesso vocabolario di un documento che Google già conosce, è facile essere riconosciuti.
-
@LowLevel said:
@paolo said:
Oppure copia e incolla
Se si copia dal Web, è una pessima idea.
Se si usa lo stesso vocabolario di un documento che Google già conosce, è facile essere riconosciuti.
d'accordo d'accordo, però esiste qualche documento che Google non conosce ancora? Tieni conto che ci sono dei siti che riproducono letteralmente intere opere letterarie, qualche mese ho trovato la Divina Commedia intera in un sito web...
cmq, se devo scrivermi il testo scopiazzando o "ocrando ( () )", alla fine a cosa servono le markov chain se non mi risparmiano ore di lavoro?
-
Se si copia dal Web, è una pessima idea.
Se si usa lo stesso vocabolario di un documento che Google già conosce, è facile essere riconosciuti.Perchè ?
Allora tu dici giustamente che usando il vocabolario di un'altro documento il filtro antiduplicazione parte.. giustamente..Ma se uso il vocabolario di 200 pagine web ?
Se ne accorge ancora ?
-
@LowLevel said:
Se si copia dal Web, è una pessima idea.
Se si usa lo stesso vocabolario di un documento che Google già conosce, è facile essere riconosciuti.
forse sei un pò troppo pessimista, se devi promuovere lacci per scarpe, non hai 25000 parole a disposizione, alla fine il tutto si riduce a qualche decina di parole, però se un concorrente ha messo il sito prima di te, Google ti banna?
oppure facciamo l'esempio di una biografia di Verdi, quanti siti ci sono con la biografia di Verdi? Sono tutti bannati ecceto il più antico?
:bho: