Mr. Doorway

francesco.ricci

dai cerchiamo di collaborare insieme, anche io sono un discreto programmatore php

rinzi

grazie della soffiata Fradefra

francesco.ricci

io direi fradefra ti tenerci informati su cosa sta facendo google, poi i tuoi amici si sa che stanno trovando un modo per fare un redirect senza che google li scopra

paolo

@fradefra said:

Pare che Google abbia molto migliorato i suoi algoritmi ed anche il javascript è correttamente interpretato e valutato.

anche quello esterno?

catone

Volevo tornare ad una affermazione precedente di Low: utilizzando un certo codice in un url si ottiene una serp senza l'attivazione del filtro antiduplicazione. Esiste qualcosa per ottnere risultati simili data una chiave: ad es. vorrei la serp di "scarpe" senza filtro antiduplicazione attivato.

jerry

Ecco una traduzione...scusate per qualche cosa che nn torna ma non potete capire la difficoltà

Divertirsi con le catene di Markov .
Spesso mi sono interrogato riguardo alla mia firma del messaggio, che cosa è apparso nella parte inferiore dell' email e dei postings di USENET per gli anni adesso:

"e Aholibamah Jeush nudo, e Jaalam, e Korah: questi erano i borogoves... "
Tranne l'ultima parola, questo testo proviene dalla genesi 36:5. Aholibamah era una delle mogli di Esau. Tuttavia, Esau non ha generato borogoves, nè mimsy nè alcun erky. Così che cosa è successo qui? Presto nella mia carriera dell'università, ho scritto un piccolo programma per mescolare del testo. È una procedura ben nota. Per esempio, è disponibile in Emacs come "press dissociata". Ma non lo conosco al momento, cosi ho scritto il mio (è probabilmente più veloce in C che in ELISP, comunque.)
Il Programma

chan.c, il codice sorgente di C del mio programma.
Un mac (68K) eseguibile
Un mac (PPC) eseguibile
(noterete che è un po'goffo e definitivamente pre-ANSI. Scusate per questo. Sforzo iniziale. E le versioni per il Mac sono anche rapide-e-sporche.) Qui è partita l'idea: esamini il testo e generi una tabella enorme di frequenza di come le parole vengono dopo altre parole. Esempio, consideriamo la parola "Up the" che ricorre sei volte nel testo; quattro di quei periodi sono seguite "dal tronco del discorso" e due volte "dalla scaletta". Registriamo queste informazioni nella tabella. E così via per ogni accoppiamento delle parole nel testo.
Allora, generiamo l'uscita che è casuale, ma abbiamo la stessa distribuzione dei gruppi di parola. Ciò è molto facile avendo la tabella. Inizia con un seme, che sono le prime due parole del testo originale; per convenienza, diciamo che per noi è "Up the".
Allora rotoliamo un dado a sei facce con "tronco del discorso" scritto su quattro lati e le "scalette" scritte su due lati. Mettiamo che esca sulla faccia della " scaletta"; stampa questa parola dopo. Ora spostiamoci di una parola avanti e troviamo "la scaletta" nella tabella e rotoliamo i dadi ancora. Ripeti fino a che non abbiamo altretante parole e siamo nella modalità per farlo.

Per aggiungere effetto, il mio programma tiene conto della punteggiatura, degli spazi, ed alla linea rotta (credo intenda accapo) come componente "di una parola". Così quegli elementi inoltre sono riprodotti nell'uscita con la stessa frequenza dell'originale.

È inoltre possibile usare lo stesso trucco con i gruppi di lettere o i gruppi di parola. L'effetto è più surreale; anziché le piste di commutazione irregolarmente nel mezzo delle frasi, il testo salta intorno nel mezzo delle parole. Per usare questo programma, compilalo -- se potete -- ed allora scrivete qualcosa tipo:

n 5000 - d chan 2 < input.txt

In questo caso, produrrà 5000 parole di uscita, controllate da 2 gruppi di parole. (la spiegazione qui sopra descrive la generazione a due parole. Se scrivete "- d 3", il programma cercherà i gruppi di tre-parola e così via. Gruppi + ampi hanno più significato, ma richiedono più testo di entrata ed occorrono più tempo per processare.)

L' eseguibile del Mac ha processato 5000 parole e 2 gruppi di parole, da quando una finestra di dialogo di controllo ha iniziato a lavorare realmente. Questi eseguibili sono il codice sorgente originale inceppato nella libreria di I/O. del mio Glk portatile.

Che cosa ho fatto con esso

Tuttavia, intorno ad una rottura della sorgente nel 1991, sono stato ispirato dalle nuovissime macchine NeXT giù nel CMU (è la Carnegie Mellon University ). Vedi loro hanno un numero di testi di pubblico dominio installati su essi -- compreso la Bibbia, Alice nel paese delle meraviglie e un mucchio di testi di Shakespeare. Così ho collegato insieme alcune cose, forzarli insieme nel chan.c, ed ho chiesto 5000 parole di uscita. (con "- d 3", se ricordo correttamente.)

Alice in Elsinore: I libri di Alice e Amleto.
La rivelazione di st Alice: I libri di Alice ed i libri della Genesi e della Rivelazione.

Questi files sono interamente inediti; ciò sono esattamente come sono usciti dal programma. Riescono in qualche modo ad avere una specie bizzarra di senso, molto di + di quanto si possa immaginare. E commutano quasi sempre dentro o fuori la modalità di Alice al tempo giusto.

La mia firma è circa 90% del senso giù la Rivelazione della St. Alice. (in primo luogo è comparso sul USENET il 15 gennaio 1992 -- grazie Google!)
Recentemente (settembre del 2000) qualcuno ha suggerito a Robert Chambers Il re giallo e Il libro egiziano dei morti. Di conseguenza si è ottenuto:

Il libro egiziano di colore giallo

Addendum

Dieci anni più dopo, ho imparato che c' è un uso per questa assurdità. La gente sta ricercando gli schemi per categorizzare i testi dalle loro tabelle di frequenza-lettere. Cioè, crei le tabelle di frequenza per parecchi testi, ed allora confronti le tabelle per determinare quali testi sono simili ad ogni altro.

E' da matti, naturalmente, ma sembra funzionare. Ho scritto un semplice testo, ed il mio programma riusciva a determinare che i due libri di Alice fossero l'un l'altro molto più simili rispetto al confronto con l' Amleto. Dannato programma lento . Ma questo ha potuto rispondere a delle domande sui documenti ricercati sul web. Chi lo sa? Questa è una bibliografia Research on N-Grams in Information Retrieval,compilata da Jim Mayfield. Utile se desiderate le più informazioni su questa roba.

jerry

Allora?? Ci avete capito qualcosa? Non avrete mica abbandonato questo progetto di un selezionatore di parole per testi su doorway... credo sia molto utile che ne dite??

lowlevel

@Catone said:

Esiste qualcosa per ottnere risultati simili data una chiave: ad es. vorrei la serp di "scarpe" senza filtro antiduplicazione attivato.

Se intendi un apposito comando per la ricerca, credo di no.

catone

Sì proprio quello Low. Sai, pensavo che dopo il presunto comando per eliminare l'effetto sandbox dalle serp qualcuno avesse trovato qualcosa di simile per l'antiduplicazione...

marcotuscany

@Catone said:

Sì proprio quello Low. Sai, pensavo che dopo il presunto comando per eliminare l'effetto sandbox dalle serp qualcuno avesse trovato qualcosa di simile per l'antiduplicazione...

Ah un sistema c'è, per evitare il filtro anti-duplicazione.

Creare contenuti validi e originali, sembra una affermazione semplicistica ma è esattamente quello che vuole GG.

Se uno si sforza nel possibile di fare questo neppure tanto alla lunga verrà premiato e anche tanto.

E' chiaro che chi deve o meglio vuole fare 5.000 door alla volta deve per forza seguire altre strade, ma nel caso di siti "umani" e veri, con una loro struttura e contenuti normali questo è il da farsi e paga.