• User

    mi piacerebbe partecipare ma non sono così esperto, buon lavoro!

    cmq avete anche voi gli stessi [url=http://www.downloadblog.it/post/1058/il-giappone-contro-google-e-yahoo]finanziamenti del Giappone? 😄

    ok, me ne vado, buon natale! :ciauz:


  • Super User

    @resigua said:

    cmq avete anche voi gli stessi [url=http://www.downloadblog.it/post/1058/il-giappone-contro-google-e-yahoo]finanziamenti del Giappone? 😄

    fantasticare è bello ma l'obiettivo nn è quello di mettere il bastone tra le ruote a Google ne di emularlo

    vogliamo cercare di capire come funzionano i criteri di ranking

    poi chissà domani quali orizzonti vedremo...


  • Super User

    vogliamo cercare di capire come funzionano i criteri di ranking

    poi chissà domani quali orizzonti vedremo...

    E' così 🙂

    Ma stranamente ho come l'impressione che a qualcuno non piaccia che la parte più attiva del ForumGT possa vedere orizzonti più ampi... :bho:

    Davvero ci preferite a parlar di streganze e macumbe? 😄


  • Community Manager

    Per gli insulti alla mia persona e nei confronti della **mia comunità **[url=http://www.giorgiotave.it/forum/viewtopic.php?t=6316]continuate pure in questo topic

    Prego invece di continuare qui la discussione sul motore 🙂

    Abbiamo stabilito una commissione che svilupperà il motore.
    Abbiamo stabilito un capo-progetto
    Abbiamo stabilito un'interlocutore che informerà e spiegherà al forum tutti i passi per rendere questa esperienza del Forum e studiare insieme tutti gli aspetti che i Geniacci devono affrontare 🙂

    :ciauz:


  • User Attivo

    Stamattina girando per blog ho trovato [url=http://www.symfony-project.com/askeet/21]questo, magari può essere utile :ciauz:


  • User Attivo

    io vi consiglio di dare un'occhiata a
    "Perlfect Search"

    è un motore di ricerca in perl, potrebbe tornare utile per capire come strutturare il tutto


  • User Attivo

    Fare un motore di ricerca e' semplicissimo, potrebbe avere anche 2 o 3 algoritmi di sort e via.

    Fare un buon motore di ricerca e' difficilissimo, cosi' ad occhio mi vengono in mente almeno un centinaio di algoritmi diversi da far interagire tra di loro.

    Fare un grande-vasto motore di ricerca e' impossibile se non si dispone di risorse adeguate, per capirlo basta provare ad indicizzare e catalogare un milione di pagine, e poi dopo, provare a pensare che invece di qualche milione si parla di miliardi di pagine.


  • User Attivo

    Indicizzare 1000000 di pagine mi sembra vada più che bene per i nostri studi...
    O no?!?


  • Super User

    Fare un motore di ricerca e' semplicissimo, potrebbe avere anche 2 o 3 algoritmi di sort e via.

    Spiegare come è stato fatto ai forumisti rendendoli partecipi del suo funzionamento ed innalzandone il livello conoscitivo sarà interessantissimo 😉


  • Super User

    Eccoci qui. 🙂

    Cominciamo per ora l'approfondimento del IR in questo thread, per evitare dispersioni, poi appena sarà più sviluppato ne creeremo uno apposito.

    Come abbiamo già più volte scritto, il fine è quello di alzare il più possibile il livello della parte attiva di questo ForumGT, ricordando che il livello del Forum stesso non è dato dalle domande dei forumisti ma dalle risposte.

    Stà a noi ora fare il possibile affinchè si cerchi di rendere accessibile a quella parte il funzionamento dei MDR.


    ** Modello Vettoriale di Reperimento Informazioni**
    Il [url=http://www.hray.com/5264/math.htm]Modello Vettoriale di Reperimento delle Informazioni è un potente strumento per la realizzazione del Motore di ricerca.

    Questa discussione cerca di fornire un'introduzione ai concetti matematici richiesti per capire il vector model ed intende mostrare l'applicazione di quei concetti nello sviluppo del modello stesso.

    L'aritmetica con cui "funzionano" i computers è a base 2
    Le informazioni (numeri, parole ecc .) che vengono elaborate o memorizzate in un computer sono codificate come sequenze di bit.
    Un bit (binary digit) è la più piccola unità di informazione e può prendere i valori : 0 oppure 1 .

    Un byte è una sequenza di 2 ³ = 8 bit . Per esempio: 00110101 è il possibile contenuto di un byte.

    Il Kb (chilobyte) corrisponde a image bytes, cioè 1024 bytes.
    Il Mb (megabyte) corrisponde a image Kb .
    Il Gb (gigabyte) corrisponde a image Mb .

    **Logaritmi: log(N) **
    Il logaritmo è la prima funzione matematica che dobbiamo capire perché il Modello Vettoriale ha equazioni logaritmiche (N/ni).
    **Se non conosciamo cos?è un logaritmo non possiamo capire il concetto del Modello Vettoriale. **

    In primo luogo, che cosa è una funzione matematica? Nella sua forma più semplice, una funzione è un calcolo che prende un numero come input, effettua un calcolo su quell'input e restituisce il valore del calcolo.
    Consideriamo la funzione quadrata, "sq".

    • sq(2) restituisce 4.
    • sq(9) restituisce 81.
      Così il sq(N) significa restituire il valore di N * N.

    Seguendo questa linea di pensiero, il log (2) significa restituire il logaritmo del numero 2.
    Il log (N) significa restituire il valore del logaritmo della variabile N, qualunque valore N possa avere.

    Conosciamo ora come quadrare un numero, ma che cosa è la funzione di logaritmo?
    Come è calcolato?

    Si chiama logaritmo in base a di b l'unica soluzione dell'equazione esponenziale elementare.

    Supponiamo di dover risolvere un'equazione esponenziale ax=b :
    :
    ? se a e b si scrivono come potenze (razionali) della stessa base, si eguagliano gli esponenti :

    2x* =8 --> 2x = 23 --> x=3 *

    ? se a e b non si scrivono come potenze (razionali) della stessa base, le soluzioni si scrivono sotto forma di logaritmi : 2x = 8 --> x=log2 8

    Il logaritmo risulta essere l'operazione inversa dell'esponenziale.

    Senza studiare troppo il senso del termine, possiamo giocare un pò con Google e vedere le risposte che restituisce per la funzione di logaritmo. Google ha un calcolatore incorporato che utilizziamo per questa ricerca.
    Digitiamo "log 0,5" (senza le virgolette) in Google e otteniamo -0,301029996.
    Proviamo con "log 95" ed otteniamo 1,97772361.
    Possiamo tentarne altri; qual è il log 6666?

    Questi numeri a caso ci danno un?idea del sistema, ma se realizziamo una tabella organizzata di numeri, questa ci rivela la vera traccia:

    N -->log ( N )
    1 --> 0
    10 --> 1
    100 --> 2
    1000 --> 3
    10000 --> 4

    Base 10 alla potenza del* log (N)*=N.
    Quindi, se abbiamo un numero (10) e prendiamo il suo logaritmo e innalziamo 10 a quella potenza, otteniamo di nuovo il nostro numero originale:

    • 10 alla prima =10
    • 10 alla seconda = 100
    • 10 alla terza = 1.000
    • 10 alla quarta = 10.000

    La tabella indica che la funzione di logaritmo è utile nei numeri compressi molto grandi fino ai formati maneggevoli; questo è un calcolo di riduzione in "ordine di grandezza?.
    Inoltre, notiamo che il log(1) è uguale a zero.

    Ripetiamo facendo un altro esempio.

    la potenza abbiamo visto è il prodotto di fattori uguali alla base tante volte quanto indicato dall'esponente.
    Per esempio:
    image
    5 ³ = 125

    La potenza ammette due tipi diversi di operazione inversa : la radice ed il logaritmo.

    Radici.
    Consideriamo la potenza 5 ³ = 125 . Possiamo allora definire l' "operazione" di radice a indice 3 (o radice cubica) :

    image

    Logaritmi.
    Esiste un altro modo di definire l'operazione inversa dell'elevamento a potenza : il logaritmo.

    Consideriamo ancora la potenza 5 ³ = 125 . Chiediamoci : qual'è il numero per cui elevare la base 5 per ottenere 125 ? Ovviamente questo numero è 3 .

    Abbiamo così definito il concetto di logaritmo. Scriviamo allora :
    image

    dove il numero 5 scritto in basso a destra del simbolo *log * si chiama base ed il numero di cui si fa il logaritmo si chiama argomento.

    La definizione di logaritmo è allora :

    Il logaritmo di un numero secondo una certa base è quel numero per cui si deve elevare quella base per ottenere il numero dato.

    La caratteristica più interessante della funzione di logaritmo è che i log dei valori fra 0 e 1 sono numeri negativi.
    Per esempio, log (0,5) = -0,301029996.
    Molte volte vedremo* -log(x)* in un'equazione.

    Se il valore di quel segno è negativo, ora sappiamo dunque che la X è una variabile che varia da zero ad uno.

    Così ora se vediamo il log (N) in un'equazione, abbiamo un?idea di che cosa significhi e con esso possiamo valutare alcuni valori.

    Un logaritmo misura quindi l'ordine di grandezza di un numero N.
    E? solo un più piccolo numero che sostituisce quello originale.

    E nel caso speciale dove la N è uno, allora il log(N) sarà zero.


    Un ardito Gruppo di Geniacci ha già iniziato a tramare per realizzare un semplice motore di ricerca.

    Passo passo vi terrò informati sugli sviluppi, cercando di spiegare cosa hanno realizzato e perchè i nostri eroi.

    Oggi abbiamo visto i logaritmi.

    La prossima puntata studieremo i coseni. :ciauz:


  • Super User

    Il coseno
    Il coseno è una funzione trigonometrica con alcune proprietà che sono molto utili nell'analizzare i vettori. [vector model]

    Stiamo raffigurando i** documenti** della nostra raccolta del nostro motore come vettori.
    Inoltre raffiguriamo la **query **dell'utente come vettore.
    Se potessimo confrontare in qualche modo il vettore di domanda ai vettori di ciascuno dei documenti, potremmo dire quale dei documenti sia "il più vicino" alla domanda.
    Ciò ci darebbe una classifica per la nostra ricerca.

    Dunque, come classificare la prossimità dei vettori?

    Una via da considerare (un pò complicata) è misurare l'angolo fra loro.
    Se l'angolo è molto piccolo, significa che i due vettori sono abbastanza vicini. Se l'angolo è grande, allora non lo sono.
    Facile.

    Tuttavia, se desideriamo usare la matematica occupandoci di angoli, otteniamo numeri-gradi bizzarri.
    Gli angoli non sono difficili da manipolare se sono predisposti per variare in modo regolare ... come fra uno e zero per esempio.

    **0 **potrebbe significare "completamente differente" e 1 potrebbe significare "identico" con una gamma completa di valori (somiglianze) fra 0 e 1.

    Ora, se facciamo una tabella di alcuni angoli e dei loro coseni, possiamo vedere come il coseno semplifica gli angoli:

    Angolo A --> Coseno (A)
    0° --> 1
    30° --> .86
    45° --> .70
    60° --> .5
    90° --> 0

    La tabella indica che quando l'angolo fra due vettori è molto piccolo, il coseno è prossimo a 1.
    Effettivamente, se i due vettori combinano perfettamente, il coseno è uguale a 1.
    Nella nostra applicazione IR, quello sarebbe una accostazione perfetta fra il vettore di domanda e un vettore del documento. 🙂

    Mentre l'angolo aumenta, il coseno (il grado di somiglianza fra i vettori) diminuisce fino a che non raggiunge zero quando i vettori sono a 90 gradi.
    Guardiamo l?immagine:
    imageimageimage
    In un sistema organizzato in cui ogni coordinata ha avuto la sua dimensione, quella potrebbe essere una misura approssimativa di somiglianza. Tuttavia per il nostro modello di vettore desideriamo stimare diverse coordinate (termini di ricerca) anche usando sistemi diversi; dobbiamo quindi rendere il sistema un po? più complicato 🙂
    E lo faremo presto!

    **Per ora, vediamo che il coseno è una funzione che misura un rapporto fra due vettori. **

    Il coseno dell'angolo fra loro è prossimo a UNO se i vettori convergono ed è prossimo a ZERO se l?angolo fra i vettori si avvicina a novanta gradi.


    Abbiamo già visto che usando la funzione matematica dei logaritmi log (N) possiamo suddividere valori fra 0 e 1;

    • log (1) = 0
    • -log(x) [i log dei valori fra 0 e 1 sono numeri negativi, per esempio, log (0,5) = -0,301029996. ] Se il valore di quel segno è negativo, sappiamo che la X è una variabile che varia da zero ad uno.
      Nel caso speciale log (N) dove il valore (N) è uno, allora il log(N) sarà zero.

    Sappiamo ora anche che con l'uso dei coseni possiamo misurare un rapporto fra due vettori; il coseno dell'angolo fra loro è:

    • prossimo a UNO se i vettori convergono.

    • prossimo a ZERO se l?angolo fra i vettori si avvicina a novanta gradi.

    La prossima puntata studieremo la Sommatoria
    image

    :ciauz:


  • User Attivo

    Ciao a tutti ragazzi, progetto davvero interessante :vai:

    mi sarebbe piaciuto potermi unire al gruppo, ma non posso farne neanche richiesta perchè sono troppo impegnato. 😞

    preparare il meccanismo base credo sia la cosa più complicata, ma nessuno si è posto il problema di come individuare il testo illeggibile

    Non sottovalutate questo aspetto, ci sono dichiarazioni nei fogli di stile complicatissime

    es: UL#categoria_destra LI A.gruppo

    associare del testo a queste dichiarazioni è davvero difficle. Per non parlere dei livelli a diversi z-index e/o posizionati fuori dalla visibilità.

    Insomma, sebbene per ora non sia una cosa fondamentale, è bene che qualcuno ci inizi a lavorare perchè non mi sembra una cosa semplice.

    In bocca al lupo a tutti! :ciauz:


  • Bannato User

    Mi posso unire anche io ??
    Io avevo gia incominciato qualcosa da solo per me
    Ho utilizzato openwebspider leggermente modificato

    Sto usando mysql come db anche se non mi sembra il massimo Io sono arrivato a spiderizzare qualcosa come 500 mila siti ed il db supera i 2 giga per questo dico che non va troppo bene perchè appena mi fa una query complessa muore li e arriva anche a 2 minuti

    Io sto usando lavorando in una sorta di logica fuzzy (anche se la trovo parecchio inadatta per come ho strutturato io) e dove attribuisco al numero dei caratteri della pagina un valore massimo di 1 la numero decimale delle lettere presenti e lo divido per il numero fuzzy degli spazi e cosi ottengo una sorta di coefficiente che mi da la media di distanza tra parola e parola . A questa guardo quanti spazi ho tra una frase mia e quella che è stata cercata dall'utente. Poi provo a suggerire con la funzione levenshtein in php 5 eventuali possibilità di suggerimento (ma anche questo lo devo ottimizzare perche troppo lento - salvo i valori in un array e poi li estraggo ma non mi piace) . Ora mi sono fatto un bot in php che segue gli url nelle pagine (avevo pensato a sto bot per far creare online la mappa di google proprio per risolvere il problema dei siti dinamici e dover far mettere a mano agli utenti i singoli link) e devo dire che funziona davvero bene . Il limite è il timeout di esecuzione che ha i limiti di apache

    A me la cosa interessa tantissimo
    se mi posso aggregare mi farebbe piacere

    PS : io so programmare in php e mysql


  • Super User

    Il nostro obiettivo è: > - creare un piccolo Gruppo molto preparato [ i Geniacci] e coordinato da un Responsabile che realizzino un semplice motore di ricercaal fine di comprendere il funzionamento dell' IR e del vector model. [questo Gruppo è già partito]

    • coinvolgere la parte più attiva del ForumGT nella discussione e nell'approfondimento di ciò che il Gruppo stà creando e metterlo in condizioni di comprendere il Progetto spiegando loro come è stato fatto, rendendoli partecipi del suo funzionamento ed innalzandone il livello conoscitivo

    Caro Gasmor 🙂
    Non ho capito perchè dobbiamo assolutamente porci il problema di come individuare il testo illeggibile. Il nostro obiettivo è ben altro che individuare il testo illeggibile.

    Caro Cached, certo che ti puoi unire, sei il benvenuto 🙂
    Per la realizzazione del semplice motore di ricerca, come puoi immaginare occorre un Gruppo molto affiatato, ed i nostri Geniacci sono già all'opera ;)... vi terrò costantemente informati.
    Per quanto riguarda invece il discutere ed approfondire l'argomento del funzionamento dei MDR, ogni contributo è il benvenuto.

    Ovviamente qui approfondiamo *questa *esperienza e potrebbe risultare fuorviante aprire discussioni sulle proprie esperienze personali, per le quali ti consiglio eventualmente di aprire un altro thread.

    :ciauz:


  • Bannato User

    @Mamilu said:

    Ovviamente qui approfondiamo *questa *esperienza e potrebbe risultare fuorviante aprire discussioni sulle proprie esperienze personali, per le quali ti consiglio eventualmente di aprire un altro thread.

    :ciauz:

    Complimenti per l'avatar (sei carina 🙂 ) cmq certo che allora mi aggrego
    Se mi dite da dove posso iniziare a trovare o mettere materiale ..


  • Super User

    Caro Cached, nell'attesa di valutare assieme la Sigma, potresti iniziare col commentare i precedenti post relativi ai logaritmi e coseni e la loro possibile applicabilità nell' IR e vector model 😄


  • User Attivo

    Mamilu, secondo me rischiate di complicare gli aspetti piu' semplici di questo progetto.

    I passaggi per un motore sono abbastanza comuni.

    1. si spiderizzano le pagine seguendo certi schemi.
    2. si decide cosa salvare in db e cosa no di quanto si e' spiderizzato
    3. si stabilisce come e dove archiviare quanto salvato
    4. si implementano gli algoritmi che "lavorano" solo sul contenuto delle pagine, posizionamento-distribuzione delle key, semantica, spam, ecc ecc
    5. si implementano gli algoritmi che "lavorano" sulle correlazioni esterne, link, duplicazione, dimensione ed estensione sito, ecc ecc
    6. si accorpa il tutto e si fa un sort in base alle query.

    Ognuno di questi punti puo' essere ampliato e corretto all'infinito.
    Per capirci che senso avrebbe scegliere le migliori pagine che rispondono ad una data query se a monte non ho stabilito quali potrebbero essere i migliori siti da spiderizzare che potrebbero soddisfare le query?

    E di questi migliori siti quante pagine spiderizzo per ogni sito?

    Domanda pratica, si stabilisce di spiderizzare 1.000.000 di pagine.
    Ma 10 pagine per 100.000 siti, 1 pagina per 1.000.000 di siti, a caso o come, in base a quali paramentri?

    Capisci cosa intendo?


    Ora tu mi dirai qui che lo scopo e prendere un tot di documenti anche in modo casuale per lavorare sull'aspetto interessantissimo di come estrapolare quelli che meglio rispondono a determinate query.

    Ma in questo caso si dovrebbe parlare di motore di ricerca interno, per intranet.

    Ok, in questo caso la tua intranet e' data da 5 sole pagine il cui contenuto e':

    Il cane correva nel prato erboso e fresco di rugiada.
    Correva come un cane, che cane come corridore!
    Il gatto ed il cane correvano.
    Corre il cane.
    Cane.

    5 semplici pagine di una riga ognuna. Ignoriamo il codice.

    Per la query cane, quale delle 5 metti al primo posto?

    La prima e' bella ma cane appare 1 volta su un tot di parole, la seconda appare 2 volte, ma si parla di "come un cane"... la terza magari, ma i soggetti sono 2 e cane non e' tra i primi termini, la terza perfetta ma corta, la quinta dice poco, una sola parola che senso ha per un utente, lui cerca cane e trova cane... ma se sbagli algoritmo sara' al primo posto.

    Ci vorranno tanti e tanti algoritmi per stabilire l'ordine, ed ogni algoritmo dovra' essere ben soppesato. Per farlo ci sono particolari tecniche di riscontro in base a come si comportono gli utenti, e 1000 altri modi.

    Modi statici e modi dinamici.


    Insomma e' giusto perseguire questo obbiettivo perche' ha un bellissimo scopo, quello di imparare o approfondire, ma fregatevene di seni, coseni, e formule matematiche, almeno in questa prima fase di approccio.

    Le cose migliori sono quelle semplici ed immediate, un problema e via con la soluzione, poco spazio e via con un hd nuovo.

    I problemi che sottolineano Cached e Gasmor sono alcuni di tantissimi altri problemi da affrontare. Ma basta un solo problema mal risolto per inficiare tutto.

    Finisco raccontano un anneddoto. 2 anni un dirigente di una multinazionale russa, o di quelle parti li', mi chise di mettere giu' un progetto per fare un buon motore per il loro mercato. Gli chiesi in quanto tempo lo voleva sviluppato e quanti soldi aveva. Mi parlo' di almeno 100 ml. Io pensai di euro e gli dissi che era fattibile ma non con meno di 3 anni di duro lavoro.

    La cifra poi scoprii essere in lire. Mai riso tanto. C'e' un limite anche al ridicolo.


  • Super User

    Insomma e' giusto perseguire questo obbiettivo perche' ha un bellissimo scopo, quello di imparare o approfondire, ma fregatevene di seni, coseni, e formule matematiche, almeno in questa prima fase di approccio.

    Le cose migliori sono quelle semplici ed immediate, un problema e via con la soluzione, poco spazio e via con un hd nuovo.

    Il problema caro Agoago, credo siano le macumbe ed i metodi profetici alla Nostradamus 😄
    O ci abbandoniamo a quelli [ma mi sembra si siano scelti altri metodi da tempo] o dimostriamo ciò che diciamo.

    E' quindi evidente che non è necessario studiare Coseni, Algoritmi ecc., ma è indispensabile sapere di cosa stiamo parlando ed indicare da dove provengono le apparenti alchimie magiche che stiamo per trattare.

    L'alternativa è enunciare probabili fanfaronate e pretendere di essere creduti sulla parola.
    A nessuno di noi piace questo. Vero?

    Accarezzati dal dolce brusio di sottofondo dei nostri Geniacci raccolti in conclave che stanno tramando i primi passi del nostro Semplice Motore di Ricerca...al fine di essere in grado di comprenderne i misteriosi meccanismi...procediamo quindi con la:
    Sommatoria.

    Ora cerchiamo di capire l'operatore di sommatoria, pronunciato "sigma."
    image

    Il sigma è un operatore, proprio come un segno di moltiplicazione o un segno di divisione.
    Dice di aggiungere insieme una serie di numeri. Quando vediamo un segno di moltiplicazione, sappiamo che moltiplicheremo quei numeri.
    Quando vediamo una sigma, sappiamo che aggiungeremo insieme una serie di numeri.

    Sia data la successione image che è come dire la "sequenza" di numeri image . Con essa possiamo costruire la seguente successione detta delle somme parziali :
    image

    La successione image (i puntini significano che si va all'infinito) così ottenuta si chiama serie e si indica con il simbolo :
    image

    ed equivale alla somma di tutti i termini della successione da cui siamo partiti, ovvero :
    image

    Ci sono alcune variabili connesse con quell'espressione che dobbiamo conoscere.
    image
    Le variabili determinano quanti termini vengono aggiunti e quali membri della serie sono inclusi:

      • K* variabile è l'indice della sommatoria.. I valori di* K* si allontanano da 1 a n nell'espressione qui sopra.
    • Le* a *sono i termini che vengono aggiunti insieme. Possono anche essere espressioni molto complesse, ma sono sempre membri di una serie e vengono sempre sommati insieme.

    • Il numero 1 è il limite più basso della sommatoria. Quello ci dice da quale termine iniziare.

    • La* n* variabile ci dice quando arrestarci, il limite superiore della sommatoria.

    Quando vediamo un'espressione come quella, la traduzione sarebbe "**prodotto della sommatoria da k uguali 1 a k uguali n di *a *sub k"
    **
    Così, una sigma significa " ottieni la somma di questa serie" e quando vediamo un sigma, guardiamo solo quali sono i termini e quindi sommiamoli insieme.
    Li aggiungeremo sempre insieme; questo è ciò che significa.

    La prossima volta studieremo il **Dot product ** 😄


  • User Attivo

    Mamilu scrive:

    "L'alternativa è enunciare probabili fanfaronate e pretendere di essere creduti sulla parola.
    A nessuno di noi piace questo. Vero?"

    Beh, quando chiunque di noi dice qualcosa credo pretenda in coscienza (e non da meno gli faccia piacere) essere creduto sulla parola, sempre che abbia stima della propria parola e soprattutto sia in buona fede.

    Quando poi, a fronte di prove contrarie, quello che dice e' smentito allora mi sembra il minimo che si ricreda e riveda il tutto, partendo da capo.

    Nella matematica stessa ci sono teoremi teorizzati e non dimostrati che aspettano da anni una dimostrazione, come la congettura di Riemann, ma non per questo quando Riemann la formulo' pensava di dire fanfaronate e soprattutto, sono certo, che gli avrebbe fatto piacere essere creduto sulla parola, in attesa che qualcuno nei secoli futuri potesse o smentirlo o avvalolarlo.

    Cosi' come quando dico che (non puoi creare anche il piu' semplici dei motori), se non disponi di sufficiente banda, forza hardware, ore lavoro e cultura informatica, non serve a nulla approfondire l'aspetto matematico (almeno in questa prima fase di approccio), mi fa piacere che mi si creda sulla parola, salvo ovviamente una logica e ferrea dimostrazione contraria.

    Come e' normale, da che mondo e' mondo, sia. Se leggo che oggi G ha cambiato le proprie serp credo cosa leggo partendo dal presupposto che nessun galantuomo scriva pubblicamente per fuorviare i colleghi.

    Poi se ho tempo e voglia certifico personalmente se e' vera la cosa, se non posso o voglio o non trovo smentite mi fido, anche fosse solo per principio.


    Per esempio spesso nei forum si legge post di chi domanda quale estensione usare per le proprie pagine, se htm, html, asp, php ecc ecc

    Che strano dubbio, beh se hai un dubbio non ci sono dubbi, ed allora invece di chiamare una pagina pagina.htm o pagina.php ecc ecc perche' piu' semplicemente non la si nomina pagina?

    Senza estensione.

    Un ottima estensione e' la NON estensione.

    Potrei dimostrarlo o forse no, forse e' solo un ipotesi, forse, ma nel momento in cui l'affermo, metto in gioco pubblicamente (come chiunque di noi scriva qualcosa condiviso con gli altri) la mia reputazione e credibilita' di informatico.

    E spero che mi si creda fino ovviamente a prova contraria (e che ben venga, almeno non mi danno con ennesimi test su test).

    E faccio sigma per sommare sequenze di numeri, positivi e negativi e senza nessuna correlazione tra di loro, grazie ad un buon e vecchio foglio elettronico o grazie alle formule delle librerie dei linguaggi di programmazione.

    Fidandomi per principio del risultato che mi da il computer, perche' parto dal presupposto che chi ha creato hardware e software l'abbia fatto con le migliori intenzioni e non per fregarmi.

    Ed anche se mi fregasse, beh sarei in buona compagnia, la vostra.


  • User Attivo

    Cosi' come quando dico che (non puoi creare anche il piu' semplici dei motori), se non disponi di sufficiente banda, forza hardware, ore lavoro e cultura informatica, non serve a nulla approfondire l'aspetto matematico (almeno in questa prima fase di approccio), mi fa piacere che mi si creda sulla parola, salvo ovviamente una logica e ferrea dimostrazione contraria.

    Quoto e aggiungo: quanti di voi conoscono bene il c ?
    Per bene non intendo condizioni e cicli che hanno tutti i linguaggi, piuttosto puntatori stringhe alberi grafi ordinamento fusione ecc ecc..

    Creare un motore di ricerca in un linguaggio diverso dal c (per lo meno lo spider) è a mio parere da pazzi, a meno che non si disponga di un clister di 15-20 mila computer chiaramente..
    Ho finito da poco di convertire alcuni tools in c su server linux, la differenza nei tempi è madornale rispetto a perl o altri linguaggi interpretati.
    Partendo con poche risorse è basilare ottimizzare quelle che si hanno..