• Super User

    Anche se non ho più il tempo per partecipare sui forum SEO come una volta, oggi ho seguito un REFERER dal mio sito e questa discussione ha attirato la mia attenzione.

    In particolare volevo dire la mia circa la natura semantica dell'algoritmo usato dalla ricerca di Libero.

    @Stealth said:

    Credo che libero con questo sito stia dando un contributo qualitativo all'utente, ma parlare di semantica è troppo.

    Stealth, quell'algoritmo è semantico sul serio. E pure bello tosto! 🙂

    Forse la ricerca di "pesca" non rende bene l'idea di quello che l'algoritmo può fare, ma la sua natura è fortemente semantica, in quanto si basa su una mappa di migliaia concetti (non parole o termini) correlati tra loro attraverso rapporti di vario genere.

    Ad esempio, approfondendo la ricerca "pesca" e cliccando su "pesca come Cattura degli animali", si accede ad un'ulteriore lista di suggerimenti che comprende "caccia alla balena", un suggerimento che non contiene per nulla la parola "pesca" e che è ottenibile solo lavorando sui concetti e non sui vocaboli.

    L'algoritmo utilizzato da Libero è stato fornito da Expert System, ed è probabilmente il più sofisticato esistente per la lingua italiana.

    Basti pensare che persino Google con l'acquisizione di Applied Semantics nell'aprile 2003, ottenendo tra le altre cose la tecnologia AdSense e l'algoritmo CIRCA, sul quale AdSense si basa, si ritrovò un algoritmo semantico ottimo, ma che non teneva conto di particolari (significativi) che l'algoritmo di Expert System invece gestisce.

    Se tra un po' di tempo uscisse fuori la notizia dell'acquisizione di Expert System da parte di un grosso motore di ricerca, la cosa non mi stupirebbe affatto.

    Ecco qui una white paper sulla tecnologia discussa. Non è tecnica, ma dovrebbe far intuire abbastanza bene le potenzialità del sistema e le differenze con i sistemi già esistenti (consiglio il paragone col CIRCA):

    http://www.expertsystem.it/documenti/pdf_tecnologia/white_paper_cogito.pdf

    Spero di aver fornito qualche spunto interessante.

    Temo che il poco tempo a disposizione renderà questo mio intervento solo una "comparsata". A rileggerci, prima o poi. 🙂

    Aggiunto: E complimenti a Giorgiotave per il bel forum!


  • User Attivo

    procederò alla lettura.


  • Community Manager

    Ciao Low,

    Grazie per l'articolo molto interessante.

    Ho letto alcune cose e prometto di rileggerlo bene ma quoto questa

    Un esempio fa immediatamente capire come la ricchezza di significati sia fonte di problemi
    d'interpretazione:
    (a) I due litiganti si sono scambiati calci e pugni.
    (b) Con la lente vide alcune piccole incisioni sul calcio della pistola.
    (c) Il campionato di calcio comincia la prima settimana di ottobre.
    (d) Il simbolo del calcio è Ca.
    Come si può vedere, una parola come ?calcio? ha diversi significati e tutti devono essere
    identificati in modo preciso per consentire una corretta elaborazione concettuale dei contenuti.
    All?interno di COGITO®, queste informazioni sono memorizzate in una serie di reti semantiche
    realizzate in modo specifico per l?elaborazione automatica dei testi: non semplici dizionari di
    termini, ma fitte reti di collegamenti e dati che consentono di rappresentare informazioni
    complesse, indispensabili per la disambiguazione. Grazie a queste informazioni, COGITO® sa che
    forme diverse (come ?disastro aereo? e ?sciagura aerea? oppure ?motorino? e ?ciclomotore?)
    rappresentano in realtà lo stesso concetto, un?operazione impossibile per i sistemi che si limitano
    ad agire sulle parole e non sui concetti.

    Siamo di fronte alla semantica pura, non ad un elenco di vocaboli.

    Aggiunto: grazie Low per i complimenti, fanno molto piacere


  • Super User

    Ciao Low.
    Vado a studiarmi il tutto con cura.

    Spero di aver fornito qualche spunto interessante.
    Ci puoi contare :vai:


  • User Attivo

    Ad esempio, approfondendo la ricerca "pesca" e cliccando su "pesca come Cattura degli animali", si accede ad un'ulteriore lista di suggerimenti che comprende "caccia alla balena", un suggerimento che non contiene per nulla la parola "pesca" e che è ottenibile solo lavorando sui concetti e non sui vocaboli.

    In effetti non avevo provato a proseguire la ricerca, mea culpa. Quello del web semantico è un concetto estremamente interessante ma non facile da capire perchè utilizza dei costrutti sia propri alla grammatica/matematica, sia alla "filosofia" (per fortuna qualche esame di filosofia dato in passato permette di non avere troppa paura di fronte a certi concetti un po' "astratti").
    Infatti le reti semantiche che si vogliono utilizzare per mettere in relazione gli argomenti non sono molto dissimili dalle reti neurali che permettono la formazione dei concetti (almeno per quanto se ne sà oggi del funzionamento del cervello).

    All'epoca della sua pubblicazione proposta da Tim Berners-Lee molti ne hanno parlato sulle ali dell'entusiasmo, nonostante ciò è piuttosto difficile trovare risorse e informazioni dettagliate, e non banali. A quanto pare però, dopo più di cinque anni (la Road Map di Berners-Lee è del '98 ), le applicazioni pratiche finalmente si stanno svliuppando (vedi appunto il motore di Libero, o anche il sistema dell'azienda americana suggerito in uno degli articoli su html.it che ho linkato sopra).

    Ho da tempo l'impressione che sia molto più difficile definire con parole e dare un applicazione pratica al concetto piuttosto che comprenderlo. Sto scrivendo un articolo sull'argomento proprio in questi giorni per una rivista a larga diffusione in cui la parte più complicata è proprio cercare di "farsi capire" dagli utenti medi: il documento che hai suggerito mi sarà certo di aiuto, sia per spiegare meglio il concetto, sia per portare un altro esempio pratico. Grazie mille dell'intervento e delle specifiche.

    Vedo che nell'articolo si usa l'esempio del "Calcio"... io ho utilizzato quello del "Golf" (che è sia uno sport, sia una maglia, sia il modello di una macchina), ma va bene anche quello di "Leopardi" (animale, scrittore), e innumerevoli altri...

    Posso chiederti anche un giudizio sul thesaurus di Godado e sul suo sistema di utilizzo?

    grazie,
    Lucas 😉

    ps: a quando il superamento del test di Turing? Siamo in ritardo di 5 anni... :fumato:


  • User Attivo

    Ma guarda un po' che bella cosetta:

    ho provato a cercare prima "[url=http://www.google.it/search?num=100&hl=it&c2coff=1&q=problem+submit+form+floppy+query&btnG=Cerca&meta=]problem submit form floppy query" e poi "[url=http://www.google.it/search?num=100&hl=it&c2coff=1&q=problem+submit+floppy+form+query&btnG=Cerca&meta=]problem submit floppy form query".

    Nel primo caso non mi viene dato alcun suggerimento di ricerca, nel secondo mi si dice "Forse cercavi: problem submit floppy from query".
    Direi che c'è una evidente analisi sulle triple (e cioè sulla presenza di soggetti, aggettivi, ecc. e sull'ordine delle parole)

    che ne dite?

    Lucas 😉

    ps: non venitemi a chiedere perchè stavo cercando quelle parole! :lol:


  • Super User

    Ciao Lucas e ciao a tutti!

    Questo è un 3D BELLISSIMO!!!

    Ho appena inserito quello che hai segnalato direttamente nel mio sito che ho creato per fare la mia tesi.

    Non so ancora perfettamente su cosa verterà ma si occuperà di web semantico.

    Per ora ho il compito di raccogliere piu informazioni possibili sull'uso da parte dei motori di ricerca di ontologie.

    Libero è un bel po avanti a parer mio...
    Spero tanto che questo 3D continui.

    Vi linko il sito della mia tesi: www.tesiweb.net

    Ciao e complimenti a tutti per questo 3D! 😄


  • User Attivo

    Ciao tuonorosso,

    se ti serve posso spedirti quell'articolo sull'argomento di cui parlavo due post sopra (devono ancora pubblicarlo perciò tienilo stretto 🙂 ), è piuttosto lungo e non molto complicato (è una panoramica), perciò sicuramente potrai trovare cose più tecniche qua e là, ma se ne hai bisogno di un pò di materiale per la tesi...

    dimmi pure, ciao,
    Lucas

    ps: sicuro che l'indirizzo del tuo sito sia giusto?


  • Super User

    certo certo..manda pure! 😉

    se hai msn aggiugnimi

    Ciao e grazie.

    PS: volendo potremmo tenere il mio sito come punto di raccolta di info se vuoi..


  • User Attivo

    Arrivo eh!
    Sono stato fuori genova fino a oggi.

    Ottima idea quella del "punto di ritrovo semantico"! 😉

    stasera o domattina ti mando l'articolo, ciauz,
    Lucas 🙂


  • Super User

    ottimo...e teniamo alto questo interessante 3D

    PS: non ci sono fino a domenica sera cmq 😉


  • User Attivo

    inviato all'email in firma!

    ciauz,
    Lucas 🙂


  • Super User

    ricevuto e risposto..

    GRAZIE GRAZIE


  • Community Manager

    ehi chat,

    ma a noi non ci fate sapere niente? 😄


  • Super User

    per ora vi posso dire di seguire www.tesiweb.net 😄


  • User Attivo

    Ciao Giò,

    questo tuo post mi fa ricordare che tempo fa mi avevi chiesto se avevo pronto qualche articolo sul web marketing...
    Il problema principale è che il 99,9% degli articoli che ho scritto sono stati pubblicati con cessione del copyright, e, nel contratto, c'è scritto che non posso divulgarli, avendo ceduto ogni diritto economico (l'unico diritto che mi rimane è quello morale di "prodotto di ingegno", in pratica sono sempre costretti a dire che l'articolo l'ho scritto io, anche se il denaro lo prendono loro). Per questo ogni tanto rispondo con post chilometrici, per sostituire eventuali articoli... Poi per Tuonorosso, visto che si tratta della tesi, ho fatto un'eccezione, speriamo non se ne accorga nessuno (e scoprimmo che tuonorosso è un infiltrato della finanza!) 😄 .

    ciauz,
    Lucas 🙂


  • Community Manager

    Capito Lucas,

    comunque se ne farai mi raccomando di segnalarceli 🙂


  • Super User

    Sono Marsciallo Tuonorosso...chi mi cerca? :lol: :lol:


  • User Attivo

    Rispolveriamo un po' il tutto con alcuni interessanti articoli:

    • Articolo sulle [url=http://wwwcsi.unian.it/educa/mappeconc/petrucc.html]Mappe concettuali per la ricerca di informazioni su internet.* Un bell'esempio di [url=http://www.cyc.com/cyc/cycrandd/areasofrandd_dir/cycrandd/nlu]natural language understanding (in inglese ma interessante).* Un bell'articolo che descrive il [url=http://www.cyc.com/cyc/cycrandd/areasofrandd_dir/technology/whatiscyc_dir/whatsincyc]natural-language processing (in inglese ma interessante).
      Una curiosità presa dal primo articolo:

    Da evidenze empiriche abbiamo verificato che in media il 95% del tempo viene perso nel cercare tra i link ed i documenti trovati e meno del 5% nel pianificare e scegliere le parole chiave da inserire nei motori. Questo vuol dire che in una ricerca considerata soddisfacente, della durata media totale di 15 minuti, [gli utenti] non riflettono neanche 1 minuto sulla scelta delle parole-chiave da usare. L'assunto su cui si è basata la presente sperimentazione è che l'utente dovrebbe dedicare invece la maggior parte del tempo alla pianificazione della ricerca per migliorarne l'efficacia, diminuendo così il tempo complessivo dedicato all'operazione

    image

    ciauz,
    Lucas 😉


  • Moderatore

    @LowLevel said:

    ...
    Ecco qui una white paper sulla tecnologia discussa. Non è tecnica, ma dovrebbe far intuire abbastanza bene le potenzialità del sistema e le differenze con i sistemi già esistenti (consiglio il paragone col CIRCA):
    http://www.expertsystem.it/documenti/pdf_tecnologia/white_paper_cogito.pdf
    ...

    Il link non è più disponibile, c'è qualche anima pia che ha salvato il file? Me lo mandate in PVT?

    Grazie 1000 anticipate.