- Home
- Categorie
- La Community Connect.gt
- Tutto sulla Community
- Piccoli algoritmi semantici crescono
-
Interessanti link di cui non sarebbe male discutere:
http://www.w3c.it/papers/RDF.pdf
http://www.websemantico.orgLucas
-
Altre discussioni sul futuro del Web Semantico e dei motori di ricerca semantici...
Il primo è un articolo di Tim Berners-Lee, professore di Computer Science alla Sounthempton ESC e direttore/creatore del World Wide Web Consortion (il celebre W3C), in inglese.
http://www.sciam.com/article.cfm?articleID=00048144-10D2-1C70-84A9809EC588EF21Il secondo è una interessante definizione generale di Web Semantico con descrizione dell'RDF (Resource Description Framework), una particolare applicazione XML che rende standard la definizione di relazioni tra informazioni, utilizzando i principi della logica dei predicati e gli strumenti tipici del Web (tipo l'URI o l'URL) e dell'XML (namespace).
http://it.wikipedia.org/wiki/Web_semanticoUn interessante elenco di informazioni dettagliate da HTML.it http://pro.html.it/lista_articoli.asp/idcat_46/
Infine un metamotore di recente creazione meritevole di attenzione. Il risultato di una ricerca su Kartoo.com non è una lista di pagine Web come solitamente avviene, bensì una mappa di siti uniti da linee che rappresentano graficamente i collegamenti semantici.
http://www.kartoo.com/Lucas
-
Bello www.kartoo.com ...lo conoscevo!
Molto interessante anche questo: www.touchgraph.comMostra in maniera visuale la 'struttura del web' - costituita da nodi (i siti web) e da linee (i link) - come è visto da Google: a partire da un indirizzo internet immesso dall'utente, è infatti possibile analizzare le connessioni (i link) più o meno forti che il sito web in questione intrattiene con altri siti.
-
Anche se non ho più il tempo per partecipare sui forum SEO come una volta, oggi ho seguito un REFERER dal mio sito e questa discussione ha attirato la mia attenzione.
In particolare volevo dire la mia circa la natura semantica dell'algoritmo usato dalla ricerca di Libero.
@Stealth said:
Credo che libero con questo sito stia dando un contributo qualitativo all'utente, ma parlare di semantica è troppo.
Stealth, quell'algoritmo è semantico sul serio. E pure bello tosto!
Forse la ricerca di "pesca" non rende bene l'idea di quello che l'algoritmo può fare, ma la sua natura è fortemente semantica, in quanto si basa su una mappa di migliaia concetti (non parole o termini) correlati tra loro attraverso rapporti di vario genere.
Ad esempio, approfondendo la ricerca "pesca" e cliccando su "pesca come Cattura degli animali", si accede ad un'ulteriore lista di suggerimenti che comprende "caccia alla balena", un suggerimento che non contiene per nulla la parola "pesca" e che è ottenibile solo lavorando sui concetti e non sui vocaboli.
L'algoritmo utilizzato da Libero è stato fornito da Expert System, ed è probabilmente il più sofisticato esistente per la lingua italiana.
Basti pensare che persino Google con l'acquisizione di Applied Semantics nell'aprile 2003, ottenendo tra le altre cose la tecnologia AdSense e l'algoritmo CIRCA, sul quale AdSense si basa, si ritrovò un algoritmo semantico ottimo, ma che non teneva conto di particolari (significativi) che l'algoritmo di Expert System invece gestisce.
Se tra un po' di tempo uscisse fuori la notizia dell'acquisizione di Expert System da parte di un grosso motore di ricerca, la cosa non mi stupirebbe affatto.
Ecco qui una white paper sulla tecnologia discussa. Non è tecnica, ma dovrebbe far intuire abbastanza bene le potenzialità del sistema e le differenze con i sistemi già esistenti (consiglio il paragone col CIRCA):
http://www.expertsystem.it/documenti/pdf_tecnologia/white_paper_cogito.pdf
Spero di aver fornito qualche spunto interessante.
Temo che il poco tempo a disposizione renderà questo mio intervento solo una "comparsata". A rileggerci, prima o poi.
Aggiunto: E complimenti a Giorgiotave per il bel forum!
-
procederò alla lettura.
-
Ciao Low,
Grazie per l'articolo molto interessante.
Ho letto alcune cose e prometto di rileggerlo bene ma quoto questa
Un esempio fa immediatamente capire come la ricchezza di significati sia fonte di problemi
d'interpretazione:
(a) I due litiganti si sono scambiati calci e pugni.
(b) Con la lente vide alcune piccole incisioni sul calcio della pistola.
(c) Il campionato di calcio comincia la prima settimana di ottobre.
(d) Il simbolo del calcio è Ca.
Come si può vedere, una parola come ?calcio? ha diversi significati e tutti devono essere
identificati in modo preciso per consentire una corretta elaborazione concettuale dei contenuti.
All?interno di COGITO, queste informazioni sono memorizzate in una serie di reti semantiche
realizzate in modo specifico per l?elaborazione automatica dei testi: non semplici dizionari di
termini, ma fitte reti di collegamenti e dati che consentono di rappresentare informazioni
complesse, indispensabili per la disambiguazione. Grazie a queste informazioni, COGITO sa che
forme diverse (come ?disastro aereo? e ?sciagura aerea? oppure ?motorino? e ?ciclomotore?)
rappresentano in realtà lo stesso concetto, un?operazione impossibile per i sistemi che si limitano
ad agire sulle parole e non sui concetti.Siamo di fronte alla semantica pura, non ad un elenco di vocaboli.
Aggiunto: grazie Low per i complimenti, fanno molto piacere
-
Ciao Low.
Vado a studiarmi il tutto con cura.Spero di aver fornito qualche spunto interessante.
Ci puoi contare
-
Ad esempio, approfondendo la ricerca "pesca" e cliccando su "pesca come Cattura degli animali", si accede ad un'ulteriore lista di suggerimenti che comprende "caccia alla balena", un suggerimento che non contiene per nulla la parola "pesca" e che è ottenibile solo lavorando sui concetti e non sui vocaboli.
In effetti non avevo provato a proseguire la ricerca, mea culpa. Quello del web semantico è un concetto estremamente interessante ma non facile da capire perchè utilizza dei costrutti sia propri alla grammatica/matematica, sia alla "filosofia" (per fortuna qualche esame di filosofia dato in passato permette di non avere troppa paura di fronte a certi concetti un po' "astratti").
Infatti le reti semantiche che si vogliono utilizzare per mettere in relazione gli argomenti non sono molto dissimili dalle reti neurali che permettono la formazione dei concetti (almeno per quanto se ne sà oggi del funzionamento del cervello).All'epoca della sua pubblicazione proposta da Tim Berners-Lee molti ne hanno parlato sulle ali dell'entusiasmo, nonostante ciò è piuttosto difficile trovare risorse e informazioni dettagliate, e non banali. A quanto pare però, dopo più di cinque anni (la Road Map di Berners-Lee è del '98 ), le applicazioni pratiche finalmente si stanno svliuppando (vedi appunto il motore di Libero, o anche il sistema dell'azienda americana suggerito in uno degli articoli su html.it che ho linkato sopra).
Ho da tempo l'impressione che sia molto più difficile definire con parole e dare un applicazione pratica al concetto piuttosto che comprenderlo. Sto scrivendo un articolo sull'argomento proprio in questi giorni per una rivista a larga diffusione in cui la parte più complicata è proprio cercare di "farsi capire" dagli utenti medi: il documento che hai suggerito mi sarà certo di aiuto, sia per spiegare meglio il concetto, sia per portare un altro esempio pratico. Grazie mille dell'intervento e delle specifiche.
Vedo che nell'articolo si usa l'esempio del "Calcio"... io ho utilizzato quello del "Golf" (che è sia uno sport, sia una maglia, sia il modello di una macchina), ma va bene anche quello di "Leopardi" (animale, scrittore), e innumerevoli altri...
Posso chiederti anche un giudizio sul thesaurus di Godado e sul suo sistema di utilizzo?
grazie,
Lucasps: a quando il superamento del test di Turing? Siamo in ritardo di 5 anni...
-
Ma guarda un po' che bella cosetta:
ho provato a cercare prima "[url=http://www.google.it/search?num=100&hl=it&c2coff=1&q=problem+submit+form+floppy+query&btnG=Cerca&meta=]problem submit form floppy query" e poi "[url=http://www.google.it/search?num=100&hl=it&c2coff=1&q=problem+submit+floppy+form+query&btnG=Cerca&meta=]problem submit floppy form query".
Nel primo caso non mi viene dato alcun suggerimento di ricerca, nel secondo mi si dice "Forse cercavi: problem submit floppy from query".
Direi che c'è una evidente analisi sulle triple (e cioè sulla presenza di soggetti, aggettivi, ecc. e sull'ordine delle parole)che ne dite?
Lucas
ps: non venitemi a chiedere perchè stavo cercando quelle parole!
-
Ciao Lucas e ciao a tutti!
Questo è un 3D BELLISSIMO!!!
Ho appena inserito quello che hai segnalato direttamente nel mio sito che ho creato per fare la mia tesi.
Non so ancora perfettamente su cosa verterà ma si occuperà di web semantico.
Per ora ho il compito di raccogliere piu informazioni possibili sull'uso da parte dei motori di ricerca di ontologie.
Libero è un bel po avanti a parer mio...
Spero tanto che questo 3D continui.Vi linko il sito della mia tesi: www.tesiweb.net
Ciao e complimenti a tutti per questo 3D!
-
Ciao tuonorosso,
se ti serve posso spedirti quell'articolo sull'argomento di cui parlavo due post sopra (devono ancora pubblicarlo perciò tienilo stretto ), è piuttosto lungo e non molto complicato (è una panoramica), perciò sicuramente potrai trovare cose più tecniche qua e là, ma se ne hai bisogno di un pò di materiale per la tesi...
dimmi pure, ciao,
Lucasps: sicuro che l'indirizzo del tuo sito sia giusto?
-
certo certo..manda pure!
se hai msn aggiugnimi
Ciao e grazie.
PS: volendo potremmo tenere il mio sito come punto di raccolta di info se vuoi..
-
Arrivo eh!
Sono stato fuori genova fino a oggi.Ottima idea quella del "punto di ritrovo semantico"!
stasera o domattina ti mando l'articolo, ciauz,
Lucas
-
ottimo...e teniamo alto questo interessante 3D
PS: non ci sono fino a domenica sera cmq
-
inviato all'email in firma!
ciauz,
Lucas
-
ricevuto e risposto..
GRAZIE GRAZIE
-
ehi chat,
ma a noi non ci fate sapere niente?
-
per ora vi posso dire di seguire www.tesiweb.net
-
Ciao Giò,
questo tuo post mi fa ricordare che tempo fa mi avevi chiesto se avevo pronto qualche articolo sul web marketing...
Il problema principale è che il 99,9% degli articoli che ho scritto sono stati pubblicati con cessione del copyright, e, nel contratto, c'è scritto che non posso divulgarli, avendo ceduto ogni diritto economico (l'unico diritto che mi rimane è quello morale di "prodotto di ingegno", in pratica sono sempre costretti a dire che l'articolo l'ho scritto io, anche se il denaro lo prendono loro). Per questo ogni tanto rispondo con post chilometrici, per sostituire eventuali articoli... Poi per Tuonorosso, visto che si tratta della tesi, ho fatto un'eccezione, speriamo non se ne accorga nessuno (e scoprimmo che tuonorosso è un infiltrato della finanza!) .ciauz,
Lucas
-
Capito Lucas,
comunque se ne farai mi raccomando di segnalarceli