• User Attivo

    Information retrieval..e poi?

    Son rimasto molto colpito dal post di Low sull'importanza dello studio dell'information retrieval http://www.giorgiotave.it/forum/viewtopic.php?t=6145 per chiunque voglia andare oltre le apparenze nello studio e pratica del SEO.

    Stanotte mi son sparato pagine e pagine di informazioni matematiche, algebriche, classificazioni vettoriali e non dei documenti e compagnia bella. Le informazioni son decisamente interessanti, ma anche complicate da digerire. Quello che ora, però, noto, è che ho un'infarinatura delle tecniche di information retrieval che mi fa meglio comprendere come ragionano i motori di ricerca in termini matematici, ma mi manca comunque il fulcro del ragionamento del motore di ricerca, ovvero come esso stesso stabilisca le connessioni semantiche tra pagine, documenti, testi.

    Ovvero, mi spiego, spero meglio. Un conto è capire (o convincersi di aver capito) quello che è il concetto teorico che sta alla base della classificazione dei documenti, altro è invece individuare i principi su cui vanno ad operare le toerizzazioni di cui sopra. Nel senso, posso capire che un testo XY viene analizzato alla radice, spezzettato nelle sue componenti chiave, soppesato nel valore dei termini ma altro è invece conoscere il COME viene deciso che un determinato documento o termine è connesso ad un altro. L'IR ci fornisce la teoria del ragionamento, ma le basi e concetti che lo governano? Ovvero le associazioni, connessioni, etc..su che si basano?


  • Community Manager

    Ciao seogoogle,

    Ti consiglio anche questo topic
    http://www.giorgiotave.it/forum/viewtopic.php?t=6560

    secondo il mio parere le correlazioni tra i termini sono date da alcuni fattori quali:

    • Thesauri
    • Ricerche degli utenti
    • Adwords

    :ciauz:


  • Super User

    Uno degli strumenti che i motori di ricerca possono usare per determinare collegamenti semantici fra termini e compilare dei tesauri è l'indice di co-occorrenza dei termini stessi nel corpo dei documenti indicizzati.

    In parole molto povere: maggiore è il numero di documenti all'interno dell'indice del motore nel quale due termini compaiono e sono "accoppiati" (il documento viene restituito per una ricerca in modo EXACT), maggiore è il loro grado di correlazione.

    http://www.miislita.com/semantics/c-index-1.html


  • User Attivo

    @beke said:

    In parole molto povere: maggiore è il numero di documenti all'interno dell'indice del motore nel quale due termini compaiono e sono "accoppiati" (il documento viene restituito per una ricerca in modo EXACT), maggiore è il loro grado di correlazione.

    l

    Grazie e decisamente interessante questo spunto. Insomma un ottimo metodo per gli stessi motori di ricerca di continuamente ampliare, aggiornare e modificare il proprio Thesauri