• ModSenior

    Brevetto Microsoft: riconoscere blocchi rilevanti nelle pagine

    Microsoft ha brevettato un sistema per identificare l'importanza dei blocchi delle pagine web (contenuto, navigazione, parti pubblicitarie, header, footer, etc etc).

    Il brevetto è qui

    La notizia e' su seobythesea.com/?=p=1049.


  • ModSenior

    In breve l'algoritmo di Microsoft analizza tramite le funzionalita' del DOM una pagina web.

    La pagina viene sezionata in blocchi con lo scopo di identificare quale sia l'argomento principale della pagina, ovvero di "cosa parla" la pagina.

    L'algoritmo e' così in grado di capire quale blocco della pagina web è più importante in funzione della query di ricerca.

    Il metodo prevede prima l'acquisizione di informazioni su diversi blocchi e la raccolta delle indicazioni dell'utente in base all'importanza del blocco principale.

    L'algoritmo classifica i singoli blocchi e confrontandoli determina quindi l'importanza di ogni blocco sempre relativamente all'argomento principale della pagina pagina.

    Vengono utilizzate per la classificazione caratteristiche proprie della pagina (spaziali, del contenuto, dei link, delle immagini) ma anche informazioni tratte dall'interazione utente.

    Tra le caratteristiche spaziali ci sono la dimensione o la posizione del blocco.

    Tra le caratteristiche di contenuto vengono indicate nel brevetto il numero di link o di parole dentro al blocco, ma possono essere anche relative alle dimensioni e al numero delle immagini del blocco, il numero di link e il numero di parole di ogni link del blocc, il numero e le dimensioni dei campi delle form.

    Inoltre alcune caratteristiche in fase di elaborazione possono essere normalizzate come ad esempio il numero totale di link, di parole del testo rispetto al numero totale di parole presenti in tutti i blocchi della pagina web.

    Dell'interazione utente l'algoritmo analizza quando l'utente evidenzia i blocchi sulla pagina.

    L'importanza e la rilevanza del blocco vengono sempre determinate in base a quello che l'utente ritiene importante ("blocks that users think are important").

    Una volta acquisita la misura della rilevanza questa puo' essere usata per classificare e ordinare blocchi o gruppi di blocchi, calconandone i rispettivi punteggi di rilevanza sempre a partire dal blocco più importante della pagina sempre riguardo all'utente.

    Per device come telefonini e smartphones dove lo spazio dello schermo a disposizione è ridotto l'algoritmo può aggiustare, tramite il browser, l'output omettendo blocchi o scegliendo di mostrare il blocco principale.