• User

    Pertinenza parole all'interno della pagina?

    Ultimamente all'uni ho avuto modo di studiare un po' i principali sistemi di ranking di G., la sua matrice stocastica e altre amenita' annesse. Una cosa di cui ho vagamente compreso e' la possibilita' che G. usi, affiancato al normale sistema di ranking, anche una specie di DHT, una Hash table distribuita simile, per certi versi, a quella usata da kademlia, ma che sia su piu' livelli e in grado, per dirla in modo semplice, di rilevare il grado di pertinenza di una parola rispetto ad un'altra parola data.
    Tento di spiegarmi meglio. Mettiamo che ho una pagina dove dentro ci sono solo 5 parole. Google riuscirebbe a trovare un grado di pertinenza totale assegnando un valore per l'intera pagina in modo tale che se sto cercando "Auto" una sequenza di parole all'interno della pagina del tipo:

    macchina motore auto cambio sgommare

    abbia un valore piu grande di una sequenza tipo

    Fagiano mela auto castello pasta

    Come sarebbe giusto che sia. Sarebbe interessante sapere se, nei fatti, la cosa esiste veramente..

    PS: scusatemi i tecnicismi :fumato:


  • Community Manager

    Ciao Cesco e Benvenuto 🙂

    @ilCesco said:

    ... anche una specie di DHT, una Hash table distribuita simile, per certi versi, a quella usata da kademlia,...

    Ti chiederei di approfondire questo argomento, DHT, con termini molto tecnici quasi da enciclopedia in modo sia da inserirlo qua

    http://www.giorgiotave.it/wikigt/os/DHT

    [url=http://www.giorgiotave.it/wikigt/index.php?title=DHT&action=edit]Ecco, se vuoi scrivi anche qua

    sia per farci studiare per bene 😎

    @ilCesco said:

    macchina motore auto cambio sgommare

    abbia un valore piu grande di una sequenza tipo

    Fagiano mela auto castello pasta

    Come sarebbe giusto che sia. Sarebbe interessante sapere se, nei fatti, la cosa esiste veramente..

    Per questo possiamo fare un bel test, nel nostro [url=http://www.giorgiotave.it/forum/viewforum.php?f=18]laboratorio.

    Questo dominio www.progettoseo.it è per fare test, quindi se vuoi crea due pagine e inviamele a infoQUELLAgiorgiotave.it che lo facciamo al volo 🙂

    SICCOME HAI SCRITTO:

    Ultimamente all'uni ho avuto modo di studiare

    Perchè non porti a conoscenza dei tuoi amici l'esistenza di questo forum per portare le vostre idee e studiare insieme?

    Giorgio


  • Super User

    Esiste e viene usato per diversi scopi.
    Prova ad usare questo Strumento per le parole chiave AdWords di Google.
    https://adwords.google.com/select/KeywordSandbox


  • Super User

    Praticamente tutte le principali forme di DHT si basano su una funzione per il calcolo della distanza tra due "chiavi" (in questo caso keyword, ma il concetto può ricoprire altri significati).

    Il calcolo di questa distanza è necessario a capire in quale nodo va a finire una keyword. Le keyword che appartengono agli stessi nodi possiedono caratteristiche simili.

    Ma quali caratteristiche vengono prese in considerazione per calcolare una distanza? Questo dipende tutto dalla funzione scelta dal motore di ricerca.

    Penso che tutti i principali motori di ricerca usino una simile tecnica, perché tutti hanno esigenze di decentralizzare i dati e creare una struttura scalabile, cose che il ricorso ai DHT aiuta ad implementare.

    Di prove sul campo non credo che ne siano state fatte, finora. Ma la ragione principale penso sia il fatto che comportamenti come quelli da te evidenziati (attribuzione di valori più alti per keyword correlate) sono già stati osservati da più di un SEO.

    Faccio notare che provare che un motore dia più peso ai testi che contengono keyword correlate non dimostra l'utilizzo di un DHT, perché esistono comunque altre tecniche (di tipo semantico) che possono produrre gli stessi risultati.


  • User

    Verissimo quello che ha detto lowLevel, inoltre, ripensandoci bene, l'utilizzo da parte di G. di una hash table per verificare il grado di pertinenza e' quasi scontata; come ha detto claudio esiste gia' alla luce del sole ed e' il motore che sta sotto ad AdSense, e che probabilemente e' lo stesso usato per caratterizzare le indicizzazioni sul motore di ricerca, sarebbero poco furbi a non usarlo..
    Poi un'altra precisazione: io ho parlato di DHT un pochino impropriamente.. in questo caso di Distributed non c'e' nulla, la cosa e' completamente centralizzata.

    Una prova comunque si potrebbe fare, basterebbe mettere due index.htm con stesso nome in due cartelle (cartella1 e cartella2) stesso title senza metatag e inserire in uno 10 parole correlate e nell'altro 10 parole a casaccio. L'unico problema e' che poi sarebbero talmente in basso nelle serp che sarebbe difficile recuperarle e valutarne i risultati, anche prendendo come parola "centrale" una di uso molto poco comune.. (comunque si potrebbe provare con.. non so.. xerigrafia ad esempio)
    Sul fatto che esistano tecniche ti topo semantico sono un po' dubbioso; non del fatto che esistano e' chiaro, ma piuttosto sulla loro efficacia rispetto all'utilizzo di una tabella di hash. E' piu facile che le caratteristiche che vengono prese in considerazione siano anche di carattere frequenziale. (come si vede anche dal link che ha dato claudio)

    :ciauz:


  • Community Manager

    Ciao Cesco,

    per i test usiamo o parole inesistenti (e qui che semantica usiamo??) oppure il site:www.sito.it CHIAVE

    Facciamo sto test?