• Bannato Super User

    La lista dei termini complementari è sicuramente un valido punto di partenza !!
    🙂


  • Super User

    Credo che i passaggi importanti di questo concetto siano:

    In un modello vettoriale, l'espanzione avviene sommando (algebricamente) al vettore della query iniziale i vettori dei documenti estrapolati con la prima ricerca.

    Esistono vari modiper effettuare la somma. A volte è una somma, altre volte una media, ecc.

    Tutto dipende da quale tecnica viene usata dal motore per espandere le query.

    Non si conosce quindi *quale *espansione o come il MDR la applichi.

    ...qui non mi ci ritrovo...a me pare che i termini li SOTTRAGGA dalla ricerca invece di aggiungerli...sbaglio?
    e perchè lo fa? se io utente cerco HOTEL ROMA perchè il mdr dovrebbe togliere la key hotel?
    Tentando di sviluppare l'esempio dell'espansione della query di mamilu su Hotel Roma;
    -" il MDR prende la richiesta hotel Roma e la espande, aggiungendovi con parametri tutti suoi altri termini correlati, come Giorgio ci ha mostrato su con vendita computer.

    Cioè il MDR. con tecniche conosciute solo a lui, parte dalla query *hotel * e la espande aggiungendovi termini a sua discrezione.

    Facendo il percorso inverso possiamo scoprire questi termini:
    Digitiamo **hotel ** e vediamo la risposta di 505 milioni; i termini hotel in neretto... ma anche altri.

    E allora togliamo hotel dalla query [-hotel] e scopriamo che anche senza nessun temine hotel il MDR ci restituisce 106 milioni di pagine mostrandoci in neretto INN -accommodation -lodging

    E' evidente che quei termini il motore, in quel caso, quel giorno [e chissà cos'altro] considera espansioni della query Hotel 😄

    Rifacendo la ricerca togliendo una ad una quelle key, vediamo l'importanza che il MDR ha attribuito ad ogni word che ha inserito nell'espansione della query Hotel

    Rileggiamo:

    ~hotel 505.000.000
    ~hotel -hotel 142.000.000
    ~hotel -hotel -INN 106.000.000
    ~hotel -hotel -INN -accommodation 38.400.000
    ~hotel -hotel -INN -accommodation -lodging non ha prodotto risultati in nessun documento.,

    :ciauz:


  • Bannato Super User

    Ne deriva alla fine una serp "abbastanza limitata" che sarebbe opportuno analizzare per scoprire in maniera "relativamente semplice" la ragione per cui i siti restati in serp dopo la scrematura sono restati li !

    Essi teoricamente dovrebbero avere [condizionale d'obbligo] i termini che fanno la differenza... 🙂


  • Super User

    Ne deriva alla fine una serp "abbastanza limitata" che sarebbe opportuno analizzare per scoprire in maniera "relativamente semplice" la ragione per cui i siti restati in serp dopo la scrematura sono restati li !

    ~hotel -hotel -INN -accommodation -lodging non ha prodotto risultati in nessun documento.,

    Query hotel, il MDR mostra un risultato che include altri termini e togliendoli uno ad uno il risultato è zero, non ne restano lì.

    Finchè la serp mostra risultati significa che un ulteriore termine, frutto dell'espansione è presente.

    Nella fase intermedia, cioè dopo aver tolto il primo o il secondo dei termini frutto dell'espansione, quella serp limitata non si presta ad analisi di sorta [relativamente all'espansione] in quanto non conosciamo il MDR che tecnica usi per quell'espansione della query.

    Ci è però possibile estrapolare quei termini :ciaosai:


  • Community Manager

    @mr yak said:

    qui non mi ci ritrovo...a me pare che i termini li SOTTRAGGA dalla ricerca invece di aggiungerli...sbaglio?
    e perchè lo fa? se io utente cerco HOTEL ROMA perchè il mdr dovrebbe togliere la key hotel?

    Mr Yak,

    siamo noi che li sottraiamo alla query per vederli tutti 🙂

    Ne deriva alla fine una serp "abbastanza limitata" che sarebbe opportuno analizzare per scoprire in maniera "relativamente semplice" la ragione per cui i siti restati in serp dopo la scrematura sono restati li !

    Non è limitata, quella è solo l'espansione lato-utente 😉


  • User Attivo

    secondo me stiamo parlando di qualcosa di primordiale

    come si nota dalla query http://www.google.it/search?q=vendita+computer
    rimangono saldamente in alto i siti che almeno hanno le key nel titolo

    attualmente i fattori che google valuta sono altri, secondo me, e riguardano il peso che l'algoritmo assegna al sito in generale (per questo è nata la sandbox o filtri simili)

    questo dipende dal grosso problema dello spam che google ha dovuto combattere...

    ho letto cmq di cambiamenti nel senso di una ricerca semantica... credo che tutti i motori stiano cercando soluzioni per adottare algoritmi su base neurale... in questo caso vedo bene il discorso di giorgio è solo pero' una linea che i mdr stanno seguendo per migliorare le serp

    credo anche che sia vero che non è importante la kdensity della pagina in generale quanto quella del sito in generale... nel senso che mi pare che google valuti non più la singola pagina ma tutte le pagine indicizzate di un dominio (in questo senso forse l'espansione potrebbe essere utile)


  • Community Manager

    @j0sh said:

    come si nota dalla query http://www.google.it/search?q=vendita+computer
    rimangono saldamente in alto i siti che almeno hanno le key nel titolo

    Non mi sembra che tutti e dieci i domini hanno le key nel titolo.

    Solo un 60%

    vendita computer è diversa da vendita e anche da computer 😉


  • User Attivo

    @Giorgiotave said:

    Non mi sembra che tutti e dieci i domini hanno le key nel titolo.

    Solo un 60%

    vendita computer è diversa da vendita e anche da computer 😉

    allora non si spiega... secondo la logica dell'espansione... perchè io sia in prima pagina con http://www.google.it/search?q=carnevale+di+venezia (dgmag.it)


  • Community Manager

    @j0sh said:

    allora non si spiega... secondo la logica dell'espansione... perchè io sia in prima pagina con http://www.google.it/search?q=carnevale+di+venezia (dgmag.it)

    Hai presentato un articolo che se fosse stato fatto in un sito a tema sarebbe apparso nelle prime tre posizioni.

    Io non ci vedo niente di strano :mmm:

    L'espansione della query è uno dei modi di avvicinarci ai motori, ma sono così complicati che ci sono altri mille fattori.

    Basare lo studio su uno di essi è folle. L'espansione è molto importante 😉

    @ mr yak

    Devi mischiare quel sistema ed il sandbox di Google e poi il buon senso.

    Devi conosce l'argomento e sapere dove si trova il Colosseo, altrimenti che senso ha? 😉


  • User Attivo

    @Giorgiotave said:

    L'espansione della query è uno dei modi di avvicinarci ai motori, ma sono così complicati che ci sono altri mille fattori.

    Basare lo studio su uno di essi è folle. L'espansione è molto importante 😉

    secondo me è uno dei tanti fattori, appunto, ma attualmente non cosi' importante... a pesare di più sono altri, almeno per ora 🙂


  • Community Manager

    @j0sh said:

    secondo me è uno dei tanti fattori, appunto, ma attualmente non cosi' importante... a pesare di più sono altri, almeno per ora 🙂

    Questo non è vero del tutto.

    In alcuni casi questa può aiutare molto. Per esempio nei siti nuovi, usando l'espansione si ottengono buoni risultati.

    Con i siti navigati è facile posizionare e non sai perchè ti ritrovi primo, o meglio lo sai che sei popolare.

    Inoltre l'epansionde della query è molto utile per creare sezioni nuove nei siti ed ampliare i temi, rafforzando il valore del dominio.

    La si sta sottovalutando troppo, IMHO 😉


  • User Attivo

    @Giorgiotave said:

    La si sta sottovalutando troppo, IMHO 😉

    IMHO sarà più importante in futuro... pero', anche se da punti di vista diversi, diciamo la stessa cosa... cominciamo a ragionare in questo senso 🙂


  • Bannato Super User

    Vorrei chiarire quello che volevo trasmettervi che probabilmente strampalatamente ha creato anziche fare chiarezza molta confusione.

    Io mi regolo nel seguente modo...

    Poniamo il caso che voglia cercare i termini utilizzati da gg per fare l'espansione della query sulla keyword Paperopoli 🙂

    Prima escludo tutti i termini che sicuramente, vuoi per conoscenza, vuoi per altri fattori sono certo che gg considera

    Paperone
    Paperino
    Paperina
    Banda Bassotti
    Qui quo qua
    Nonna papera
    Archimede

    A questo punto [dando per scontato quanto scritto sopra] , nei siti restanti dovrò cercare quelli che non ho utilizzato ma che GG invece considera ! Se come risultato finale avrò invece 0, teoricamente dovrebbero essere quelli che ho indicato!
    Lo so è un ragionimento contorto, però lo ritengo attendibile, non credete ?

    :ciauz:


  • Super User

    visto che questa cosa dell'espansione mi incuriosiva e volevo capirci di + (come yak) ho fatto qualche prova..

    devo dire che per es con hotel a firenze il discorso riportato da andrea funziona.. si trovano molti termini: inn, accommodation, tourism, lodging, .. prima di arrivare a non ha prodotto risultati in nessun documento

    pero' se provo con altre keyword non mi capacito molto di come ragioni...
    ad es ho provato con

    ~viaggi -viaggi -voli non ha prodotto risultati in nessun documento

    possibile che non aggiunga altri termini rilevanti? che dia per scontato che la parola più legata e significativa per i viaggi siano i voli?
    quindi forse un viaggio in nave, treno, pullmann è davvero poco rilevante?

    e in inglese?
    ho provato prima in italiano:
    ~toscana -toscana -firenze -livorno -lucca -tuscany non ha prodotto risultati in nessun documento (interessante scoprire che lucca e livorno contino più di siena e arezzo!)

    ma nell'inglese..
    ~tuscany -tuscany - non ha prodotto risultati in nessun documento.

    che senso ha?

    scusami giorgio se le mie domande ti possono sembrare fuori luogo. ho capito a livello teorico il ragionamento semantico.. ma nel pratico ho ancora difficoltà :mmm:


  • Super User

    Vorrei poter scrivere molto di più sull'argomento, ma il tempo è tiranno.

    Risposta lampo: non confondete l'espansione esplicita (quella che l'utente chiede con l'operatore "~") con l'espansione implicita, operata da Google per conto suo, a monte.

    L'operatore "~" non può fornire indicazioni precise su quali termini Google utilizza per espandere implicitamente una query.

    Google espande le query per conto suo, con termini che sa solo lui.

    L'operatore "~" è tutta un'altra storia. E' comunque sfruttabile per capire qualcosa in più, ma non sufficiente per sapere quali termini Google realmente usa per espandere le query.


  • User Attivo

    @LowLevel said:

    L'operatore "~"

    questo operatore non lo conoscevo, dove l'avete trovato?

    grazie, scusate l'ignoranza


  • Super User

    o meglio Low.... con quali caratteri ascii lo scrivo con la tastiera... (copia e incolla e scomodo :D)


  • Bannato Super User

    @Rinzi said:

    o meglio Low.... con quali caratteri ascii lo scrivo con la tastiera... (copia e incolla e scomodo :D)

    Tenendo premuto ALT digita 0126 sul tastierino numerico.

    con il portatile dipende da come è configurata la tastiera.

    :ciauz:


  • Super User

    grazie Emmebar... 🙂


  • Super User

    @nelli said:

    ho provato prima in italiano:
    ~toscana -toscana -firenze -livorno -lucca -tuscany non ha prodotto risultati in nessun documento (interessante scoprire che lucca e livorno contino più di siena e arezzo!)

    ma nell'inglese..
    ~tuscany -tuscany - non ha prodotto risultati in nessun documento.

    che senso ha?
    Difficile dirlo.
    Certo è, come ha detto Low, che questo è un'altro dei casi in cui si rischia di fare confusione fra quello che il motore di ricerca evidenzia nei risultati e quello che usa per ordinarli.

    Il fatto di evidenziare alcune parole nelle pagine dei risultati della query con la tilde (quello che Low chiama "espansione esplicita") può essere semplicemente frutto di studi di usabilità o chissà che altro ed usare criteri anche molto diversi da una espansione della query effettuata a monte (e a noi non visibile, "implicita" quindi) ed usata per la selezione e/o l'ordinamento dei documenti.

    Quest'ultima può essere effettuata in più di un modo, per esempio (e molto a grandi linee, perchè meglio non so fare :D):

    Pseudo feedback - aggiungendo alla query originale parte del contenuto dei documenti "top ranked" (ritenuti attinenti e quindi contenenti termini correlati) e poi ordinando nuovamente i risultati.

    Co-occorrenza delle keywords - Valutando quali siano nell'intero indice del motore i termini significativi che più frequentemente coesistono con la query.

    Oppure utilizzando sistemi complessi che valutano relazioni semantiche, non dimentichiamoci che Adsense usa un sistema del genere, sviluppato da Applied Semantics, acquistata all'uopo da Google.

    Esistono anche sistemi probabilistici e probabilmente molto altro, ma sono sicuro che appena avrà un pò di tempo Low scriverà uno dei suoi post imperdibili a riguardo 🙂