• Bannato User Attivo

    Siti stranieri nelle Serp italiane

    Ho cercato su google la parola chiave "Eva Longoria". Ho ristretto sulle pagine in lingia italiana.

    Tutto sballato. Siti in inglese, russo, francese. Un mare di wikipedia in tutti i domini possibili sul terzo livello, di tutte le lingue.

    Naturalmente ho usato questo pretesto per segnalarvi il fatto.

    Su quale criterio google stabilisce che una pagina è "utile" per una data lingua. Come fa a stabilire la sua lingua ?

    Potrei comprendere per esempio un "italian.imdb.com" (che poi manco in italiano è scritto, e rappresenta una vile forma di marketing e di italiano ha solo il richiamo "italian") perché è in inglese e quindi suscettibile di familiarita con la popolazione media italiana. Ma il Polacco (sarà per via di Papa Wojtyla)?

    Veramente, sapreste darmi una interpretazione? Su Yahoo e live la ricerca localizzata per lingua, funziona decisamente meglio


  • Moderatore

    il criterio è semplice....

    Google legge il testo della pagina, estrapola le parole e guarda nel suo dizionario....alla fine computa una percentuale per ogni lingua a seconda del numero di parole di quella determinata lingua trovate nel documento....

    evidentemente questo tipo di matching si presta a tirar fuori più soluzioni....per esempio un documento italiano che parla di web e marketing userà pure alcune parole inglesi ( web e marketing sono due di queste )....alla fine Google arriverà alla conclusione che il documento matcha per esempio all'92.4% l'italiano, al 7.6% l'inglese....

    chiaramente per SERP dove ci sono pochi documenti validi per la lingua che si sta cercando questo implica che quel 7.6% può far emergere un sito in inglese....

    chiaramente questo è un discorso molto semplificato, nella realtà del web un documento produce matching almeno per 3-4 lingue diverse, i forum che vengono spammati per esempio si trovona con testi in cinese, russo e così via e sommando il tutto vengono fuori le SERP che hai visto


  • Bannato User Attivo

    Certo, non ho problemi a condividere la tua tesi. Ma per l'appunto una percentuale di testo bassisima non può fare la differenza.

    Tuttavia nel caso che ho menzionato qua parliamo di siti completamete stranieri con lingue esattamente "non italiane". Ripeto è troppo strano, considerato che su gli altri mdr questo problema non è così evidente.


  • Moderatore

    @Cineasta said:

    Certo, non ho problemi a condividere la tua tesi. Ma per l'appunto una percentuale di testo bassisima non può fare la differenza.

    Tuttavia nel caso che ho menzionato qua parliamo di siti completamete stranieri con lingue esattamente "non italiane". Ripeto è troppo strano, considerato che su gli altri mdr questo problema non è così evidente.

    il fatto che una pagina web all'occhio umano risulta in inglese non vuol dire che lo sia ancora per il motore....

    i termini web, marketing, pizza, business, solo per citarne alcuni fanno ormai parte del vocabolario di più lingue diverse....il motore di ricerca quando vede "pizza" non può sapere se è il "pizza italiano" o il "pizza inglese"....

    ergo se trova pizza aumenterà lo score per l'italiano ma anche per l'inglese....ovviamente se le parole italiane sono la maggioranza vince l'italiano....

    il punto è che questo è uno dei fattori del ranking....in assenza di documenti forti in italiano è probabile che appaiano documenti inglesi o francesi o tedeschi

    in quella SERP ci sono documenti italiani in testa, spamengine soprattutto....questo ci fa capire che di documenti autoritativi per quella query non ce ne sono ed ecco perchè emergono quelli in altre lingue.....Google non attua una separazione netta per lingua, nel senso che non dice su Google.it solo documenti italiani, ma la lingua è solo uno dei 100 e più elementi che determinano il punteggio complessivo di un documento per una data query


  • Super User

    @Cineasta said:

    Certo, non ho problemi a condividere la tua tesi. Ma per l'appunto una percentuale di testo bassisima non può fare la differenza.

    Tuttavia nel caso che ho menzionato qua parliamo di siti completamete stranieri con lingue esattamente "non italiane". Ripeto è troppo strano, considerato che su gli altri mdr questo problema non è così evidente.
    ho notato anch'io un aumento abnorme di siti stranieri per parole chiave assolutamente straniere...

    forse anche questa "anomalia" rientra in quella fluttuazione delle serp che sta colpendo svariati siti indipendentemente dalla loro importanza, anzianità, pr ecc..

    speriamo che il tutto rientri al più presto in una sua normalità, dove qualche sito straniero "scappato" al filtro di google ci sta, ma il troppo, come sempre, stroppia! :bho:


  • Moderatore

    il punto è che il Phraserank sta cambiando radicalmente il volto delle SERP...

    il fatto che i siti stranieri stiano salendo vuol dire che in generale i siti italiani non fanno un buon lavoro di ottimizzazione e posizionamento


  • Super User

    @paolino said:

    il punto è che il Phraserank sta cambiando radicalmente il volto delle SERP...

    il fatto che i siti stranieri stiano salendo vuol dire che in generale i siti italiani non fanno un buon lavoro di ottimizzazione e posizionamento
    ... quanto è vero ... purtroppo 😞


  • Moderatore

    @sughero3 said:

    ... quanto è vero ... purtroppo 😞

    in generale è un passo in avanti molto significativo....in pratica significherà dover scrivere contenuti molto più tematici e semanticamente correlati al topic....il problema è che allo stato attuale esistono buone tecniche per creare contenuti automaticamente che i motori finiranno per prendere per oro colato


  • Bannato User Attivo

    Quindi questo praserank non è di alcuna utilità per chi usa google come motore di ricerca. Perché se io utente sono alla ricerca di pagine in italiano, perché glielo dico espressamente, e lui mi da risultati frutto di sue speculaziuni, più o meno fondate, che non trovano riscontro con la realtà dei fatti ... No? Cioè io voglio pagine in italiano e lui me le da in polacco. Capirei se non specificassi la lingua. Scusate, ma è un non senso. Parlo da utente di mdr


  • Moderatore

    @Cineasta said:

    Quindi questo praserank non è di alcuna utilità per chi usa google come motore di ricerca. Perché se io utente sono alla ricerca di pagine in italiano, perché glielo dico espressamente, e lui mi da risultati frutto di sue speculaziuni, più o meno fondate, che non trovano riscontro con la realtà dei fatti ... No? Cioè io voglio pagine in italiano e lui me le da in polacco. Capirei se non specificassi la lingua. Scusate, ma è un non senso. Parlo da utente di mdr

    no forse mi sono spiegato male....il Phraserank analizza tutti i documenti in rete ed estrapola frasi e frasi co-occorrenti legate ad un determinato topic...

    questo sistema aumenta la precisione del sistema di ranking....per esempio se dico "gratis" mi posso riferire a mille cose diverse, se dico "libri gratis" allora scendo più nello specifico

    prima il motore ragionava basandosi su parole singole come appunto "gratis" oggi ragiona su concetti più estesi "libri gratis" "affitto case per vacanza", ecc.....

    il problema è che i siti italiani non hanno i fattori on e off-page adeguati per scavalcare quelli stranieri.....o meglio ce ne sono, per esempio giorgiotave.it, html.it ma la maggior parte sono siti in "bilico" che vengono facilmente schiacciati da quelli stranieri....

    per il futuro bisognerà lavorare sodo per riuscire a riguadagnare le posizioni perse.....tuttavia ripeto che questo discorso accade per key poco competitive....per esempio "Eva Longoria" mostra chiaramente che almeno in Italia non ci sono siti autoritativi che ne parlano, infatti nei primi posti troviamo un bello spamengine


  • Community Manager

    Ipotesi:

    • Test in atto

    • siti italiani che linkano un sacco di siti stranieri

    • chiave relativamente nuova ed in fase di studio

    • datacenter non "puliti" (nel senso che c'è stato un forte aggiornamento e magari ora c'è qualcosa che non va)

    Le butto li, così velocemente.


  • Bannato User Attivo

    Si però, non sono un tecnico. Ma pongo ancora l'accento sul dato che non sto eseguendo ricerche sparse sul web, inteso come babele disaggregata di pagine multilingue. Io interrogo google dicendoli: "Mi servono le migliori pagine di Eva Longoria in Italiano, fai te scegli le più utili, ma che siano in italiano!". Altrimenti togliessero il pulsantino radio "pagine in Italiano" che non serve più.

    Se come dici tu Paolino, e ti ringrazio per avermi offerto un interessantissimo punto di vista tecnico, la lingua di una pagina non è più una costante, ma un variabile influenzabile, secondo me che sono un modesto utente, allora ciò non pone a favore del mdr perché si tratta di una aberrazione grande come una casa.

    Le cose vanno spiegate sempre in maniera semplice, quando occorrono paroloni allora significa che qualche cosa non va per il verso giusto. Possiamo cercare il motivo tecnologico che sottende al fenomeno, ma il punto è che il mdr non sa indiduare correttamente la lingua di una pagina o meglio ancora di un sito.

    Guardate, interroghiamo il Ask (potreste obiettare: "certo hai scelto il migliore mdr oggi in circolazione", ma andiamo avanti per cercare di spiegarvi meglio il mio punto di vista), con l'opzione "Pagine in italiano" (no provenienti dall'Italia): http://it.ask.com/web?q=eva+longoria&qsrc=1&o=0&l=dir&dm=lang


  • Moderatore

    chiaramente ogni motore implementa la propria strategia...

    per esempio si può decidere di usare un dizionario fisso ma questo impedisce al motore di individuare rapidamente neologismi, abbreviazioni e quant'altro oggi va di moda

    l'altro metodo sarebbe quello di ritenere che la lingua di un documento è quella che ottiene il punteggio maggiore tra tutti i match possibili, ma questo impedirebbe che un documento multi-lingua possa comparire in versioni nazionali diverse del motore

    infine Google in particolare individua la lingua anche analizzando la lingua "top matching" degli anchor link e quindi è influenzabile in questo senso.....

    è una strategia che in piccolo è fallimentare ma sui grandi paga....pensa al web con centinaia di miliardi di documenti....su una massa talmente sterminata di documenti riuscire ad influenzare il motore significa come dicono gli americani "play the big numbers", cioè disporre di centinaia di milioni di link e contenuti in modo da far cambiare idea a Google....decisamente complesso.....

    poi c'è il fatto che Google tra dirti che una query restituisce 0 risultati e visualizzarti risultati non attinenti ( nella fattispecie in altre lingue ), sceglie la seconda strategia

    la loro strategia è di diminuire i filtri applicati alle SERP man mano che le query diventano meno importante....in pratica Google sa che la query "Eva Longoria" non è strategicamente importante, vuoi perchè la gente la cerca poco, vuoi perchè la gente clicca sui link che portano a pagine inglesi, francesi, polacche senza lamentarsi.....Google misura il feedback degli utenti sulle SERP e anche in base a questo stabilisce quali query e settori considerare di serie B


  • Bannato User Attivo

    @paolino: condivido la tua osservazione.

    La tua spiegazione abastanza accademica però non giustifica il comportamento di google, di ask e gli altri. È solo, purtroppo lo dico, un tuo punto di vista che suona come verosimile, convincente, carico di buon senso. Nessuno conosce le politiche, le scelte, le strategie, gli algoritmi di Google e degli altri mdr. Fare un raffronto sulle loro intenzioni è quanto mai un azzardo che non ci porta da nessuna parte, se vogliamo analizzare meglio i fatti.

    Il punto però è che google con la sua "black box" restituisce in quelle condizioni risultati sconcertanti. Nella parola chiave in questione, fino a poco tempo fa ci sono stati decine di siti italiani ottimi sotto tutti i profili. Mi spiego
    non il sitino fatto su digilander and company. Oggi c'è solo la babele e qualche spam engine di troppo.

    Sul pagare sui grandi numeri, non lo so. Ma io questi grandi numeri non posso ficcarci il naso. L'unica cosa certa, in tema di grandi numeri, sono i tanti utenti sbigottiti che non riescono più a trovare quello che cercano.

    L'unica vera obiezione: "Che togliessero quel pulsantino. Farebbero una favore alla semantica, alla logica, al buon senso, e non prenderebbero a calci le lingue"


  • Moderatore

    @Cineasta said:

    @paolino: condivido la tua osservazione.

    L'unica obiezione: "Che togliessero quel pulsantino. Farebbero una favore alla semantica, alla logica, al buon senso, e non prenderebbero a calci le lingue"

    quel pulsante una funzione ce l'ha....normalmente un sito straniero autoritativo compare nelle SERP, selezionando quell'opzione quel sito scompare.....ovviamente l'opzione non funziona "in tempo di guerra", cioè quando non ci sono altre pagine italiane con un ranking decente da visualizzare

    in condizioni normali e in SERP discretamente competitive il pulsantino in questione fa un buon lavoro....gli altri motori, invece, filtrano a monte in base alla lingua, in particolare Yahoo....

    tecnicamente la faccenda è questa, io al loro posto farei come Yahoo