• User Attivo

    @Argema said:

    come faccio a contare i miei visitatori?
    @Pablo Mollusco said:
    Analytics è tecnicamente affidabile?
    Ciao Argema, ciao Pablo, la risposta alle vostre domande è semplice quanto sconcertante: se vi interessa sapere con precisione assoluta qual'è il numero di visitatori diversi che entra nel tuo sito in un certo lasso di tempo, i tool in commercio (sia software per la LOG analysis sia sistemi di web analytics) non sono in grado di fornire una soluzione ai vostri problemi nè, temo, saranno mai in grado di fornirti questo dato.

    Il concetto stesso di misurazione implica la presenza di un errore nel singolo dato rilevato, non è quindi realistico attendendersi la precisione assoluta dalle misurazioni del canale web, nè in quelle di qualunque altro media.
    Ogni strumento di misura inoltre è affetto da un errore differente rispetto agli altri in quanto, nel caso specifico, utilizza metodi di misurazione diversi (es variazioni nella durata delle sessioni); per questo motivo implementando 10 sistemi di analisi diversi avrai con altissima probabilità 10 dati tra loro non omogenei e non esiste modo di dimostrare quale fra questi sia quello "reale" se non, almeno in parte, raffrontando i dati rilevati con una fonte esterna che ti fornisca dati "certi".

    Ipotizzando un esempio pratico, per verificare il corretto funzionamento di un sistema di web analytics potremmo decidere di confrontare il numero di indirizzi email relativi ad utenti registrati memorizzati in un DB con il numero di registrazioni andate a buon fine sul sito web che ospita il form.
    Pensare che i due dati possano coincidere è errato in quanto anche in questo caso non possiamo escludere errori dovuti a fattori esterni quali la registrazione compiuta da utenti con js disabilitato, eventuali malfunzionamenti del server che ospita il DB, ecc ecc.
    L'unica considerazione che possiamo trarre da questa analisi non è la rilevazione di dati identici a quelli del DB da parte del tool, ma la lettura di dati simili e, nel tempo, soggetti ad un errore più o meno costante (es sempre sottostimati o sempre sovrastimati).

    Il mio consiglio personale è quello di non attendersi verità assolute dagli strumenti in nostro possesso, ma di valutare con attenzione le variazioni dei dati in analisi.
    :ciauz:


  • Community Manager

    Bel post Fuffissima 😉

    @Icelord said:

    Per quanto riguarda i dati del forum di GT bisognerebbe chiedere al boss.

    Non uso Analitycs ed ancora mi sto sistemando per leggere i log 🙂

    Appena posso, mi piacerebbe discuterne, non c'è mistero per i dati sulle Stats di GT 😉

    :ciauz:


  • User

    @Giorgiotave said:

    Bel post Fuffissima 😉

    Non uso Analitycs ed ancora mi sto sistemando per leggere i log 🙂

    Appena posso, mi piacerebbe discuterne, non c'è mistero per i dati sulle Stats di GT 😉

    :ciauz:

    :ciauz:


  • User

    Ciao Fuffissima :), piacere di conoscerti 🙂

    Io ho anche capito che ci può essere un discostamento tra 2 metodi .. ma nel mio caso c'è l'abisso.
    40.000 di Analytics contro 95.000 con i cookies (scadenza 2010, se il sistema già lo vede non lo ridà).

    Potete suggerirmi qualche altro Tool?
    Ah, io i log li leggo .. ma cosa ci ricavo? Ho anche Webalizer .. ma da quello ricavo solo le visite e gli IP, e per giunta le visite sono sfalsate al rialzo dal fatto che durano 30 minuti (dopodichè viene ricontata).
    Non so come dirlo .. ahem .. ma su Webalizer le visite sono state a gennaio 270.000 (primi 30 giorni) ..
    Fate un pò voi .. son come i numeri al lotto 😄

    Mi date una mano? Ve lo chiedo per umana pietà 😄


  • User Attivo

    Humm Argema, non conosco webalizer, potresti provare con [url=http://awstats.sourceforge.net/]Awstat a leggere i log e vedere cosa vien fuori?

    Le differenze che riporti sono davvero abissali e mi pare strano.


  • User

    Io ho letto i miei file log e ho notato differenze consistenti tra GG analytics e i dati derivanti dagli IP.
    Per prima cosa volevo dirvi che sono andato alla ricerca delle ragioni e ho scoperto che nella mia piattaforma di e-commerce ci sono diversi bug nel posizionamento fisico dei codici di GG. Qundi no posso fare un confronto attendibile con i due risultati.

    Alla luce di questa discussione e dei dati emersi mi pongo un problema. Ai clienti in campo SEO a volte facciamo un contratto garantendo un minimo di visite utilizzando come strumento di misurazione proprio Analytics. E' giusto? che sistema posso utilizzare per essere il più corretto possibile?

    sono sempre più convinto che questo metodo di misurazione assomigli molto al sitema Auditel...molto impreciso ma considerato ,mezzo di misurazione "oggettivo" tra clienti e venditori di spazi pubblicitari


  • User

    AWstats non lo volevo usare, è in CGI e i miei server son già abbastanza carichi.
    Comunque il supporto CGI ce l'abbiamo .. potrei installarlo.
    Webalizer è a questo link http://www.mrunix.net/webalizer/

    Si, comunque ho delle differenze imbarazzanti tra vari sistemi di misurazione.
    C'è da dire una cosa, anzi, meno male che me la sono ricordata.
    I log file analizer servono a poco o niente.
    Perchè? Perchè su un sito con aggiornamenti frequanti i vari spider dei motori di ricerca fanno qualche migliaio di visite al giorno.
    Io l'ho visto dalle pagine.
    Ho anche vari metodi di misurazione delle pagine; ebbene, mi sono accorto che i vari spider mi producono migliaia di richieste di pagine al giorno.
    Altre richieste sono fatte da server, .. e su questo non sono sicuro .. ma è roba di spam o attacchi .. o sniffers .. o non so cosa, ma non è roba di utenti, ed anche li sono migliaia di pagine giorno.
    Ho un sistema sul server che mi dice quante pagine sono state richieste. Numero nudo e puro.
    Beh .. se la concessionaria mi da 1.000.000 di pagine, a me ne risultano 1.340.000 .. e se non filtrassi hackers e spiders sarebbero oltre 1.800.000.
    La differenza tra il 1.000.000 della concessionaria ad il 1.300.000 che misuro io è alquanto normale.
    C'è una perdita fisiologica del 20%. Con tutte le concessionarie, anche Adsense.

    Aspetto altre vostre suggestion. Non chiudiamo questo thread.


  • User

    @Fuffissima said:

    Il mio consiglio personale è quello di non attendersi verità assolute dagli strumenti in nostro possesso, ma di valutare con attenzione le variazioni dei dati in analisi.
    :ciauz:

    Non posso che sottoscrivere quanto detto da Fuffissima.

    Di base le statistiche possono servirci per cogliere tendenze e opportunità.
    Per analizzare l'andamento complessivo di un sito e individuare le zone d'ombra...

    Quando le stat ci servono per 'misurare' un investimento pubblicitario, allora è bene utilizzare contemporaneamente diversi sistemi... e in caso di discrepanze tra le rilevazioni di ciascuno di essi con i dati inviateci dal fornitore chiedere delucidazioni direttamente a lui.
    Sarà suo interesse chiarire tutti i possibili dubbi 😉

    :71: Barbara


  • User

    Ciao Barbara .. dici che devo chiedere direttamente allo zio G? :rollo: 😄

    p.s. auguri per il raffreddore 🙂

    Mi sa che faremo un nostro pezzo di codice, sempre basato sui cookies, che penso siano + affidabili. E' vero che alcuni li cancellano (quindi rischio di contarli doppio), ma sono pochi, e inoltre ci sono anche quelli a cui non funzionano (e che non conto proprio).
    Non so .. se avete idee ditele.

    Rispondo per ultimo a Pablo.
    Pablo, quel che dici è molto lontano dalla realtà dei fatti.
    Non è neppure immaginabile che Analytics venga inteso come strumento di validazione del traffico.
    Ce n'è uno solo di organismo del genere, ed è Nielsen.
    Le media agencies guardano Nielsen, Analytics non esiste per loro.
    Validare il traffico è possibile solo con metodi ben diversi (e molto imprecisi) e che non possono essere software installati a discrezione dell'editore (webmaster). Metodi statistici basati su un campione di utenti.
    Non creiamo altre leggende metropolitane intorno a un player come GG. 🙂
    :ciauz:


  • User Attivo

    Salve, mi sottoscrivo alla discussione riportando la mia esperienza. Utilizzo diversi tipi di misure: Analitycs, Webalizer, log a manina del server (ip, pagine, banda ecc per confronto).

    Ebbene noto anche io una discrepanza di circa il 35% tra GA e tutto il resto...a chi credere? Inoltre, ho letto che non considerate Analytics affidabile..ma scusate una volta non era un mega software tra i migliori del settore prima di diventare free? E ancora: google non si gioca parte del suo business sulla conoscenza di dati di traffico esatto?

    A proposito ho chiesto a degli amici in Giappone, a Bruxelles, in america di visualizzare almeno 5 pagine del sito. Di Bruxelles c'è traccia, di Jap e Usa nada....

    Grazie a chi mi illuminerà...


  • User

    @beltipo said:

    Salve, mi sottoscrivo alla discussione riportando la mia esperienza. Utilizzo diversi tipi di misure: Analitycs, Webalizer, log a manina del server (ip, pagine, banda ecc per confronto).

    Ebbene noto anche io una discrepanza di circa il 35% tra GA e tutto il resto...a chi credere? Inoltre, ho letto che non considerate Analytics affidabile..ma scusate una volta non era un mega software tra i migliori del settore prima di diventare free? E ancora: google non si gioca parte del suo business sulla conoscenza di dati di traffico esatto?

    A proposito ho chiesto a degli amici in Giappone, a Bruxelles, in america di visualizzare almeno 5 pagine del sito. Di Bruxelles c'è traccia, di Jap e Usa nada....

    Grazie a chi mi illuminerà...
    Ed io che mi fidavo cecamente...


  • User

    con GG analyst sto monitorando un mio sito (che chiamo A) che mi serve in parte d'appoggio ad un e-commerce.
    Bene ho notato questi risultati:
    il sito A che monitoro viene segnalato con 20 visite e 44 pag visualizzate nell'ultima settimana.
    Mentre nelle statistiche dell'e-commerce questo mio sito A viene segnalato come sorgente di riferimento con 325 visite.

    Le due unità di misura "visite" e "visite" nelle statistiche della sorgente di riferimento sono comparabili?
    Se si come mai questa differenza?


  • User Attivo

    Ciao Pablo,

    da 20 a 325 visite c'è un bell'abisso.
    Sicuro ci sia Analytics in tutte le pagine?


  • User

    Ice .. con me è simile la questione, se ricordi.
    Noi cercheremo di affrontare la questione appena avremo un attimo di tempo. Metteremo un sistema a cookie credo, e se servirà un sistema a javascript.
    Tra 5 sistemi qualche verità dovrà pur venire fuori.


  • User

    @Pablo Mollusco said:

    In questi giorni mi sono accorto di una discrepanza di dati sugli accessi (sul sito e-commerce che sto curando) fornitimi da google analytics (sorgente di riferimento) e alcuni fornitori PPC.

    Ciao Pablo visto che hai parlato di PPC in qualche modo mi sono sentito tirato in causa 🙂
    Te lo dico perchè anche a noi, come Pangora, talvolta contestano i click che dichiariamo nei confronti dei nostri clienti. Questo fondamentalmente perchè ognuno ha il proprio sistema di tracciamento e di misurazione dei dati. Tuttavia c'è di più.

    Come è già stato fatto notare, al click di un qualsiasi prodotto sui nostri portali (es: www.buycentral.it ), il nostro sistema, prima di portare l'utente alla scheda prodotto del cliente, fa un doppio redirect.
    E lo fa via browser e non via server. Il che vuol dire che molti sistemi di statistiche base si perdono l'80% dei nostri accessi.

    Due nostri competitors, ad esempio:

    • K****o utilizza un redirect basato sul server e i referrer è molto più preciso (mi chiedo come facciano a pulire in fattura i click da crawler, ma è un altro discorso);
    • Trovap****i non ha una pagina di redirect (sono sicuramente tracciati meglio di tutti);

    Da parte nostra, il conteggio dei click segue sempre questa prassi:

    • click ripetuto: NON vengono conteggiati quei click che avvengono sulla stessa scheda prodotto da parte dello stesso utente entro 1 minuto dal primo click;

    • l'indirizzo IP non è l'unico parametro che utilizziamo per identificare uno stesso utente ma anche la versione del browser, il sistema operativo, i plug in installati. Queste informazioni aggregate le chiamiamo browser-stamp(o user-agent). Utilizziamo anche queste info per filtrare i doppi click perché spesso gli ISP assegnano comunque IP comuni a differenti utenti.

    Vengono inoltre rimossi tutti i click generati dai dipendenti Pangora e dalle società che lavorano con noi .

    I nostri clienti più evoluti, per essere sicuri del conteggio dei click, hanno tagliato la testa al toro: nei deeplink che ci passano, hanno inserito delle varibili che ci identificano univocamente (es: www.negozio.com/protottoxyz.php?refer=pangora). In questo modo tracciano perfettamente gli accessi perchè le informazioni sul referer che si possono perdere con il doppio redirect di cui ti parlavo, non vanno perdute.

    Spero di esserti stato utile ed avere aggiunto qualcosa in più,

    ciao

    Riccardo Porta
    Sales Dir. Pangora Italia - gruppo Lycos Europe


  • User Attivo

    Confermo quanto detto da Riccardo: ho da poco preso una campgna con un big spender di telefonia e i click hanno un suffisso refer=unimagazine. Ho notato che la stessa campagna in altri siti, utilizza lo stesso identico sistema.

    Credo attualmente sia una delle migliori soluzioni per l'inserzionista...


  • User Attivo

    Interessante questa soluzione del "dichiarare" il referrer con un parametro che poi effettivamente non viene utilizzato dalle pagine, ma serve solo per tracciare.

    Cmq, il problema dei numeri che non tornano mai c'è sempre e sempre ci sarà.
    A mio avviso i numeri più precisi in assoluto li danno solo le analisi dei log. Li c'è l'attività reale del server. Qualsiasi cosa viene inviata ad un utente genera per forza una riga di log e da li non si scappa.
    Accessi dai siti esterni compresi.


  • User

    @Icelord said:

    Interessante questa soluzione del "dichiarare" il referrer con un parametro che poi effettivamente non viene utilizzato dalle pagine, ma serve solo per tracciare.

    Cmq, il problema dei numeri che non tornano mai c'è sempre e sempre ci sarà.
    A mio avviso i numeri più precisi in assoluto li danno solo le analisi dei log. Li c'è l'attività reale del server. Qualsiasi cosa viene inviata ad un utente genera per forza una riga di log e da li non si scappa.
    Accessi dai siti esterni compresi.

    Ice, solo una domanda. Si può capire dai log gli utenti unici? Io questa cosa non l'ho proprio capita, forse perchè non ho la piena conoscenza ti tutto ciò che si possa loggare (so che i log sono "personalizzabili").
    Grazie 🙂


  • User

    bhe quando ho scritto il codice per il mio sistema, ho approfondito molte cose. bisogna capire quale strategia e' stata usata per individuare un visitarore unico e come questo viene monitorato nel tempo.
    (ossia si puo' essere unici nella giornata ma non nella settimana per esempio)
    una tecnica sovrana non esiste ovviamente.

    per capire se un visitatore e' unico ci si puo' basare sulla unicità degli ip nell'arco della giornata

    ci puo' basare sulla creazione delle sessioni

    ed i risultati sono ovviamente molto differenti

    una tecnica che vi consiglio per avere una stima di attendibilità e' la seguente:

    se il vostro sito ha beccato x visite ed i visitatori unici sono y .. basta fare la media di pagine viste per visitatore unico... VU=x/y ora se il vostro sito contiene 5 pagine e dalla media risulta che VU e' molto maggiore.. bhe qualcosa non quadra e per avere conferma potete osservare il tempo di permanenza su ogni pagina e gli accessi per pagina.


  • User Attivo

    @Argema said:

    Ice, solo una domanda. Si può capire dai log gli utenti unici? Io questa cosa non l'ho proprio capita, forse perchè non ho la piena conoscenza ti tutto ciò che si possa loggare (so che i log sono "personalizzabili").
    Grazie 🙂

    Allora, dai log i dati che si possono ottenere sono tantissimi. Ecco uno schema:

    Data ed Ora
    IP del client
    Username (se l'utente è autenticato con i sistemi previsti dal sistema operativo)
    Tempo impiegato per soddisfare la richiesta
    Useragent (che si porta dietro anche il sistema operativo)
    Byte inviati
    Byte ricevuti (non serve quasi a nulla)
    Referer (ed eventuale query string)
    URI richiesta
    URI Query (sempre richiesta)
    Cookie

    Ci sono anche altri dati, ma sono poco utili. Per avere un esempio completo vi pubblico qualche riga di log.

    
    #Fields: date time s-sitename s-ip cs-method cs-uri-stem cs-uri-query s-port cs-username c-ip cs(User-Agent) cs(Cookie) cs(Referer) sc-status sc-substatus sc-win32-status sc-bytes cs-bytes 
    
    2007-02-23 12:51:34 W3SVC1833263418 88.149.157.134 GET /index.php - 80 - xx.xx.xxx.171 Mozilla/5.0+(Windows;+U;+Windows+NT+5.1;+it;+rv:1.8.1.1)+Gecko/20061204+Firefox/2.0.0.1 __utmz=99245389.1170693909.9.3.utmccn=(referral)|utmcsr=giorgiotave.it|utmcct=/forum/software-per-e-commerce/28387-errato-acquisto-pessimo-e-commerce-aiuto.html|utmcmd=referral;+__utma=99245389.980414501.1164982057.1170338090.1170693909.9 http://www.haloscan.com/comments/sbrana/rw_unique_entry_id_95_page0/ 200 0 0 45722 744
    
    
    

    Facendo l'anatomia del dato pubblicato:
    Data ed orario: 2007-02-23 12:51:34
    Nome del sito, riferimento interno di IIS: W3SVC1833263418
    IP dell'host (il server): 88.149.157.134
    Motodo utilizzato: GET (vuol dire che è una richiesta di pagina)
    Pagina richiesta: /index.php
    Query fatta: - (Nessuna)
    Porta del server: 80
    Username: - (nessuno, sarebbe utente anonimo)
    Ip del client: xx.xx.xxx.171
    Browser+sistema operativo+altro: Mozilla/5.0+(Windows;+U;+Windows+NT+5.1;+it;+rv:1.8.1.1)+Gecko/20061204+Firefox/2.0.0.1
    Cookie dell'utente (poi ci tornerò su): __utmz=99245389.1170693909.9.3.utmccn=(referral)|utmcsr=giorgiotave.it|utmcct=/forum/software-per-e-commerce/28387-errato-acquisto-pessimo-e-commerce-aiuto.html|utmcmd=referral;+__utma=99245389.980414501.1164982057.1170338090.1170693909.9
    Referer (sito di provenienza): http://www.haloscan.com/comments/sbrana/rw_unique_entry_id_95_page0/
    Status: 200 (vuol dire che òa pagina èstata servita correttamente
    Substato e stato win32: 0 (non saprei)
    Byte trasmessi: 45722 (la pagina è di 44,65 Kbyte circa)
    Byte ricevuti: 744

    Vorrei farvi notare il Cookie. In questo caso, facendo ricerche, ho visto che quello li è un cookie di Urchin, quindi google analytics, che ci da molte informazioni addizionali, ma che non tutti i programmi di log sanno elaborare.
    Per sempio scopriamo che il nostro utente era passato prima ancora dal forum di GT, poi non so gli altri numeri a cosa servano.

    Per tornare alla domanda di Argema, gli utenti unici vengono misurati in maniera precisa o quanto meno più precisa, se si utilizza un programma di statistiche web che è in grado di lasciare un cookie univoco all'utente, come fa per esempio webtrends o anche Urchin e quindi google analytics.
    In questo caso il cookie viene memorizzato nel log e può essere elaborato. Non tiene conto nel calcolo degli utenti unici il numero di IP proprio perchè non è un dato affidabile, sia per via degli IP variabili delle connessioni, sia per il fatto che spesso dietro un unico IP pubblico ci sono decine o centinaia di client. Pensate ad un'azienda con tanti dipendenti oppure a Fastweb che ha una rete su IP privati per i propri clienti.

    I sistemi di analisi statistiche dei siti on-line utilizzano proprio il cookie come elemento discriminante. Facendo richiamare una loro immagine o script dalla vostra pagina, infatti, non fanno altro che crearsi un log molto simile a quello generato dal vostro server. Poi questi dati vengono elaborati e presentati all'utente on-line. Questo per lo meno è quello che fanno quelli più grossi, tipo analytics.

    Questo perchè se facessero il log delle pagine viste cont utti i dati relativi interrogando ogni volta un DB per inserire i dati relativi alla visita ci sarebbe un traffico allucinante che sarebbe quasi impossibile per un database soddisfarlo. Introducendo anche rallentamenti sensibili nella navigazione degli utenti.

    La via più efficace spesso è quella più semplice.

    Aggiungo un'altra cosa, i log sono personalizzabili nel senso che puoi decidere quali campi (di quelli riportati in alto) loggare e quali no. Puoi addirituttura scrivere degli script che per ogni visita vanno a popolarti dei campi in più (detti custom) nel log file, ma poi è un casino andarli ad analizzare perchè dovresti modificare anche il programma di reportistica.
    Per esempio una volta abbiamo provato a metter dentro il log un dato personalizzato, che era il nome dell'utente loggato tramite la nostra applicazione web. Era un e-commerce. Per analizzarlo avevamo modificato awstats, ma poi alla fine abbiamo deciso di rinunciare ed analizzare questo dato (l'utente loggato) in altro modo sfruttando l'inserimento in una tabella apposta di questi dati ed incrociandoli con altro.

    Ciao 🙂