• Moderatrice

    Scusa Deborah ma ora non ti seguo. Il secondo url è il nostro, questo non ci piove. Il primo è di Twitter Feed, un software che permette (tramite l'inserimento di un feed) di postare su Twitter. Non credo che siamo i soli ed unici ad usare quello strumento che non richiede conosce SEO e di informatica. Secondo la tua teoria, però, quello strumento è da mettere sotto osservazione. Se è così, però, apri un altro scenario che se permetti esula un po' dal discorso strutturale del nostro sito ma va applicato al software del feed per Twitter e all'indice di Google.


  • User

    No, è generato dal vostro sito dove è stato installato Twitter Feed ma non è stato previsto di non farlo vedere ai motori di ricerca.

    Dovete di fatto, no far vedere le due pagine ai mdr ma solo una.


  • Moderatrice

    Ho inserito pari pari tutti i link degli articoli di oggi (presenti sulla home), eccezion fatta per il tuo esempio di prima non c'è nessun duplicato e meno che io vedo qualcosa di diverso. Questo dimostra che puo' trattarsi di casa eccezionale. Eppure tutti gli articoli presi in esame usano TwitterFeed.


  • Moderatrice

    @collega-deborahdc said:

    No, è generato dal vostro sito dove è stato installato Twitter Feed ma non è stato previsto di non farlo vedere ai motori di ricerca.

    TwitterFeed non un client ma risiede su server terzi. Non è un nostro strumento ma un servizio pubblico e molto ma molto noto. Dalla home di TwiterFeed: oltre 2 milioni di feed.


  • User

    fai come credi.


  • User Attivo

    Questo problema (dei parametri) qua si risolve introducendo il rel=canonical negli articoli
    comunicando quindo qual è l'URL canonica che Google deve seguire


  • Moderatrice

    Aggiornamento delle 17.44 con chiave "Google Chrome il più vulnerabile" modalità più recente. Sono solo 9 i risultati rispetto ai 10 di prima.

    1. risultato non pertinente;
      2: come sopra;
    2. come sopra;
    3. aggregatore che prenda la news dell'unico sito italiano (oltre il nostro) che ha riportato la notizia;
    4. sito italiano come il nostro che ha riportato la notizia;
    5. risultato non pertinente;
    6. nostro risultato proveniente da Google News;
    7. secondo aggregatore che ha copiato ed incollato il sito italiano al quinto posto;
    8. risultato non pertinente.

  • User

    Ho appena parlato con un ex dipendente Google Irlanda facente parte del Team di Matt Cutts.
    Mi dice che:

    • quanto Matt cita qualcosa nel suo blog o twitter significa che è qualcosa di grave (altrimenti non ne parla)

    • e' quasi sicuramente qualcosa riguardante i filtri antispam per le serp

    • quando succedono queste cose è bene sapere che ci va parecchio tempo perchè vengano sistemate da Google

    • E' meglio cercare di capire cosa generi il problema ed adeguarsi

    • mi dice di mandare sicuramente una richiesta di re-inclusione (anche se non sono certo al 100% del motivo della penality)

    • mi dice che da quanto sa ultimamente il focus è molto sulla velocità di caricamento delle pagine e che influiscono molto gli episodi di site down

    In funzione di questo sto cambiando nameservers e dns (non hosting).
    Spero che qualcuno ne capisca qualcosa di più e voglia condividere qui.

    grazie a tutti


  • Moderatrice

    Sulla velocità non punterei neanche una cicca, il nostro sito risulta il 67% più veloce degli altri e ho letto da più parti che influisce per l'1%, sugli altri aspetti farei una riflessione anche se alcune cose, scusami, sono abbastanza scontate...


  • User

    Sono scontate ma sono gli unici dati certi che ho. Parto da questi.

    Sulla velocità non affretterei una risposta così velocemente.
    Considera che google ha sviluppato un apposito tool per misurarla e che nel webmaster central , sezione labs sono presenti informazioni molto dettagliate a riguardo.

    Anche io vedo il tipo di informazione che il sito è più performante della media ma la fluttuazione di performance è abbastanza evidente, sopratutto per un sito così corposo.


  • ModSenior

    <br /><b>Dominio</b>: <br />fullpress dot it<br /><br /><b>Motori</b>: <br />Google<br /><br /><b>Prima indicizzazione o attività</b>: <br />anni fa<br /><br /><b>Cambiamenti effettuati</b>: <br />nessuno<br /><br /><b>Eventi legati ai link</b>: <br />nessuno<br /><br /><b>Sito realizzato con</b>: <br />cms<br /><br /><b>Come ho aumentato la popolarità</b>: <br />nulla<br /><br /><b>Chiavi</b>: <br />tutte<br /><br /><b>Sitemaps</b>: <br />Si<br />


  • Moderatrice

    Aggiornamento delle 23.00 con chiave "Google Chrome il più vulnerabile" modalità più recente. Ancora solo 9 risultati.

    1. aggregatore che prenda la news dell'unico sito italiano (oltre il nostro) che ha riportato la notizia;
      2: risultato non pertinente;
    2. eccoci per la prima volta, la news è presa dalla sezione NEWS che raggruppa tutte le News. Il title e il link è relativo alla sezione e non al singolo articolo;
    3. risultato non pertinente;
    4. risultato non pertinente;
    5. risultato non pertinente;
    6. sito italiano come il nostro che ha riportato la notizia;
    7. risultato non pertinente;
    8. nostro risultato proveniente da Google News.

  • ModSenior

    Ciao FullPress,

    ti suggerirei di fare ricerche usando un ambiente di test sterile, ovvero: usare diversi indirizzi IP, non essere loggati su nessun servizio Google, essersi assicurati di aver svuotato i cookies e qualsiasi cache.

    Al momento ore 1,42 ora italiana vedo...

    Per Google Chrome il più vulnerabile (ricerca senza doppi apici), al 10° risultato vedo il box di Google News che riporta FullPress. FullPress è presente al 28° risultato con questa URL /News/Google-Chrome-il-piu-vulnerabile-nella-classifica-Dirty-Dozen/7-40659-1.html

    Invece per "Google Chrome il più vulnerabile" (ricerca con doppi apici) 3 risultati di cui il 1° è Google News, il 2° FullPress URL News/Google-Chrome-il-piu-vulnerabile-nella-classifica-Dirty-Dozen/7-40659-1.html, il terzo /News/7-1.html .

    Se espando il filtro duplicati cliccando su "ripetere la ricerca includendo i risultati omessi" vedo un altro risultato con i parametri twitterfeed come indicato in precedenza da collega-deborahdc.

    Ultima nota: Google News riporta correttamente l'indicazione 13 ore fa.


  • Moderatore

    Saluto tutti e faccio un in bocca al lupo a FullPress.

    Volevo dire solo: il fatto che twitterfeed appenda quei parametri alla url che twitta è un 'problema noto' ... o almeno, noto agli utilizzatori di Twitterfeed che abbiano cognizioni seo.

    E' un problema 'piccolo', nella maggioranza dei casi: intanto perchè i cms migliori hanno implementato il tag canonical di default (come Wordpress), quindi quelle url parametriche vengono successivamente filtrate in favore della URL vera.

    Se proprio vogliamo dirla tutta TwitterFeed non è il solo tool che crea questo genere di url 'duplicate'... lo fa anche FeedBurner, tanto per parlare del diavolo (che fa le pentole ma non i coperchi, as usual).

    Anche non utilizzando WP quei duplicati spariscono in brevissimo tempo (vengono filtrati al volo).... ma accade che invece a volte questo non succeda, perchè magari il link con i parametri è andato a finire su una pagina ben indicizzata che rischia quindi di tenere in indice (in un indice secondario) anche quelle url più lunghe generate dal tool per esigenze di tracking.

    Ma non è Twitterfeed il problema di FullPress.it, questo è poco ma sicuro.

    L'introduzione del canonical in questo caso è sicuramente stra-consigliata... ma temo che il sito sia comunque stato colpito da quel 'problema di indicizzazione' che Google ha ammesso il 19 ottobre.

    Non capisco invece perchè Fullpress ritenga diverso il fenomeno che a suo avviso è cominciato il 21/22 ottobre.

    Semmai il problema è capire in base a quale fattore alcuni siti vengono indicizzati lentamente e male, dalla fine di ottobre, e altri invece no.


    Personalmente non ho registrato cali nè ritardi, quindi non saprei dire molto su questo particolare episodio.

    Ho delle mie opinioni di lungo periodo sul modo di gestire le strutture di archiviazione dei blog (o assimilabili) da parte di Google... e mi viene sempre da chiedermi se questi filtri più recenti non abbiano come bersaglio l'uso e l'abuso dei 'tag' da parte dei produttori di contenuti.

    L'ipotesi di Alexa - che ne fa una questione di 'settore' (siti d'informazione/siti di download) - mi sembra assai discutibile, sinceramente.

    :ciauz:


  • ModSenior

    Giusto 2 righe riguardo al canonical.... Ho postato qui una URL che al momento dice abbastanza:
    http://www.giorgiotave.it/forum/consigli-seo-e-penalizzazioni/153646-url-penalizzanti-duplicazione-contenuti.html#post818504


  • Moderatrice

    @WWW said:

    Saluto tutti e faccio un in bocca al lupo a FullPress.

    Volevo dire solo: il fatto che twitterfeed appenda quei parametri alla url che twitta è un 'problema noto' ... o almeno, noto agli utilizzatori di Twitterfeed che abbiano cognizioni seo.

    E' un problema 'piccolo', nella maggioranza dei casi: intanto perchè i cms migliori hanno implementato il tag canonical di default (come Wordpress), quindi quelle url parametriche vengono successivamente filtrate in favore della URL vera.

    Se proprio vogliamo dirla tutta TwitterFeed non è il solo tool che crea questo genere di url 'duplicate'... lo fa anche FeedBurner, tanto per parlare del diavolo (che fa le pentole ma non i coperchi, as usual).

    Anche non utilizzando WP quei duplicati spariscono in brevissimo tempo (vengono filtrati al volo).... ma accade che invece a volte questo non succeda, perchè magari il link con i parametri è andato a finire su una pagina ben indicizzata che rischia quindi di tenere in indice (in un indice secondario) anche quelle url più lunghe generate dal tool per esigenze di tracking.

    Ma non è Twitterfeed il problema di FullPress.it, questo è poco ma sicuro.

    L'introduzione del canonical in questo caso è sicuramente stra-consigliata... ma temo che il sito sia comunque stato colpito da quel 'problema di indicizzazione' che Google ha ammesso il 19 ottobre.

    Non capisco invece perchè Fullpress ritenga diverso il fenomeno che a suo avviso è cominciato il 21/22 ottobre.

    Semmai il problema è capire in base a quale fattore alcuni siti vengono indicizzati lentamente e male, dalla fine di ottobre, e altri invece no.


    Personalmente non ho registrato cali nè ritardi, quindi non saprei dire molto su questo particolare episodio.

    Ho delle mie opinioni di lungo periodo sul modo di gestire le strutture di archiviazione dei blog (o assimilabili) da parte di Google... e mi viene sempre da chiedermi se questi filtri più recenti non abbiano come bersaglio l'uso e l'abuso dei 'tag' da parte dei produttori di contenuti.

    L'ipotesi di Alexa - che ne fa una questione di 'settore' (siti d'informazione/siti di download) - mi sembra assai discutibile, sinceramente.

    :ciauz:

    Crepi il lupo WWW, sei molto gentile.
    Sono d'accordo con te che il nostro caso è in qualche modo collegato con la sfiga del 19 ottobre (noi l'abbiamo notato dal 22 ottobre) anche se da più parti e anche in versione ufficiale Google ha dichiarato che il problema è stato risolto. Poichè, invece, il problema a noi non è stato risolto quando dico che per noi non è la stessa cosa mi riferisco che non si è risolto come affermato da più parti (anche in blog che riportano senza verifiche le parole "ufficiali" di Google). Quindi? Quindi, secondo me i momenti sono due: caos dell'indice di Google e conseguenza. Quando riporto quello che scrive Alexa non volevo soffermarmi sull'analisi che fa sui siti peer to peer che ne escono avvantaggiati ma sul crollo di siti che dal 19 ottobre in poi non si sono più ripresi. Non credo, come qualcuno vuol far apparire, che sia un problema di SEO bravo e di informatico capace. Qui il problema ha colpito una quantità enorme di siti, in tutto il mondo, di settori e target completamente differenti. Ho detto al webmaster di inserire il canonical sperando di essere ottimisti anche se non è facile perchè oltre alla vostra gentilissima disponibilità non ho visto in giro (soprattutto in Italia) interrogarsi su cosa sta facendo o cosa ha combinato Google. Sono altrettanto consapevole che per Google noi siamo un semplice numero, morte nostra avanti un altro.


  • Super User

    Aggiungo solo che, con l'ultimo aggiornamento, la query "site:sito.etx a" sembra non funzionare più.

    Quindi, purtroppo, non possiamo più farci affidamento.


  • ModSenior

    Scusami Fullpress ma non sono d'accordo con cosa dici.
    Concordo al 101% con collega-deborahdc.

    E ti segnalo le parole di JohnMu qui (i grassetti sono miei) http://www.google.com/support/forum/p/Webmasters/thread?tid=7908355c3d1637e8&hl=en&start=280

    In general, it's hard for our algorithms to review sites like yours on a post-by-post basis, so we try to look at the bigger picture. If the bigger picture shows issues that we wouldn't expect (such as some duplicated content like that), then that may make it hard for us to treat the rest of the content with as much weight as we would like. If you're aware of those posts being somewhat sub-optimal, then I'd recommend taking steps towards removing them from your site (or at least to block them from being indexed -- if they otherwise provide value to your users).

    Google's algorithms are constantly being worked on, so even if you have not changed anything on your side, it might be that our algorithms' view of parts of your site changes over time. So personally, I would really not fuss too much over the technical issues we had, and instead focus on what you can do on your side to improve the bigger picture of your site.

    I realize that working with user generated content makes things a bit more complicated, or at least it requires creative thinking... I imagine you probably have much more experience and many more ideas around that than I would, so I'm certain you'll find something in that direction 🙂


  • ModSenior

    Riguardo a questa:
    @Karapoto said:

    Aggiungo solo che, con l'ultimo aggiornamento, la query "site:sito.etx a" sembra non funzionare più.

    Quindi, purtroppo, non possiamo più farci affidamento.

    Si ho riverificato quanto indicato da FullPress in un precedente post.
    Ma la sostanza delle cose non cambia: FullPress ha duplicati interni che in un modo o in un altro vanno tolti. Punto. Non ci sono se o ma per tentennare.

    Aggiungo anche e sospetto un cambio algoritmico nel calcolo delle hash del filtro anti-duplicazione come ho twittato stamane.


  • Moderatore

    Facciamo a capirci Fullpress: non è una novità che la comunicazione di Google sia 'per sommi capi'... mentre invece le interpretazioni e le soluzioni - come dice e rimarca mrJinx con le sue citazioni - vanno fatte sito per sito.

    Ora, la citazione ripresa da mrJinx è importante: Google valuta un sito 'nel suo complesso', e molto spesso in base a questa valutazione complessiva adatta le risorse da dedicare ad un determinato dominio.

    Problemi di duplicati? Ok, probabile. Ma magari hai anche un rapporto tra tag e articoli che non va bene... o almeno, non va più bene secondo i nuovi algoritmi che GG usa per indicizzare siti come il tuo.

    Intendo dire una cosa molto semplice: hai ragione a dire che non è il tuo seo o il tuo webmaster che 'ha fatto qualcosa di male', mentre invece hai torto se pensi che proprio un sito come FullPress possa fare a meno di curare - direi *maniacalmente *- i suoi rappporti con Big G, ivi comprendendo anche le sue più recenti idiosincrasie.

    Non vorrei sbagliarmi e non conosco bene il tuo sito, anche se so che è tra i più famosi nel suo settore - ed ha anche 10 anni di storia alle spalle.

    Ma è chiaro che si colloca esattamente in un settore in cui il tema dei 'duplicati' - intendo interi contenuti duplicati - è all'ordine del giorno.

    Sappiamo che i comunicati stampa vengono pubblicati a destra e a manca... dal più piccolo webmaster fino alla più prestigiosa agenzia.

    :rollo:

    Poi se non mi sbaglio avete anche una sezione che aggrega dalla blogosfera (mi sbaglio?).... anche con l'aggregazione si gioca al filo - tra frequenza di scansione e contenuti duplicati con il relativo filtro...

    Insomma, mi sembra chiaro che anche un'apparente fesseria come l'utilizzo o meno del canonical - su un sito di quelle dimensioni - possa incidere parecchio sulle dinamiche di scala. E sulle performance, quindi.

    Il canonical mancante?
    Troppi archivi (tag)?
    Magari un server non sempre in splendida forma? (e il vostro db è ottimizzato?)
    Oppure addirittura una flessione importante nel flusso di link in ingresso?

    Insomma, quello che penso è che proprio nel vostro settore e con il vostro genere di sito potrebbero esserci diversi 'dati di fondo' da tenere sempre sotto controllo.

    Ma proprio per questo è difficile dare delle risposte subito risolutive: devi tentare ugualmente delle soluzioni.

    Come citava MrJinx dalla bocca di J Mu: "curare le prestazioni generali" del sito.

    Voglio dire: non scoraggiarti, assolutamente. Ma non limitarti nemmeno a seguire qualche consiglio trovato qua e là sulla rete: purtroppo siti di grandi dimensioni devono fare affidamento alla propria capacità interna di curare o prevenire eventuali problemi... è perfettamente comprensibile che non ci sia una risposta univoca che vada bene per il tuo sito, mentre questa va cercata testando e limitando ogni possibile frizione.

    Che è poi quello che ti invitiamo a fare (sperando che magari poi tu potrai venire qui a condividere la tua soluzione, naturalmente).

    🙂


    Sul commando site:

    Avevo aperto un 3D mesi fa, ma proprio ieri ho notato una cosa.

    Provate a digitare il classico site: dominio.ext

    Restituisce 'pochi' risultati, almeno in rapporto al sito su cui lo esercitate e rispetto a 'prima'.

    Ok.

    Ma poi andate sulla sidebar di ricerca avanzata che avete sulla sinistra, se siete loggati in google.

    Per la stessa query site:dominio.ext ora premete intervalli di data diversi (" nell'ultimo anno" "nell'ultimo mese" etc etc).

    Ecco che tornano le url che prima sembravano essere state escluse dal comando site:

    Ora la domanda che farei a voi, e proprio in questo interessante 3D, è la seguente: forse possiamo servirci di questi dati 'temporali' restituiti da questo 'nuovo' comando site: per basare le nostre analisi sui siti?

    Naturalmente non conosco l'algo di Google... ma 'sta cosa che ho beccato ieri mi ha mooooolto incuriosito.

    Chissà che non riusciamo a recuperare - in qualche modo nuovo - la funzione di 'controllo' e di 'test' che molti riconoscevamo al comando site: ....

    :mmm: