• User Attivo

    googlebot mi scannerizza 24h/24h

    googlebot mi passa tutti i giorni **quasi **24/24 fonte php-stats
    (ci sono migliaia di pagine da indicizzare)
    ma non mi indicizza più di 130 -140 pagine, dipende dai giorni 😢 😢 😢 😢 😢 😢
    la situazione è così da almeno 2 settimane, non capisco.
    perchè le visita tutte e per così tanto tempo se poi non le mette nel suo indice :bho: :bho: :bho:

    vorrei anche chiedervi come disabilitare tramite il file robots.txt le pagine php con parametri.
    qualcuno ha idea di come fare?
    non ho piacere che le visiti, perchè sono copie di pagine .html (mod rewrite)
    ciao e grazie :ciauz:


  • User Attivo

    mi son dimenticato di presentarmi, sono luca, piacere 🙂
    sono nuovo per voi, ma voi non per me, vi seguo da molto, ma non avevo voglia di registrarmi 😉 😉


  • Community Manager

    Ciao luca,

    piacere mio 🙂

    Credo che dovresti aumentare la popolarità del sito con scambi link mirati a siti di qualità 🙂

    Per escludere al bot le pagine con paramentri dovresti escludere la pagina madre, ma non sono sicuro di questo 🙂


  • User Attivo

    piacere mio giorgio.
    di link ne ho un po' son pr3
    ma ho capito il mistero 😢 😢 era si il bot di google, ma adsense :arrabbiato:

    beh, si se escludo la pagina che rimanda alle pagine con i parametri, funziona sicuramente, però non posso farlo perchè si tratterebbe di disabilitare index.php :fumato:
    hummm oppure intendi di disabilitare la pagina che può prendere i parametri?

    grazie cmq del consiglio

    qualcuno ha mai provato a fare disallow:/pippo.php* ?
    può funzionare?


  • User

    sul mio sito in firma di suonerie ho più o meno 50.000 pagine nei giorni tra il 12 e il 18 agosto il buon googlebot se le è spiluccate tutte con spiderizazione 24/24 ora se ne spilucca qualche centinaio al giorno.
    le pagine indicizzate con il comando site:nomesito pero sono solo 249.
    e per quanto riguarda il posizionamento nessun risultato

    devo attendere ancora per vedere tutte le pagine indicizzate oppure mrG mostra solo le pagine che vuole e secondo quale criterio?


  • Super User

    ma queste pagine sono di contenuti originali o contenuti gia' presenti in rete (leggi: duplicati)?


  • User

    le pagine sono generate dall'archivio delle suonerie di mediaplazza.
    ora il sito non è raggiungibile perchè ho cambiato l'IP puoi trovarlo qui:
    216.22.48.61
    ogni pagina cambia solo nel titolo e nel nome del prodotto.
    per la struttura del sito mi sono ispirato a siti ben posizionati.


  • Super User

    non mi intendo di suonerie, ma cosa significa: che il testo presente sul tuo sito e' gia' presente su un altro (o piu') sito?


  • Super User

    @bartender said:

    devo attendere ancora per vedere tutte le pagine indicizzate oppure mrG mostra solo le pagine che vuole e secondo quale criterio?

    Secondo il criterio dell'album di figurine Panini: non c'è spazio per i doppioni.

    Né copie di altri siti né, all'interno dello stesso sito, pagine troppo simili tra loro.

    per la struttura del sito mi sono ispirato a siti ben posizionati.

    Google non premierà facilmente l'ennesimo sito che non offre nulla di nuovo. O diversifichi, o la strada sarà in salita.


  • User

    @must said:

    non mi intendo di suonerie, ma cosa significa: che il testo presente sul tuo sito e' gia' presente su un altro (o piu') sito?

    no il testo è uguale per ogni pagina per singola suoneria o logo ecc.

    se fai un salto all'ip 216.22.48.61 ti rendi conto di quello che scrivo.


  • Super User

    ok, le varie pagine del tuo sito sono uguali tra loro.

    ma sono uguali anche ad un altro sito (tipo quello che hai citato prima)?


  • User

    @LowLevel said:

    Google non premierà facilmente l'ennesimo sito che non offre nulla di nuovo. O diversifichi, o la strada sarà in salita.

    dici che non dovrei ispirarmi(copiare) la struttura delle directory di altri siti ben posizionati?

    vorrei riuscire a posizionarmi bene per key phrase del tipo "suoneria titolo" "suoneria cantante titolo".


  • Super User

    dici che non dovrei ispirarmi(copiare) la struttura delle directory di altri siti ben posizionati?

    Dico che non devi copiare né quella, né qualunque altra cosa: testi, link, titoli, descrizioni. Niente. Se scegli una struttura di directory, lo devi fare perché sei consapevole che è una buona struttura, non perché l'hai visto fare ad altri e hai deciso di emularli.

    Sei entrato in un settore dove esistono migliaia di siti identici al tuo e finché non darai a Google un buon motivo per scegliere proprio il tuo sito, identico agli altri e per giunta arrivato da poco, avrai vita dura.

    Per questo ti dicevo di diversificare. Google ti giudicherà in base a quanto di diverso offri rispetto agli altri siti, non in base a quanto c'è di uguale con gli altri.

    L'alternativa è quella di riuscire ad ottenere una popolarità superiore agli altri siti. Ma non è facile nemmeno questo.


  • User

    @must said:

    ok, le varie pagine del tuo sito sono uguali tra loro.

    ma sono uguali anche ad un altro sito (tipo quello che hai citato prima)?
    no non sono uguali ad altri siti e cambiano tra loro per il tag title e i tag h ma i testi sono uguali.
    l'archivio delle suonerie è un feed xml della società di cui sono rivenditore.
    le pagine vengono generate da uno scriptino in php per ogni prodotto (suoneria, logo ecc.) crea una pagina.
    ho creato varie directory per le varie categorie:
    suonerie polifoniche, suonerie nokia ecc.
    dove c'è l'elenco dei prodotti disponibili ed un menu delle sottocategorie esempio suonerie polifoniche cinema, suonerie polifoniche top 100 ecc.
    queste pagine vengono aggiornate in automatico con le variazioni del feed e creano le pagine del singolo prodotto.
    come dicevo prima gbot se le è lette tutte ma ne ha indicizzate solo 249 e il posizionamento è inesistente.


  • User

    @LowLevel said:

    dici che non dovrei ispirarmi(copiare) la struttura delle directory di altri siti ben posizionati?

    Dico che non devi copiare né quella, né qualunque altra cosa: testi, link, titoli, descrizioni. Niente. Se scegli una struttura di directory, lo devi fare perché sei consapevole che è una buona struttura, non perché l'hai visto fare ad altri e hai deciso di emularli.

    Sei entrato in un settore dove esistono migliaia di siti identici al tuo e finché non darai a Google un buon motivo per scegliere proprio il tuo sito, identico agli altri e per giunta arrivato da poco, avrai vita dura.

    Per questo ti dicevo di diversificare. Google ti giudicherà in base a quanto di diverso offri rispetto agli altri siti, non in base a quanto c'è di uguale con gli altri.

    L'alternativa è quella di riuscire ad ottenere una popolarità superiore agli altri siti. Ma non è facile nemmeno questo.

    ho usato il verbo ispirare proprio perchè la struttura logica delle directory mi sembra buona per quello che ho letto sul posizionamento.

    per quello che riguarda la popolarità penso che ti riferisci al PR...
    spero di riuscire a portare l'attuale PR3 almeno a 4 o meglio ancora 5 anche se la vedo dura.

    ora ho cambiato l'IP e credo che ne comprero un paio e cambiero anche il dns.

    per quanto riguarda le pagine della singola suoneria ho in mente un paio di cose.

    credi che l'inserimento dell'iframe di mediaplazza possa essere penalizzante?

    dovrei diversificare i testi per ogni pagina suoneria?


  • Super User

    @bartender said:

    no non sono uguali ad altri siti e cambiano tra loro per il tag title e i tag h ma i testi sono uguali.

    quanto basta perche' siano contenuti duplicati, eh...