- Home
- Categorie
- La Community Connect.gt
- Tutto sulla Community
- Siti penalizzati in google, strana scoperta
-
@Morgoth said:
Non sono esperto ma provo a risponderti ugualmente (amgari faccio una figuraccia )
Questa funzione è possibile usando il file robots.txt, sul forum troverai molti post in merito
Grazie davvero Morgoth, ma il robots.txt lo gestisco io e non l'hosting.
A questo proposito, per farvi capire a quale stato di disperazione sono arrivato, pensate che circa 15 giorni fa mi sono deciso ad escludere al solo spider di google circa 3.000 delle 3.200 pagine di cui è composto il sito.
Questo nel dubbio che google ritenesse troppo grande romanoonline ed avesse escluso le due sezioni per questo motivo.
Naturalmente nelle 200 pagine ora accessibili alo spider sono comprese anche quelle delle due directory scomparse.
-
@frapolid said:
Naturalmente mesi fa ho anche creato la sitemap nella speranza che google si accorgesse di quelle pagine, ma nulla da fare.
Sicuro che l'errore non sia prorpio negli url inseriti nella sitemap? Magari qualche carattere strano di troppo aggiunto senza accorgersi...
-
@claudioweb said:
Sicuro che l'errore non sia prorpio negli url inseriti nella sitemap? Magari qualche carattere strano di troppo aggiunto senza accorgersi...
Assolutamente sicuro, eccola!
Qualche lettore ha amici qualificati per rispondere alla mia precedente domanda:
Se io fossi l'hosting che ospita un sito (con server win 2003) potrei attuare un trucchetto del tipo in questione per evitare che lo spider di google (solo lui) indicizzi solo certe sezioni di quel sito?Magari però sono per l'ennesima volta fuori strada per cui chi ha altre idee diverse posti per favore. :doppio:
-
@frapolid said:
Se io fossi l'hosting che ospita un sito (con server win 2003) potrei attuare un trucchetto del tipo in questione per evitare che lo spider di google (solo lui) indicizzi solo certe sezioni di quel sito?
senza che tu te ne possa accorgere? non mi viene in mente nulla...
tornando a quel %c0... boh, ho trovato che in HEX equivale a "é" in francese... ma dubito questo possa aiutare
-
http://en.wikipedia.org/wiki/C0_and_C1_control_codes (posto e basta, io non ci capisco una minghia :D)
-
@must said:
http://en.wikipedia.org/wiki/C0_and_C1_control_codes (posto e basta, io non ci capisco una minghia :D)
Neanche io granché, tuttavia per sicurezza ho controllato l'encoding delle pagine sparite ed è lo stesso di quelle "sane".
Il file global.asa del mio sito invece è piuttosto complesso (il sito ha un forum e soprattutto una chat il cui inserimento ha richiesto molto codice in quel file), può essere lì la causa?
Va tenuto conto però che gli altri motori non hanno problemi e che lo stesso google sembra veder bene la maggior parte del sito.
-
boh, io comunque proverei direttamente a scrivere a loro.
-
@frapolid said:
Una domanda per esperti, se io fossi l'hosting che ospita un sito (con server win 2003) potrei attuare un trucchetto del tipo in questione per evitare che lo spider di google (solo lui) indicizzi solo certe sezioni di quel sito?
ciao
non so su win2k3 / IIS
ma su apache direttamente nell'httpd.conf puoi specificare parametri particolari per le directory
per esempio, condizionalmente all'user agent, puoi fare un redirect verso la home in modo che la directory non esista per google
-
Ok a fare tutte le ipotesi ma io insisto sul bug di Google...
Esempio pagina:
http://www.google.it/search?hl=it&q=www.romanoonline.it%25c0%2Fweb%2Fmusica%2F883.asp+&btnG=Cerca&meta=L'url visualizzato è:
www.romanoonline.it%c0/web/musica/883.asp
Il link effettivo è invece punta all'indirizzo esatto
www.romanoonline.it/web/musica/883.aspLa copia cache linkata è questa non funzionante:
http://64.233.183.104/search?q=cache:lcdD7d6sfC8J:www.romanoonline.it%25c0/web/musica/883.asp+www.romanoonline.it%25c0/web/musica/883.asp&hl=it&gl=it&ct=clnk&cd=1
MA se si leva quel carattere di troppo ci accorgiamo che ce ne un'altra funzionante:
http://64.233.183.104/search?hl=it&q=cache%3AlcdD7d6sfC8J%3Awww.romanoonline.it%2Fweb%2Fmusica%2F883.asp+www.romanoonline.it%25c0%2Fweb%2Fmusica%2F883.asp&btnG=Cerca&lr=Insomma penso proprio che tutto sto casino non sia colpa tua :bho:
Sicuramente ci sarà qualcosa che l'avrà scatenato, ma credo che comunque sia un difetto di Google.
-
tendo anche io a considerare il tutto un problema di google. ma anche se non lo fosse, segnalare a loro il problema potrebbe agevolare la soluzione.
a chi dei due spetta risolverlo
-
Rispondo agli ultimi interventi:
-
ho provato a scrivere a google una decina di volte utilizzando sia il modulo accessibile dalla sitemap , sia gli indirizzi mail [EMAIL="[email protected]"][email protected][/EMAIL] che [EMAIL="[email protected]"][email protected][/EMAIL].
Ho inoltre postato nei gruppi di google.
Fra l'altro ricordo proprio fra le mie domande quella che accennava must: "è un mio problema o un vostro problema?".
Le poche volte che hanno risposto ecco il testo più o meno: "Vai a dare un'occhiata alle nostre linee guida che magari la risposta la trovi lì anche se non abbiamo letto la tua domanda perché siamo troppo occupati in questo periodo".
Chi è in grado di consigliarmi indirizzi mail o strade alternative per farsi ascoltare è ben accetto. -
Chi ritiene che il file global.asa possa determinare un tale casino può riceverlo via mail se desidera studiarlo
Grazie davvero a questo forum che si sta dimostrando il più sensibile nei miei confronti, continuate così per favore è un vero mistero ed è assurdo dover rinunciare a capirci qualcosa.
-