- Home
- Categorie
- La Community Connect.gt
- Tutto sulla Community
- Data di inserimento nell'indice di Google
-
@m4rc0 said:
Domanda secca:
E' possibile, tramite query su Google o altro tool, sapere da quanto una pagina è presente nell'indice?Ciao m4rc0,
che io sappia no, conoscerai senz'altro archive.org, ma non riporta la presenza nel DB
-
confermo quanto scritto da Giorgio, non è possibile
-
Forse lo ho trovato:
inserisci come query il tuo sito qui:
http://web.archive.org/collections/web.html
Che dite?
-
Sempre con questo tool:
guardate come si presentava google nel 1998
http://web.archive.org/web/19981202230410/http://www.google.com/
-
@saayd said:
Forse lo ho trovato:
inserisci come query il tuo sito qui:
http://web.archive.org/collections/web.html
Che dite?
Questo tool, se non vado male, si basa sul ranking di Alexa... giusto?
-
Non lo so...
Ma che dici? Non è interessante?
-
@saayd said:
Forse lo ho trovato:
inserisci come query il tuo sito qui:
http://web.archive.org/collections/web.html
Che dite?
Grazie ma purtroppo non va bene.
E' un servizio di Alexa che di tanto in tanto salva alcuni siti, per avere uno storico di internet, ma è del tutto scollegato con l'indice di Google.
Mi sa che non c'è soluzione.
Grazie comunque a tutti per l'interessamento.
-
@m4rc0 said:
Domanda secca:
Risposta secca, visto che vado di fretta.
E' possibile, tramite query su Google o altro tool, sapere da quanto una pagina è presente nell'indice?
Sì, ma non con una singola query.
Usando le API e l'ormai caduto in disuso operatore daterange, puoi restringere i risultati della ricerca ad uno specifico intervallo: http://www.google.com/apis/reference.html
L'idea è quella di fare query multiple specificando intervalli sempre minori (un binary search andrebbe benone) fino a quando non si individua la data in cui la pagina è stata indicizzata da Google.
Ovviamente questo processo dovrebbe essere automatizzato da un piccolo script.
(ok, non è venuta fuori tanto secca, ma non ho trattato diversi altri particolari che lascio approfondire a voi )
-
:re:
Quindi
daterange:<start_date>-<end date>
un binary search andrebbe benone
E' vero, uno script che effettua la ricerca binaria è la soluzione migliore. Per chi non ha voglia, tempo e 'capa' di fare lo script ecco alcune date di riferimento. Giusto per sapere almeno l'anno di pubblicazione.
1° gennaio 2006 - 2453737
1° gennaio 2005 - 2453372
1° gennaio 2004 - 2453006
1° gennaio 2003 - 2452641
1° gennaio 2002 - 2452276
1° gennaio 2001 - 2451911
1° gennaio 2000 - 2451545
1° gennaio 1999 - 2451180
1° gennaio 1998 - 2450815Quindi per procedere in modo binario
la prima ricerca è (dal 2006 al 2002)
daterange:2452276-2453737
se c'è (si trova dal 2006 as 2004)
daterange:2453006-2453737
altrimenti (dal 2000 al 2002)
daterange:2451545-2452276
e così via.
Alla fine per l'anno di publicazione ci vogliono 3 query
4 per il semestre
5 per il trimestre
per arrivare al giorno preciso
6 per 45 giorni
7 per 23 giorni
8 per 12 giorni
9 per 6 giorni
10 per 3 giorniQuindi 11-12 interrogazioni.
-
Grazie per le informazioni, davvero uniche