- Home
- Categorie
- Digital Marketing
- Consigli su Penalizzazioni e Test SEO
- Ecco il Mootore di Ricerca
-
Complimenti vivissimi allo staff dell"EMBRIONE" mi aggiungo alla discussione per rimanere aggiornato.
Saluti e ancora complimenti!!!
-
Volevo aggiungere qualche riflessione.
- Una piccola riflessione sul secondo algoritmo, il Tf*IDF.
Questo algoritmo, come già spiegato in precedenza, usa nella formula il parametro D, che è il numero dei documenti totali, quindi cosa succede:
per ogni nuovo documento inserito questo valore D aumenta di 1 unità
quindi per i precedenti documenti BISOGNA RIPETERE IL CALCOLO DEL PESO, inquanto uno dei parametri è cambiato.
Come fare?
Io penso che la soluzione ottimale sia far partire il ricalcolo come se fosse un aggiornamento ad esempio 1 volta a settimana.
-Spam
Questi due algoritmi sia quello dei pesi sempici sia quello Tf*IDF sono sucettibili al keyword spamming, ovvero tante più keyword sono presenti nella pagina tanto più alto sarà il loro peso, non è stata trattata per niente una alternativa che combatta lo spam, questo perchè siamo agli inizi e per ora è un test, quindi VI PREGO NON INDICIZZATA PAGINE CON SPAM.Saluti
Tony.
- Una piccola riflessione sul secondo algoritmo, il Tf*IDF.
-
Il mootore ha dei problemi: guardate il 4 risultato
http://www.giorgiotave.it/forum/mootore/search.php?q=ciao&btn=Cerca+con+Mootore&algo=1
Ha dei problemi nel creare le descrizioni...Una considerazione OT:ma avete intenzione di fare paura a google e agli altri big? State sfornando roba una dopo l'altra (la directory, lo spider...)...
Perchè se è così la questione si fa interessante ma sopratutto divertente!!;)P.S.: divertente non nel senso di idea patetica, ma nel senso sarà divertente vedere come tutti reagiranno, anche se per questo ci vorrà ancora tempo
-
@HaccaH said:
Il mootore ha dei problemi: guardate il 4 risultato
http://www.giorgiotave.it/forum/mootore/search.php?q=ciao&btn=Cerca+con+Mootore&algo=1
Ha dei problemi nel creare le descrizioni...
Si...Antonio ci lavorerà più tardiSegnalate anche altre idee
@HaccaH said:
Una considerazione OT:ma avete intenzione di fare paura a google e agli altri big? State sfornando roba una dopo l'altra (la directory, lo spider...)...
Perchè se è così la questione si fa interessante ma sopratutto divertente!!;)Hai colto molto, ma non siamo "scemi" di pensar di fare concorrenza a nessuno
Vogliamo tre cose ed una l'hai presa: Divertirci, Studiare e Condividere
GT
-
@Giorgiotave said:
Hai colto molto, ma non siamo "scemi" di pensar di fare concorrenza a nessuno
Vogliamo tre cose ed una l'hai presa: Divertirci, Studiare e Condividere
Sicuro, ma sei poi viene fuori anche un bel progetto finalmente italiano, meglio no??
-
e vvaiii!!
...non vi posso lasciare una giorno ....
-
Io vorrei sapere una cosa molto più banale:
si legge Mootore o Mutor(e)?Complimenti ragazzi
-
Altra precisazione, ci sono di sicuro altri errori presenti nel mootore li correggerò un po alla volta tutti, un pò di tempo e pazienza.
-
@HaccaH said:
Sicuro, ma sei poi viene fuori anche un bel progetto finalmente italiano, meglio no??
si si
Finalmente Italiano. Dateci tempo, il progetto GT viene da lontano ed andrà lontano.
@Nicola said:
Io vorrei sapere una cosa molto più banale:
si legge Mootore o Mutor(e)?Complimenti ragazzi
LOL Mootore
Ma è il nome dell'embrione
-
Grandiosi davvero... ma da un motociclista cosa volevate che uscisse se non un lavoro con i fiocchi?
lamps...
ste
-
@nbriani said:
Un terzo algoritmo, oppure sviluppando il secondo, si potrebbe studiare intorno agli studi di paocavo selezionando cluster di keyword nei testi delle pagine e assegnado a quelli un valore maggiore.
Che ne dite?
Infatti, oltre al discorso dei cluster, utilizzando il "principio del reciproco rinforzo", si ottiengono le frasi più semanticamente rilevanti (riassunto, snippet, ecc) di una pagina web e potrebbero essere considerate solo queste (e qualcos'altro...) ai fini dei calcoli.
Vantaggi:
- minor testo da analizzare
- maggiore immunità allo spamming (nella versione successiva a cui sto lavorando)
Svantaggi: - maggiore complessità computazionale
- maggiori risorse HW (cpu/RAM)
inoltre le "top keyword" estratte da una pagina potrebbero essere esposte nei risultati per "guidare" l'utente nei raffinamenti successivi delle ricerche o suggerirgli spunti di approfondimento tramite link a wikipedia, ecc...
-
Ma il sorgente è libero? Si può vedere?
-
@HaccaH said:
Il mootore ha dei problemi: guardate il 4 risultato
http://www.giorgiotave.it/forum/mootore/search.php?q=ciao&btn=Cerca+con+Mootore&algo=1
Ha dei problemi nel creare le descrizioni...ha preso su tutto il title, che in quel sito è lungo come 3 pagine normali
complimenti, puo' essere utile per imparare tante cose
-
@bayle said:
Ma il sorgente è libero? Si può vedere?
Si certo, spetta un attimo, un paio di giorni che facciamo vedere tutto
@robaldo said:
ha preso su tutto il title, che in quel sito è lungo come 3 pagine normali
complimenti, puo' essere utile per imparare tante cose
Si è da chiudere a 100 caratteri o meno, ora vediamo.
Tra un pochino potremo studiare tutti assieme. Più siamo meglio è
Giorgio
-
Aggiustato il bug, qui potete vedere le chiavi cercate
http://www.giorgiotave.it/forum/mootore/ricerche.php
Lo strumento chiavi cercate verrà migliorato parecchio, ho quasi finito di scrivere, forse domani ci saranno sviluppi
Al massimo Dopo Domani
-
bene,
lasciai il progetto tempo fa in quanto sono stato sommerso da lavoro....sono contento che ci sia stata un'evoluzione sia nel primo algoritmo che del secondo...
-
complimenti ragazzi!!!
il motore di ricerca credo che sia uno dei pochi progetti che può portare sempre ad uno sviluppo e studio di nuove tecnologie dato l'enorme lavoro che si può fare sull'analisi dei documenti.
bravi bravi bravi!!!!!!
-
beh...devo assolutamente essere nell'indice!
-
tantissimi complimenti
buon lavoro
sono curioso di sbirciare il codice........e poi sono anche primo con alcune keyword
-
Secondo quale principio con la parola "web" sarei al primo posto???