• Super User

    @ArkaneFactors said:

    ...Infatti, il tuo amico se l'è dimenticato. :lol:

    Scusa?


  • Super User

    Puoi sempre spiegarmi meglio il la tua proposta del 401..


  • Super User

    @Serp said:

    Scusa?

    @Serp said:

    Il punto è che la persona si è dimenticata di porre in atto i necessari accorgimenti correttivi allo scadere del tempo.


  • Super User

    Si ho capito che ti diverte, vorrei capire però in dettaglio la tua controproposta...


  • Super User

    @Serp said:

    Puoi sempre spiegarmi meglio il la tua proposta del 401..

    404 (Not Found), non 401. 🙂

    Penso sia il secondo modo migliore dopo robots.txt per impedire l'indicizzazione di una pagina. Anzi no, è il primo. 🙂


  • Super User

    @ArkaneFactors said:

    404 (Not Found), non 401. 🙂

    Penso sia il secondo modo migliore dopo robots.txt per impedire l'indicizzazione di una pagina. Anzi no, è il primo. 🙂

    Non ho dubbi in merito. Vorrei però comprendere come tu creda di inserire i link necessari per lo scambio (ricordi il problema in apertura del tread?) e renderli disponibili ai visitatori...


  • Super User

    @Serp said:

    Non ho dubbi in merito. Vorrei però comprendere come tu creda di inserire i link necessari per lo scambio (ricordi il problema in apertura del tread?) e renderli disponibili ai visitatori...
    La vedi [url=http://fattori-arcani.awardspace.com/ciao.php]questa pagina? Bene, quella pagina restituisce HTTP status code 404 (Not Found), e non verrà mai indicizzata dai motori di ricerca.

    Sorgente:

    <?php header&#40;"HTTP/1.1 404 Not Found"&#41;; ?> 
    <html><head><title>Ciao Serp!</title></head><body><h1>Ciao Serp! :-&#41;</h1></body></html>
    

    Output:

    HTTP/1.1 404
    Date&#58; Thu, 13 Apr 2006 22&#58;32&#58;09 GMT
    Server&#58; Apache
    Connection&#58; close
    Transfer-Encoding&#58; chunked
    Content-Type&#58; text/html
    
    5a
     
    <html><head><title>Ciao Serp!</title></head><body><h1>Ciao Serp! &#58;-&#41;</h1></body></html>
    
    0
    
    

  • Super User

    Infatti, è un trucco molto pericoloso da usare contro Google.


  • Super User

    My opinion...
    ormai il rel=nofollow lo guardano tutti... il robots.txt un po' meno...
    Io farei una directory 'partners', 'amici' o quello che è, e la dedicherei agli scambi link, poi proteggerei la directory dagli occhi indiscreti degli spider con un bel robots.txt...

    Certo, non potrò fare scambio link indiscriminato home-home (ma non lo farei comunque) e non posso farmi linkare quella directory, ma qualche link in più lo posso raccattare.

    Se poi l'altro webmaster mi becca..."Ooops!"
    E metto in atto la tecnica "Serp" di rimozione dell'Url da Google per 6 mesi

    ps: @arkane: le motivazioni autorevoli sulla quadrilaterazione di scambio link sono in pagina precedente 😄

    Ooops,
    Stuart


  • Super User

    @Serp said:

    Infatti, è un trucco molto pericoloso da usare contro Google.
    Ne dubito. Una pagina del genere per qualsiasi motore di ricerca è indistinguibile da una custom 404 error page. Anzi, è, di fatto, una custom 404 error page. 🙂 Se così non è secondo te, dicci perché.

    PS: non è un trucco. 🙂


  • Super User

    @Stuart said:

    ps: @arkane: le motivazioni autorevoli sulla quadrilaterazione di scambio link sono in pagina precedente 😄
    La mia domanda era come fa Google, secondo te, a capire al volo che una quadrangolazione è uno scambio link. E' una domanda banale?


  • Super User

    @ArkaneFactors said:

    PS: non è un trucco. 🙂
    Ah no?...
    Se non esistesse Google (o un qualsiasi motore di ricerca) che utilizzo pratico avrebbe?

    ps: non è male però!...;)

    Cordialmente,
    Stuart


  • Super User

    @Stuart said:

    Ah no?...
    Se non esistesse Google (o un qualsiasi motore di ricerca) che utilizzo pratico avrebbe?
    Una custom 404 error page. Presente? 🙂

    ps: non è male però!...;)
    Oh, grazie.


  • Super User

    @Stuart said:

    ps: @arkane: le motivazioni autorevoli sulla quadrilaterazione di scambio link sono in pagina precedente 😄
    'azzo, non avevo visto il tuo post. Scusa.


  • Super User

    @ArkaneFactors said:

    ...Se così non è secondo te, dicci perché.
    PS: non è un trucco. 🙂

    Di sicuro fa questo:

    • Controlla che il titolo della pagina contenga "404" e l'intestazione HTTP abbia status 404. (test falso=allarme)
    • Richiede dal tuo server un file nominato in maniera random (Esempio: 1f5d1s1s4145fd5.htm)
      Così ottiene molte informazioni necessarie per certificare a se, la bonta o disonestà della pagina di errore.

  • Super User

    @Stuart said:

    http://www.motoricerca.info/news/news-245.html
    Pagina che tra l'altro hai citato anche te in un thread sul Pagerank qui su GT.

    Rilevare algoritmicamente scambi di link con uno schema leggermente più complesso del A->B->A pare non sia particolarmente arduo.
    Sì, sono d'accordo con questa interpretazione. Avevo letto l'intervista a Vigna (ovviamente), ma quel passaggio dev'essermi sfuggito. Ti ringrazio per avermelo segnalato, era esattamente la risposta che cercavo. 🙂

    @Stuart said:

    Non conoscevo quei programmi fino a quando non li hai linkati, e sai che non parlo di cose che non conosco (più o meno) a fondo.
    ps: il secondo sito, tra quelli da te proposti ha uno strano PR=0 (ma non è bannato)
    L'idea di fondo non è malaccio, tu hai usato questi servizi?
    Sì, li uso tutti i giorni. Scherzo. 😄
    Nemmeno io li conoscevo finché non sono capitato per caso sul primo dei due (il secondo l'ho trovato cercando "non reciprocal link exchange" -- una specie di ossimoro-- su Google). L'ho provato per sfizio su un sito a perdere (più che altro per vedere come funzionava essendo in PHP) ma l'ho rimosso quasi subito perché veniva fuori solo Phentermine Phentermine Viagra Viagra. 🙂
    Secondo me avran vita breve (lo pensavo prima, e lo penso ancora di più dopo dopo aver letto la risposta di Vigna). Strano in effetti quel PR0 sulla home di nxlinks, l'ho notato anch'io. Eppure la pagina è nella cache, e le altre hanno PR. Boh. Ho sonno.


  • Super User

    @ArkaneFactors said:

    'azzo, non avevo visto il tuo post. Scusa.
    Don't worry! 🙂
    Non è una domanda banale, ma sapere ESATTAMENTE come Google riesca a rilevare gli schemi di scambio link non è ovviamente dato saperlo.

    Al momento, non senza fatica visto il mio remotissimo background matematico, sto leggendo il paper "[url=http://dbpubs.stanford.edu:8090/pub/showDoc.Fulltext?lang=en&doc=2005-33&format=pdf&compression=&name=2005-33.pdf]Link Spam Detection Based on Mass Estimation" che dà delle indicazioni su come sia possibile algoritmicamente scovare tecniche anche complesse di mistificazione della link popularity (anche in assenza di scambio diretto/indiretto).

    Volgarmente parlando, potrebbe essere semplice analizzando la 'storia' dei link, o la vicinanza dei nodi ("sito che linka a..."), o seguendo il movimento dello spider che seguendo i link ritorna al sito di partenza.

    Cordialmente,
    Stuart


  • Super User

    @Stuart said:

    Non è una domanda banale, ma sapere ESATTAMENTE come Google riesca a rilevare gli schemi di scambio link non è ovviamente dato saperlo.
    Sì, ovvio. Intendevo chiederti: "Quali indizi hai per ritenere che..." ecc.

    Ad ogni modo, direi che la spiegazione matematica di Vigna lascia poco spazio a dubbi... Anche le altre ipotesi da te appena suggerite mi sembrano assolutamente plausibili.

    Esaustivo e convincente come sempre. 😉


  • Super User

    @Serp said:

    Di sicuro fa questo:

    • Controlla che il titolo della pagina contenga "404" e l'intestazione HTTP abbia status 404. (test falso=allarme)
    • Richiede dal tuo server un file nominato in maniera random (Esempio: 1f5d1s1s4145fd5.htm)
      Così ottiene molte informazioni necessarie per certificare a se, la bonta o disonestà della pagina di errore.
      Mi sembrano test insufficienti a determinare se una pagina di errore 404 personalizzata è "disonesta" (qualsiasi cosa tu voglia intendere con questo termine)...

    Perdona il mio scetticismo ma, davvero, proprio non capisco per quale motivo Google dovrebbe penalizzare un sito per i contenuti di una pagina che non verrà mai indicizzata.

    Per come la vedo io, un webmaster deve essere libero di mettere quello che più gli aggrada su una pagina di errore 404 ([url=http://www.plinko.net/404/area404.asp]qui ce n'è di parecchio divertenti, e [url=http://www.useit.com/alertbox/20010624.html]qui e [url=http://www.alistapart.com/articles/perfect404/]qui ci sono ottimi consigli su come renderle più utili agli utenti), senza bisogno di preoccuparsi dei motori di ricerca (a loro deve bastare e avanzare l'header 404). Una custom 404 page non potrà mai esser considerata spam, perchè non è spam. IMHO.

    Posto che non è nemmeno classificabile come cloaking (uno spider vede lo stesso identico contenuto che vedono gli utenti, HTTP header compresi), mi riesce molto difficile anche immaginare un modo per usare una pagina del genere per fini di spamming... Ma questo magari me lo potete suggerire voi. 😉

    Io adesso però vado a letto. Cia'


  • Super User

    @ArkaneFactors said:

    Perdona il mio scetticismo ma, davvero, proprio non capisco per quale motivo Google dovrebbe penalizzare un sito per i contenuti di una pagina che non verrà mai indicizzata.
    Infatti. Secondo me non è spam.
    Google punisce chi spamma perchè gli 'sporca' l'archivio, ma se una pagina, disonesta quanto vuoi, nell'indice non ci entra proprio, Page&Brin non hanno proprio nulla da lamentare...

    That's all folks... g.night 🙂

    Cordialmente,
    Stuart