<?xml version="1.0" encoding="UTF-8"?><rss xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:atom="http://www.w3.org/2005/Atom" version="2.0"><channel><title><![CDATA[file robots.txt lo spazio ci va?]]></title><description><![CDATA[<p dir="auto">Ciao,</p>
<p dir="auto">Scusate la domanda per molti ovvia ma devo creare il file robots.txt per il mio sito e avrei 2 domandine semplici semplici:</p>
<ol>
<li>vorrei escludere la visualizzazione della pagina "super home.htm". Devo scrivere:</li>
</ol>
<p dir="auto">Disallow: /super home.htm</p>
<p dir="auto">Oppure</p>
<p dir="auto">Disallow: /super%20home.htm ?</p>
<ol start="2">
<li>dopo l'elenco delle varie pagine o file o cartelle "disallowate" devo inserire un'istruzione per dire di procedere alla lettura di tutto il resto del contenuto del sito o no? Se si, qualcuno saprebbe indicarmi la sintassi per favore?</li>
</ol>
<p dir="auto">Grazie,<br />
Paolo.</p>
]]></description><link>https://connect.gt/topic/812/file-robots-txt-lo-spazio-ci-va</link><generator>RSS for Node</generator><lastBuildDate>Sat, 18 Apr 2026 07:56:39 GMT</lastBuildDate><atom:link href="https://connect.gt/topic/812.rss" rel="self" type="application/rss+xml"/><pubDate>Fri, 22 Apr 2005 12:58:48 GMT</pubDate><ttl>60</ttl><item><title><![CDATA[Reply to file robots.txt lo spazio ci va? on Sat, 23 Apr 2005 07:05:42 GMT]]></title><description><![CDATA[<p dir="auto">Lucas Grazie mille!!!</p>
<p dir="auto">Sei stato molto gentile!!<br />
Provvederò a modificare tutti i nomi file e pagine, visto che non voglio rischiare!!!</p>
<p dir="auto">Buon weekend.</p>
<p dir="auto">Paolo.</p>
]]></description><link>https://connect.gt/post/250160</link><guid isPermaLink="true">https://connect.gt/post/250160</guid><dc:creator><![CDATA[i2m4y]]></dc:creator><pubDate>Sat, 23 Apr 2005 07:05:42 GMT</pubDate></item><item><title><![CDATA[Reply to file robots.txt lo spazio ci va? on Sat, 23 Apr 2005 06:52:45 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="https://connect.gt/uid/162">@i2m4y</a> said:</p>
<blockquote>
<p dir="auto">Disallow: /super home.htm<br />
Oppure<br />
Disallow: /super%20home.htm<br />
Credo che secondo le specifiche del w3 sul file robots.txt non sia accettato mettere spazi tra le parole. Perciò sembra corretta la seconda opzione.</p>
</blockquote>
<p dir="auto">Provando a validare il robots.txt ottengo questo errore: <em>You can't put more than one path in one line. You have to create multiple "Disallow" lines. If a file/directory name contains white spaces, substitute each space with "%20" (Example: /customer%20service.html).</em></p>
<p dir="auto">Ho fatto un po di ricerche... Da [url=http://www.google.it/search?num=100&amp;hl=it&amp;c2coff=1&amp;q=site%<a href="http://3Aquery.nytimes.com" rel="nofollow ugc">3Aquery.nytimes.com</a>%2Fgst%2Fnytstore.html&amp;btnG=Cerca&amp;meta=]questa ricerca risultano presenti nel database di google numerosi url con il "%20" all'interno. Perciò è probabile che lo spider converta automaticamente lo spazio bianco con il %20 (come fa la maggioranza dei browser).</p>
<p dir="auto">Ricorda che <strong>è considerato scorretto</strong> utilizzare url che contengono spazi vuoti (vedi la RFC 1738 che riguarda gli url).</p>
<p dir="auto">In ogni caso, per sicurezza, si potrebbe fare un test comunque. <img src="https://connect.gt/plugins/nodebb-plugin-emoji/emoji/android/1f642.png?v=4as8rolt52f" class="not-responsive emoji emoji-android emoji--slightly_smiling_face" title=":)" alt="🙂" /></p>
<blockquote>
<ol start="2">
<li>dopo l'elenco delle varie pagine o file o cartelle "disallowate" devo inserire un'istruzione per dire di procedere alla lettura di tutto il resto del contenuto del sito o no?<br />
No.<br />
Più che altro è possibile che lasciando lo spazio bianco tra le due parole lo spider consideri il file robots.txt come mal scritto e non lo consideri del tutto.</li>
</ol>
</blockquote>
<p dir="auto">Lucas <img src="https://connect.gt/plugins/nodebb-plugin-emoji/emoji/android/1f642.png?v=4as8rolt52f" class="not-responsive emoji emoji-android emoji--slightly_smiling_face" title=":)" alt="🙂" /></p>
]]></description><link>https://connect.gt/post/250168</link><guid isPermaLink="true">https://connect.gt/post/250168</guid><dc:creator><![CDATA[lucas]]></dc:creator><pubDate>Sat, 23 Apr 2005 06:52:45 GMT</pubDate></item><item><title><![CDATA[Reply to file robots.txt lo spazio ci va? on Fri, 22 Apr 2005 21:11:22 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="https://connect.gt/uid/162">@i2m4y</a> said:</p>
<blockquote>
<p dir="auto">Grazie Giorgio, dopo il weekend testerò.</p>
<p dir="auto">Paolo</p>
</blockquote>
<p dir="auto">Ok Paolo tienici aggiornati <img src="https://connect.gt/plugins/nodebb-plugin-emoji/emoji/android/1f609.png?v=4as8rolt52f" class="not-responsive emoji emoji-android emoji--wink" title=";)" alt="😉" /></p>
]]></description><link>https://connect.gt/post/250159</link><guid isPermaLink="true">https://connect.gt/post/250159</guid><dc:creator><![CDATA[giorgiotave]]></dc:creator><pubDate>Fri, 22 Apr 2005 21:11:22 GMT</pubDate></item><item><title><![CDATA[Reply to file robots.txt lo spazio ci va? on Fri, 22 Apr 2005 20:54:48 GMT]]></title><description><![CDATA[<p dir="auto">Grazie Giorgio, dopo il weekend testerò.</p>
<p dir="auto">Paolo</p>
]]></description><link>https://connect.gt/post/250165</link><guid isPermaLink="true">https://connect.gt/post/250165</guid><dc:creator><![CDATA[i2m4y]]></dc:creator><pubDate>Fri, 22 Apr 2005 20:54:48 GMT</pubDate></item><item><title><![CDATA[Reply to file robots.txt lo spazio ci va? on Fri, 22 Apr 2005 19:45:21 GMT]]></title><description><![CDATA[<p dir="auto">Qua mi sa che dobbiamo fare dei test paolo</p>
<p dir="auto">Basta creare questi file swf anche vuoti e poi metterli nel robot. I file non ti servono e vediamo che fa lo spider.</p>
]]></description><link>https://connect.gt/post/250158</link><guid isPermaLink="true">https://connect.gt/post/250158</guid><dc:creator><![CDATA[giorgiotave]]></dc:creator><pubDate>Fri, 22 Apr 2005 19:45:21 GMT</pubDate></item><item><title><![CDATA[Reply to file robots.txt lo spazio ci va? on Fri, 22 Apr 2005 13:47:33 GMT]]></title><description><![CDATA[<p dir="auto">In verità non si tratta di sole pagine contenenti lo spazio, ma anche di una trentina di file .swf che non voglio far aspirare.</p>
<p dir="auto">E' lunga modificarli tutti e ricaricarli, piuttosto li lascerei aspirare!</p>
<p dir="auto"><img src="https://connect.gt/plugins/nodebb-plugin-emoji/emoji/customizations/f71a0c43-865f-4388-9868-8b387eebeeb1-mmmm.gif?v=4as8rolt52f" class="not-responsive emoji emoji-customizations emoji--mmm" title=":?" alt=":mmm:" /></p>
]]></description><link>https://connect.gt/post/250162</link><guid isPermaLink="true">https://connect.gt/post/250162</guid><dc:creator><![CDATA[i2m4y]]></dc:creator><pubDate>Fri, 22 Apr 2005 13:47:33 GMT</pubDate></item><item><title><![CDATA[Reply to file robots.txt lo spazio ci va? on Fri, 22 Apr 2005 13:03:31 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="https://connect.gt/uid/162">@i2m4y</a> said:</p>
<blockquote>
<p dir="auto">Ciao,</p>
<p dir="auto">Scusate la domanda per molti ovvia ma devo creare il file robots.txt per il mio sito e avrei 2 domandine semplici semplici:</p>
<ol>
<li>vorrei escludere la visualizzazione della pagina "super home.htm". Devo scrivere:</li>
</ol>
<p dir="auto">Disallow: /super home.htm</p>
<p dir="auto">Oppure</p>
<p dir="auto">Disallow: /super%20home.htm ?</p>
<ol start="2">
<li>dopo l'elenco delle varie pagine o file o cartelle "disallowate" devo inserire un'istruzione per dire di procedere alla lettura di tutto il resto del contenuto del sito o no? Se si, qualcuno saprebbe indicarmi la sintassi per favore?</li>
</ol>
<p dir="auto">Grazie,<br />
Paolo.</p>
</blockquote>
<p dir="auto">non puoi rinominare la pag in super-home o super_home?</p>
]]></description><link>https://connect.gt/post/250161</link><guid isPermaLink="true">https://connect.gt/post/250161</guid><dc:creator><![CDATA[and4linux]]></dc:creator><pubDate>Fri, 22 Apr 2005 13:03:31 GMT</pubDate></item></channel></rss>