Sitemap e robots

Ingrandisci il Font ingrandisci font | Riduci il Font riduci font | stampa documentosalva documento in pdf

Per quanto riguarda l'indicizzazione di un sito, è importate non scordari di creare due file

sitema.xml e robots.txt

Ecco come realizzare una sitemap.xml da inserire nella directory principale del sito:

<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.sitemaps.org/schemas/sitemap/0.9 http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd">
<!--
 created with Free Online Sitemap Generator www.xml-sitemaps.com 
-->
<url>
<loc>http://www.giovannafilingeri.it/</loc>
</url>
<url>
<loc>http://www.giovannafilingeri.it/form.php</loc>
</url>
<url>
<loc>http://www.giovannafilingeri.it/privacy.php</loc>
</url>
<url>
<loc>
http://www.giovannafilingeri.it/informativa_cookie.php
</loc>
</url>
<url>
<loc>http://www.giovannafilingeri.it/disclaimer.php</loc>
</url>
<url>
<loc>http://www.giovannafilingeri.it/errore.php</loc>
</url>
</urlset>

 

Ecco un sempio di file   robots.txt 

ecco contiene tutte le pagine e dircetori che NON desideri indicizzare ( ad esempio i file si sistema), nello scrivere il  tuo robots segui la seguente sintassi. tutte le cartelle da NON indicizzare vanno inserite tra due "/" mentre nei file lo "/" và solo all'inizio.

# Inserite in questa pagina SOLO file e cartelle che NON desiderate fare prelavare dai motori di ricerca.

User-agent: *
Disallow: /system/
Disallow: /errore404.php

sitemap: http://www.webmastertrapani.it/sitemap.xml

 

Se invece abbiamo creato delle sotto-cartelle o domini di terzo livello (sotto-domini) e non vogliamo indicizzare, scriveremo questa stringa nel nostro robots.txt

#Sottodominio non indicizzabile ai robots.

User-agent: *
Disallow: /